- 테이블 요소
위와 같은 테이블을 “집합자료” 라 부름
한 개 값을 지칭할 때 어떤 것을 기준으로 보느냐에 따라 변수 값이라 부르기도 하고 관측 값이라 부르기도 함
- 테이블 종류
데이터가 숫자인지 아닌지에 따라서 범주형과 수치형으로 나눔
- 수치형 데이터 - 이산형 데이터
- 가장 큰 특징은 셀 수 있다는 것. 정수로만 쓰임
- 연속형 데이터와 구분되어야 하는데 이 값들은 서로 독립적이고 이어져 있지 않음
- 수치형 데이터 - 연속형 데이터
- 가장 큰 특징은 변수 값이 연속적인 수치라는 것
- 범주형 데이터 - 명목형 데이터
- 숫자가 아니라 문자로 나타내지는 변수 값
- 범주형 데이터 - 순서형 데이터
- 명목형 데이터와 비슷하지만 순서가 있다는 점과 다름
- R에서의 4가지 벡터
- numeric
- 연속형 변수는 numeric타입을 사용함
- numeric은 실수까지 표현 가능한 데이터 타입
- integer
- integer는 정수 값을 표현하는 데이터 타입
- 이산형 변수에서 사용
- factor
- fator는 순서형 변수와 명목형 변수를 모두 나타냄
- 카테고리형 변수를 표현하는 데이터 타입
- character
- character는 문자열을 나타내는 데이터 타입
- numeric
- 데이터 프레임 다루기
- 벡터 만들기
a1 <- c(5,3,6,3,1) a1 => [1] 5 3 6 3 1
- 벡터 데이터형 확인
is(a1) => [1] "numeric" "vector"
- 숫자 뒤에 L을 붙이면 numeric이 아니라 integer가 됨
a1 <- c(1L,2L,3L)
- 연속형 변수는 실수 값을 넣으면 됨
b <- c(1,23,6.63452, 4.34234) b => [1] 1.23000 6.63452 4.34234 is(b) => [1] "numeric" "vector"
- 문자열 벡터 만들기
a2 <- c("짬뽕", "짜장면", "짬뽕", "짬뽕", "짜장면") a2 => [1] "짬뽕" "짜장면" "짬뽕" "짬뽕" "짜장면"
- 숫자와 문자를 같이 넣으면?
a3 <- c(7,3,7,5,2,"짜장면") a3 => [1] "7" "3" "7" "5" "2" "짜장면" is(a3) => [1] "character" "vector"
- 명목형 변수 만들기
Levels 에 명목형 변수의 종류를 표시해둠a2 <- as.factor(a2) a2 => [1] 짬뽕 짜장면 짬뽕 짬뽕 짜장면 Levels: 짜장면 짬뽕
- 순서형 변수 만들기
비교연산자가 추가되어 순서를 나타냄a2 <- factor(a2, ordered=T) a2 => [1] 짬뽕 짜장면 짬뽕 짬뽕 짜장면 Levels: 짜장면 < 짬뽕
- 연속형 변수를 벡터로 만들기
원하는 변수명으로 변경a1 <- c(5,3,6,3,1) a2 <- c("짬뽕", "짜장면", "짬뽕", "짬뽕", "짜장면") a3 <- c(3.62, 5.45, 2.54, 3.67, 7.23) DF <- data.frame(a1,a2,a3) DF
'개발 개념 > 이론' 카테고리의 다른 글
[개발 개념] Node.js 란, React를 사용해야하는 이유 (0) | 2022.04.07 |
---|---|
[개발개념] JWT와 AXIOS, SPRING SECURITY 기본개념 (0) | 2022.04.02 |
[R] R 언어 기본 (0) | 2022.03.11 |
[개발 개념] 스프링 프레임워크 이해 (0) | 2022.03.08 |
[개발 개념] VMware Ubuntu 20.04 MariaDB 10.7 다운로드 (0) | 2022.03.08 |
댓글