1. 기본적인 데이터 타입에 대해서 공부함.
2. R과 대화하기
2-1. is.atomic, is.vector : 벡터는 아토믹하다. 원자적이다.
3. 행렬은 2차원이다. 행렬이 모여 있는 것을 배열이라고 한다.
3-1. 다양한 타입의 데이터를 모아 놓은 것이 데이터 프레임이다.
3-3.
4. 숫자형 벡터의 생성은 다음과 같다.
4-2. R에서는 리스트의 원소에 대하여 연산을 하면 반복문 없이 모든 원소에 캐스팅 된다.
4-3. 리스트에 여러가지 타입의 원소가 들어가 있을 때, 문자열이 있다면 모두 문자로 변형된다.
TRUE라는 불린형 타입도, "TRUE"가 된다.
5. C는 Concatnate로 벡터를 만드는 함수이다.
6. 벡터는 순서가 중요함. R
7. 파이썬에서 range(100)은 R에서 x<-0:99다.
8. sum(x), mean(x), var(x), sd(x) 내장 함수가 있다.
9. 벡터에 결측치 NA(Not avaliable)이 있으면 계산이 되지 않는다.
10. x <- 1:10, temp = x[3:6]과 같이 엔덱싱할 수 있다.
10-1. x[c(1,3,5)]과 같이 뽑아 낼 수 있다. 벡터의 연산을 생각할 것.
11. x[x>13] R에는 반복의 정신이 있다.
12. R은 사전처리에 특화되어 있다.
13. NA는 위치는 있지만 NULL은 위치조차 없음. NULL은 존재 자체를 없앨 때 사용한다.
14. names(height) <- c("KIM", "PARK", "LEE")로 벡터의 원소에 이름을 지어줄 수 있다.
14-2. 언뜻보면 리스트안의 원소 하나를 가지는 딕셔너리가 원소로 있는 것처럼 보이지만, names는 R의 벡터에서 하나의 행(로우)이다. names를 지우면 전체 삭제가 가능하기 때문에, 이 names는 판다스 데이터프레임의 인덱스나, 시리즈로 보면 될 듯 하다.
총평 : 파이썬의 개성도 다른 프로그래밍 언어와 다분히 다르지만, R 또한 개성이 뛰어나다. 하지만 프로그래밍적 성격 보다는 계산기적인 성격이 더 강한 것 같다. 추가적인 처리 없이 기본 단위를 벡터로 다룸으로써, 데이터 처리가 직관적이다. 물론 파이썬 또한 넘파이와 판다스를 기반으로 그런 처리가 가능하게 되었지만 말이다.
'2019년 혁신성장 청년인재 집중양성(빅데이터) > [프로그래밍] R' 카테고리의 다른 글
[프로그래밍,2019/08/27] R 이제까지 했던 것 복습과 바플랏 (0) | 2019.08.27 |
---|---|
[프로그래밍 R][2019/08/26] 조건문, 데이터 가공 dplyr (0) | 2019.08.26 |
[프로그래밍 2019/08/21] 데이터 프레임과 파일읽기 (0) | 2019.08.21 |
[프로그래밍] 20190820, R 데이터 종류() (0) | 2019.08.20 |