본문 바로가기

2019년 혁신성장 청년인재 집중양성(빅데이터)/[프로그래밍] R

(5)
[프로그래밍,2019/08/27] R 이제까지 했던 것 복습과 바플랏 1. 이름을 가져올 때는 names()를 쓴다. 슬라이싱을 할 떄는 h[c(1,0,1)] 요런 식으로 쿼리를 만든다. 비교 연산을 했을 때는 TRUE, FALSE를 가진 참 거짓 벡터가 산출된다. 그러므로 이것을 이용해서 벡터를 가져올 수 있다. 2. order()를 쓸 때 약간 햇갈릴 수도 있다. 오더는 그 윛에 해당하는 벡터 값을 가져온다. 3. which는 위치를 찾아서 슬라이싱을 하여주고, ==는 참 거짓을 통해 슬라이싱을 한다. 같은 결과를 만들지만, 다르다. 4. 인티저, 케릭터, 불린형이 벡터가 표현되는 형태다. 5. 데이터가 어떻게 처리되느냐... 어떻게 접근되느냐에 대해서 생각해야 한다. 6. R에서 paste를 쓰는 것처럼 엑셀에서는 &을 써서 문자를 붙여줄 수 있다. 7. paste에..
[프로그래밍 R][2019/08/26] 조건문, 데이터 가공 dplyr 1. 1-1. rm(list=ls())로 메모리에서 변수 제거하기. 1-2. dir()로 워킹디렉토리의 파일 확인 2. 3.readLines()로 파일 읽기. B. R의 함수(기본 내장함수, 패키지(외장) 함수 1. sort() 내장함수를 사용하면 오름차순(기본값) 내림차순으로 정렬할 수 있다. 2. 데이터 프레임을 정렬하기 위해서는 order() 이용해서 위치를 가르키는 벡터를 얻고 그 얻은 백터를 이용해서 데이터프레임[c(order()]를 적는다. 그러니까 order()를 이용하여 정렬 된 위치 값을 가지고 온 다음에, 해당 프레임을 슬라이싱 한다고 생각해주면 된다. 3. apply는 반복문을 대체한다. apply(행렬, 1 =행, 2=열, sum, mean.. 등) 4.apply, lapply(li..
[프로그래밍 2019/08/21] 데이터 프레임과 파일읽기 A. 복습 1. 리스트는 제너릭 벡터라고도 한다. 2. R은 문자열을 표시하는 경우가 아니라면 ""에 민감하지 않다. B. 데이터 프레임 1. 인덱싱 벡터 이름으로 데이터 프레임에서 ID라는 이름으로 인덱싱 하는 두가지 방법이다. 하나는 데이터 프레임 형태로 나오게 되고 dataframe_ex["ID"] ID 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 하나는 벡터 형태로 나오게 된다 > dataframe_ex$ID [1] 1 2 3 4 5 6 7 8 9 10 2. 구조 보기 2-1. str str(dataframe_ex) 'data.frame':10 obs. of 4 variables: $ ID : int 1 2 3 4 5 6 7 8 9 10 $ SEX : Factor w..
[프로그래밍] 20190820, R 데이터 종류() 1. 숫자는 1:100 으로 만들 수 있다. 문자 또한 만들 수 있다. Letters와 LETTES가 될 수 있다. 2. 백터를 슬라이싱 하는 방법이 다양하다! 참 거짓으로 슬라이싱이 가능하고, 위치로도 슬라이싱이 가능하다. 3. 규칙성이 있는 벡터를 만들 수 있다. B. 행렬 1. 행렬과 배열이 햇갈리 수 있지만 R에서 행렬과 배열은 다르다. 1.1 기본 값은 Column major 방식으로 들어간다. 일종의 사고 방식의 차이다. 1-2. t(matrix)로 전치행렬을 만들 수 있다. 2. dimnames로 list형식으로 행과 열의 이름을 정하여 넣을 수 있다. 2-2. 행렬 또한 벡터의 모임이기 때문에 순서가 중요하다는 것을 인지해야 한다. > x["R1","c3"] [1] 7 > x[,"c3"] ..
2019/08/13 R 1 1. 기본적인 데이터 타입에 대해서 공부함. 2. R과 대화하기 2-1. is.atomic, is.vector : 벡터는 아토믹하다. 원자적이다. 3. 행렬은 2차원이다. 행렬이 모여 있는 것을 배열이라고 한다. 3-1. 다양한 타입의 데이터를 모아 놓은 것이 데이터 프레임이다. 3-3. 4. 숫자형 벡터의 생성은 다음과 같다. 4-2. R에서는 리스트의 원소에 대하여 연산을 하면 반복문 없이 모든 원소에 캐스팅 된다. 4-3. 리스트에 여러가지 타입의 원소가 들어가 있을 때, 문자열이 있다면 모두 문자로 변형된다. TRUE라는 불린형 타입도, "TRUE"가 된다. 5. C는 Concatnate로 벡터를 만드는 함수이다. 6. 벡터는 순서가 중요함. R 7. 파이썬에서 range(100)은 R에서 x