1. 이름을 가져올 때는 names()를 쓴다. 슬라이싱을 할 떄는 h[c(1,0,1)] 요런 식으로 쿼리를 만든다. 비교 연산을 했을 때는 TRUE, FALSE를 가진 참 거짓 벡터가 산출된다. 그러므로 이것을 이용해서 벡터를 가져올 수 있다.
2. order()를 쓸 때 약간 햇갈릴 수도 있다. 오더는 그 윛에 해당하는 벡터 값을 가져온다.
3. which는 위치를 찾아서 슬라이싱을 하여주고, ==는 참 거짓을 통해 슬라이싱을 한다. 같은 결과를 만들지만, 다르다.
4. 인티저, 케릭터, 불린형이 벡터가 표현되는 형태다.
5. 데이터가 어떻게 처리되느냐... 어떻게 접근되느냐에 대해서 생각해야 한다.
6. R에서 paste를 쓰는 것처럼 엑셀에서는 &을 써서 문자를 붙여줄 수 있다.
7. paste에서 collpase라는 옵션을 활용해서, 요소들을 합쳐 한 단어로 만들 수도 있다. 모르면 ?help를 칠 것.
8. 정규 표현식을 이용한 grep() 함수 사용법
. | 문자 | 1개의 문자와 일치한다. 단일행 모드에서는 새줄 문자를 제외한다. |
[ ] | 문자 클래스 | "["과 "]" 사이의 문자 중 하나를 선택한다. "¦"를 여러 개 쓴 것과 같은 의미이다. 예를 들면 [abc]d는 ad, bd, cd를 뜻한다. 또한, "-" 기호와 함께 쓰면 범위를 지정할 수 있다. "[a-z]"는 a부터 z까지 중 하나, "[1-9]"는 1부터 9까지 중의 하나를 의미한다. |
[^ ] | 부정 | 문자 클래스 안의 문자를 제외한 나머지를 선택한다. 예를 들면 [^abc]d는 ad, bd, cd는 포함하지 않고 ed, fd 등을 포함한다. [^a-z]는 알파벳 소문자로 시작하지 않는 모든 문자를 의미한다. |
^ | 처음 | 문자열이나 행의 처음을 의미한다. |
$ | 끝 | 문자열이나 행의 끝을 의미한다. |
( ) | 하위식 | 여러 식을 하나로 묶을 수 있다. "abc¦adc"와 "a(b¦d)c"는 같은 의미를 가진다. |
\n | 일치하는 n번째 패턴 | 일치하는 패턴들 중 n번째를 선택하며, 여기에서 n은 1에서 9 중 하나가 올 수 있다. |
* | 0회 이상 | 0개 이상의 문자를 포함한다. "a*b"는 "b", "ab", "aab", "aaab"를 포함한다. |
{m, n} | m회 이상 n회 이하 | "a{1,3}b"는 "ab", "aab", "aaab"를 포함하지만, "b"나 "aaaab"는 포함하지 않는다. |
9. apply, lapply, sapply의 비교
B
1. 함수를 선언할 때, 꼭 가로를 쓰지 않아도 된다. 값을 전달 해주기 위해서는 객체가 필요한 것이다. 그러니 정의를 해서 인스턴스화 시킨다음에 넘겨 주던가, function(y) 를 써서 객체화 시켜 주던가.
2.
hist()
barplot()
3. % 하나를 그려주기 위해서도 paste라는 과정이 필요하다.... 이런건 저장 해놓고 쓰는 것이 가장 좋겠다...
'2019년 혁신성장 청년인재 집중양성(빅데이터) > [프로그래밍] R' 카테고리의 다른 글
[프로그래밍 R][2019/08/26] 조건문, 데이터 가공 dplyr (0) | 2019.08.26 |
---|---|
[프로그래밍 2019/08/21] 데이터 프레임과 파일읽기 (0) | 2019.08.21 |
[프로그래밍] 20190820, R 데이터 종류() (0) | 2019.08.20 |
2019/08/13 R 1 (0) | 2019.08.13 |