본문 바로가기

2019년 혁신성장 청년인재 집중양성(빅데이터)/[프로그래밍] R

[프로그래밍,2019/08/27] R 이제까지 했던 것 복습과 바플랏

1. 이름을 가져올 때는 names()를 쓴다. 슬라이싱을 할 떄는 h[c(1,0,1)] 요런 식으로 쿼리를 만든다. 비교 연산을 했을 때는 TRUE, FALSE를 가진 참 거짓 벡터가 산출된다. 그러므로 이것을 이용해서 벡터를 가져올 수 있다. 

 

 

2. order()를 쓸 때 약간 햇갈릴 수도 있다. 오더는 그 윛에 해당하는 벡터 값을 가져온다.

 

 

3. which는 위치를 찾아서 슬라이싱을 하여주고, ==는 참 거짓을 통해 슬라이싱을 한다. 같은 결과를 만들지만, 다르다.

 

 

 

4. 인티저, 케릭터, 불린형이 벡터가 표현되는 형태다. 

 

 

5. 데이터가 어떻게 처리되느냐... 어떻게 접근되느냐에 대해서 생각해야 한다.

 

6.  R에서 paste를 쓰는 것처럼 엑셀에서는 &을 써서 문자를 붙여줄 수 있다.

 

 

 

7. paste에서 collpase라는 옵션을 활용해서, 요소들을 합쳐 한 단어로 만들 수도 있다. 모르면 ?help를 칠 것.

 

 

8. 정규 표현식을 이용한 grep() 함수 사용법

 

. 문자 1개의 문자와 일치한다. 단일행 모드에서는 새줄 문자를 제외한다.
[ ] 문자 클래스 "["과 "]" 사이의 문자 중 하나를 선택한다. "¦"를 여러 개 쓴 것과 같은 의미이다. 예를 들면 [abc]d는 ad, bd, cd를 뜻한다. 또한, "-" 기호와 함께 쓰면 범위를 지정할 수 있다. "[a-z]"는 a부터 z까지 중 하나, "[1-9]"는 1부터 9까지 중의 하나를 의미한다.
[^ ] 부정 문자 클래스 안의 문자를 제외한 나머지를 선택한다. 예를 들면 [^abc]d는 ad, bd, cd는 포함하지 않고 ed, fd 등을 포함한다. [^a-z]는 알파벳 소문자로 시작하지 않는 모든 문자를 의미한다.
^ 처음 문자열이나 행의 처음을 의미한다.
$ 문자열이나 행의 끝을 의미한다.
( ) 하위식 여러 식을 하나로 묶을 수 있다. "abc¦adc"와 "a(b¦d)c"는 같은 의미를 가진다.
\n 일치하는 n번째 패턴 일치하는 패턴들 중 n번째를 선택하며, 여기에서 n은 1에서 9 중 하나가 올 수 있다.
* 0회 이상 0개 이상의 문자를 포함한다. "a*b"는 "b", "ab", "aab", "aaab"를 포함한다.
{m, n} m회 이상 n회 이하 "a{1,3}b"는 "ab", "aab", "aaab"를 포함하지만, "b"나 "aaaab"는 포함하지 않는다.

9. apply, lapply, sapply의 비교

 

 

 

 

B

 

 

1. 함수를 선언할 때,  꼭 가로를 쓰지 않아도 된다. 값을 전달 해주기 위해서는 객체가 필요한 것이다. 그러니 정의를 해서 인스턴스화 시킨다음에 넘겨 주던가, function(y) 를 써서 객체화 시켜 주던가. 

 

 

 

 

2.

 

 

 

hist()

 

 

barplot()

3. % 하나를 그려주기 위해서도 paste라는 과정이 필요하다.... 이런건 저장 해놓고 쓰는 것이 가장 좋겠다...