[프로그래밍,2019/08/27] R 이제까지 했던 것 복습과 바플랏

1. 이름을 가져올 때는 names()를 쓴다. 슬라이싱을 할 떄는 h[c(1,0,1)] 요런 식으로 쿼리를 만든다. 비교 연산을 했을 때는 TRUE, FALSE를 가진 참 거짓 벡터가 산출된다. 그러므로 이것을 이용해서 벡터를 가져올 수 있다.

2. order()를 쓸 때 약간 햇갈릴 수도 있다. 오더는 그 윛에 해당하는 벡터 값을 가져온다.

3. which는 위치를 찾아서 슬라이싱을 하여주고, ==는 참 거짓을 통해 슬라이싱을 한다. 같은 결과를 만들지만, 다르다.

4. 인티저, 케릭터, 불린형이 벡터가 표현되는 형태다.

5. 데이터가 어떻게 처리되느냐... 어떻게 접근되느냐에 대해서 생각해야 한다.

6. R에서 paste를 쓰는 것처럼 엑셀에서는 &을 써서 문자를 붙여줄 수 있다.

7. paste에서 collpase라는 옵션을 활용해서, 요소들을 합쳐 한 단어로 만들 수도 있다. 모르면 ?help를 칠 것.

8. 정규 표현식을 이용한 grep() 함수 사용법

.	문자	1개의 문자와 일치한다. 단일행 모드에서는 새줄 문자를 제외한다.
[ ]	문자 클래스	"["과 "]" 사이의 문자 중 하나를 선택한다. "¦"를 여러 개 쓴 것과 같은 의미이다. 예를 들면 [abc]d는 ad, bd, cd를 뜻한다. 또한, "-" 기호와 함께 쓰면 범위를 지정할 수 있다. "[a-z]"는 a부터 z까지 중 하나, "[1-9]"는 1부터 9까지 중의 하나를 의미한다.
[^ ]	부정	문자 클래스 안의 문자를 제외한 나머지를 선택한다. 예를 들면 [^abc]d는 ad, bd, cd는 포함하지 않고 ed, fd 등을 포함한다. [^a-z]는 알파벳 소문자로 시작하지 않는 모든 문자를 의미한다.
^	처음	문자열이나 행의 처음을 의미한다.
$	끝	문자열이나 행의 끝을 의미한다.
( )	하위식	여러 식을 하나로 묶을 수 있다. "abc¦adc"와 "a(b¦d)c"는 같은 의미를 가진다.
\n	일치하는 n번째 패턴	일치하는 패턴들 중 n번째를 선택하며, 여기에서 n은 1에서 9 중 하나가 올 수 있다.
*	0회 이상	0개 이상의 문자를 포함한다. "a*b"는 "b", "ab", "aab", "aaab"를 포함한다.
{m, n}	m회 이상 n회 이하	"a{1,3}b"는 "ab", "aab", "aaab"를 포함하지만, "b"나 "aaaab"는 포함하지 않는다.

9. apply, lapply, sapply의 비교

1. 함수를 선언할 때, 꼭 가로를 쓰지 않아도 된다. 값을 전달 해주기 위해서는 객체가 필요한 것이다. 그러니 정의를 해서 인스턴스화 시킨다음에 넘겨 주던가, function(y) 를 써서 객체화 시켜 주던가.

hist()

barplot()

3. % 하나를 그려주기 위해서도 paste라는 과정이 필요하다.... 이런건 저장 해놓고 쓰는 것이 가장 좋겠다...

노루의 발자국