카테고리 없음

[프로그래밍R] 2019/08/28 실제 데이터를 활용하여 분석하기

jhnoru 2019. 8. 28. 16:58

A.

 

 

1. dplyr의 join 이용해보기

 

 

2. 빈도수를 뽑을 때, summary는 뽑을 수 없지만  freq()와 table은 빈도수를 벡터로나 행렬, 테이블로 만들 수 있다.

 

3. 그래프를 저장할 때는 savePlot()을 사용한다. RGUI에서는 되는데 Rstudio에서는 되지 않는다.

 

4. 아주 길게 상세하게 쓰면 만들 수 있는 것들이 많다. 신기한 것은 범례가 플랏에 종속되는 것이 아니라 범례가 그래프 위에 올려지는 것이라는 것이다.

 

 

5. dotchart를 이용하여 x, y좌표의 값으로 표를 그릴 수 있다.

 

b

B. ggplot2, 틀을 만들고 ! 넣고 싶은 것을 올린다.

 

1. ggplot은 대단히 계층적이다. 쌓고 쌓고 만들고 싶은 곳에 만들면 된다. 엄청 쉽다.

 

 

 

C. 워드 클라우딩

 

1. 데이터를 가져오는 법

 

1) 기존 데이터, 2, 공공 API, 네이버 API(데이터를 주고 받는 인터페이스) 3)웹크롤링(스크랩핑굳이 따지자면 스크랩을 직접 긁어오는거라면 크로링은 자동화라는 개념이 들어가 있다.)

 

 

2. Konlp 설치시 에러가 나는데 여기서

워킹 디렉토리와 환경 설정은 다르다. 환경 변수는 어떤 프로그램이 다른 프로그램을 이용하거나 동기화할 때 서로의 싱크를 맞춰주는 것이다. 워킹 디렉토리는 작업대라면, 작업대 근처의 장비들을 이용할 수 있도록 제대로된 환경 설정을 해주어야 한다.

 

setwd, getwd와 마찬가지로 set_env, get_env등으로 확인을 할 수 있다.

 

환경변수도 설정이 사용자의 환경변수와 시스템의 환경변수가 있는데, 그 개인용과/단체용이라고 생각하면 된다.

 

 

3.

wordcloud설치시 KoNLP를 설치해야하는데 오류가 계속 났다. 나의 경우에는 64비트로 진행해야 하는 상황에서, 32비트와 이어진 Rstudio로 해서 패키지 설치지 오류가 계속 일어났다. 꼭 비트수를 확인해 주어야 한다. 또 어쩔 때는 RGUI에서는 되지만 Rstudio에서 안되는 경우도 있었다.

 

wordcloud 와 wordcloud2가 있는데 wordcloud2가 경우에 따라서는 훨씬 편한 것 같다. 테이블만 입력해도 되며, 또 포트도 윈도우에 적용된 폰트가 적용디 된다.

 

예제

 

 

 

4.

 

노선 아이디를 찾고

 

 

 

 

++++

웹크롤링은 rvest를 쓴다. !시간이 없어서 네이버 API를 이용하는 것과 rvest를 이용하자!