본문 바로가기

2019년 혁신성장 청년인재 집중양성(빅데이터)/집중양성과정 프로젝트 01

(20)

04. mysql과 python 연결하기 cmd 창에서 실행한다 pip install PyMYSQL 무슨 오류가 떴었는데, 기록하지 못했다. StackOverflow에서 해결하였다. import pymysql conn= pymysql.connect(host='121.67.246.230', port=3306, user='root', password='password',db='aisoft', charset='utf8') curs = conn.cursor() 1. pymysql를 임포트한다. 2. pymysql.connect()함수에 필요한 정보를 넣어준다. 3. 나는 먼저 우분투를 이용하여 MariaDB를 생성시켜 놓았다. 잘 모르겠지만, MariaDB를 연결 시키기 위해선 항상 이렇게 해놓아야 하는 것 같다. 4. 아 그리고, 내가 MariaDB..

3. 파이썬 신문사 이미지 크롤링 1. 전체 코드, 중앙일보 홈페이지를 크롤링 했다. from urllib.request import urlopen from bs4 import BeautifulSoup import pandas as pd import urllib.request import random html =urlopen("https://joongang.joins.com/") # urlopen으로 홈페이지와의 핸들을 만들고 bsObject = BeautifulSoup(html, "html.parser") # BeautifulSoup을 이용하여 핸들 html을 html.parser를 이용하여 수집한다. abe= bsObject.find_all("img") #수집된 bsObject에 fin_all함수를 적용하여 "img"태크를 모두 가져..

2. 파이썬 신문사 홈페이지 텍스트 크롤링 https://webnautes.tistory.com/779 파이썬 웹 크롤링(Web Crawling) 강좌 - 1. 웹페이지 긁어오기 Beautiful Soup를 사용하여 간단한 웹 크롤러를 만드는 방법을 다루고 있습니다. Python 3.6으로 코드를 작성하였습니다. 버전의 차이로 필요한 모듈이 달라질 수도 있습니다. 웹 크롤러(Web Crawler)는 웹문서,.. webnautes.tistory.com 이 분의 블로그를 보고 따라했다. 크롤링 주소만 다르고 동일하다. 1. 먼저 cmd창에서 BeautifulSoup4를 설치한다. ...더보기 pip install request BeautifulSoup4 # pip install BeautifulSoup4와 request의 차이가 무엇인지는 모르겠다...

1. 트위터에서 bitcoin 관련 트윗 크롤링[수집-저장] 비트코인 관련 트위터/신문기사의 감성분석 프로젝트이다. 1. 먼저 이곳에서 트위터 클로러를 받았다. 트위터 크롤링을 하기 위해서는 API를 이용하거나 직접 여러 사이트를 돌아다니며 수집을 할 수 있는데, 이 친절하신 분이 코드를 짜놨다. 트위터 API 계정도 신청 해놨다. 받는데 시간이 좀 걸릴 것 같다. https://github.com/taspinar/twitterscraper taspinar/twitterscraper Scrape Twitter for Tweets. Contribute to taspinar/twitterscraper development by creating an account on GitHub. github.com 2. READMME 파일에 자세한 사항이 적혀있다. ...더보기 S..

이전 1 2 3 다음

티스토리툴바