2019년 혁신성장 청년인재 집중양성(빅데이터)/PYTHON 공부 - PY4E (16) 썸네일형 리스트형 PY4E - Chapter 13 Web SOA and Service GeoJSON (3) Part 1 SOA 1. SOA :Service Oriented Approach 2. 서비스 기반 접근을 사용하는 경우는 하나의 시스템 내에 모든 정보가 저장되어 있지 않은 경우이다. 3. 왜냐하면 어떤 어플리케이션은 모든 데이터를 담지 못하기 때문이다. 4. 예를 들어 여행예약회사는 차를 빌리거나 표를 사거나 등등 할 수 있지만 여행예약회사가 실제로 하는 것은 웹상의 서비스를 연결 해주는 것일 뿐이다. 5. 특정부분만 때어서 다른 시스템에 넣고 싶다! 이럴려면 규칙이 필요하다. 6. 각 어플리케이션의 정보가 서비스로 제공되어서 다른 어플리케이션의 그 정보를 사용하고 또 다른 정보를 만들어 낸다. 7.서비스 지향 프로그램이 시스템간 호환 가능한 구조르 발전했을 떄, 정보 공유의 기회를 나라와 나라 간에도.. PY4E - Chapter 13 Web Service JSON (2) 1. XML 보다는 JSON 을 많이 볼 것이다. 2. XML 체계적이고 기능이 풍부하다는 장점이 있다. 3. 그에 반해 JSON 은 데이터를 시스템에서 추출하여 두 시스템 사이에서 간단하게 이동할 수 있게 한다. 4. JSON 발명이 아닌 자바스크립트에서의 발견이다. 자바스크립트이 문법에서 비롯되었기 때문이다. 5. RFC와 달리 JSON은 국제 표준이 아니다. 6.J SON의 특징은 XML보다 표현이 더 간단하다는 것이다. 7. 파이썬에서는 모든 데이터를 딕셔너리, 리스트, 딕셔너리 중첩, 리스트를 포함한 딕셔너리, 딕셔너리를 포함한 리스트 형태로 반환한다. 8. XML의 복잡함이 필요없는 상황에서는 JSON이 낫다. 9. 자바스크립트의 문장이지만 파이썬과 아주 유사하다. 10. 구조가 비슷하기에 구.. PY4E - Chapter 12 Unicode and UTF-8 in Python (3) 1. 웹스크리핑은 웹으로부터 링크를 추출하고 추출한 링크들을 차례로 처리하는 작업 2. 수집된 데이터는 다양한 용도로 사용이 가능하다. 3. 다만 모든 웹사이트가 로봇에 의해서 스크래핑을 당하고 싶은 것은 아니다. 4. 몇몇 웹사이트는 로그인을 하게 하여, 기록을 남게 하기도 하며, 계정을 닫아버리기도 한다. 5. 로그인을 안하더라도, 주소를 닫아버릴 수도 있다. 6. HTML 파싱은 어렵다. 7. 실제 웹에는 깨진 HTML이 많다. 8. 뷰티풀수프(BeautifulSoup)는 한마디로, 웹에서 일어날 수 있는 다양한 문제들에 대한 해결책을 모아 놓은 것이다. 9. 사용하기 매우 쉽다. 10. HTML 주면 태그 줄게! 11. 그냥 주소 건내주면, 받아온 HTML 문서 상에서 잘못된 부분이 있나 확인한다.. PY4E - Chapter 12 Unicode and UTF-8 in Python (2) 1.ASCII : American Standard Code for information interchange 2. 아주 가벼운 문자. 128가지 3. 8비트, 1바이트 4. 파이썬에서 ord()를 쓰면 숫자 값을 알 수 있음 5. 시대가 복잡해지고, 사용하는 문자가 많아졌다. 아식의 한계 도달. 6. 괴장히 복잡, 무거운 유니코드까지 발전. 엄청나게 넓은 공간을 가지고 있다. 어떤 문자라도 저장이 가능하다. 7. 다만 문제는 유니코드를 네트워크로 전송할 때 용량이 과도하게 크다는 것이다. 8. UTF32는 유니코드와 거의 같으며, UTF16은 압축형이다. 9. UTF8은 1~4 바이트로 동적 변경이 가능하다. 10. UTF8이 짱이다. 굉장히 멋있다. 11. 파이썬 3의 가장 큰 특징은 문자열을 유니코드.. PY4E - Chapter 12 Unicode and UTF-8 in Python (1) Part 1 1. 인터넷 네트워크를 알기 위해서는 계층 구조에 대해 알아야 합니다. 2 기본적으로 서버와 나의 컴퓨터 간의 정보이동이라고 생각하면 되고 각 이동시 하위 계층에서 패킷화 과정이 15-20회 정도 일어난다. 3. 둘 사이의 어떤 연결이 있고, 그 연결을 소켓(Socket)이라고 부른다. 4. 한 컴퓨터에서 프로그램이 실행되면 다른 컴퓨터에서 프로세스가 진행되어 응답을 줍니다. 5. 한 컴퓨터가 소켓에 이야기 하면, 소켓을 통해 다른 컴퓨터가 응답합니다. 이를 데이터의 양방향 통신이라고 합니다. 6. 데이터 전화기가 소켓입니다. 7. 어떤 시스템에 말을 걸 것인지, 어떤 서비스, 어떤 프로세스에 접근할 것인지를 포트 번호라고 부릅니다. 8. 소켓만 임포트를 해주면, 포트에 접근하기 쉽습니다. .. PY4E: Chapter 11 Regular Expressions PY4E - Regular Expressions (Chapter 11 Part 1) part 1 1. 정규식은 하나의 작은 프로그래밍언어다. 2. 정규식은 조금 더 똑똑하게 검색해보려는 시도다. 3. 정규식은 프로그래밍 가능한 와일드 카드다. 4. 정규식은 함축된 언어로 찾고자 하는 패턴과 매치되는 문자열을 찾아준다. 5. 정규식은 문자를 기준으로 작동한다. 6. 몇가지 유효한 문자가 있는데 특별한 의미를 가지고 있는 문자다. 7. 정규식은 파이썬의 일부가 아니지만, 파이썬과 함께 쓰인다. 8. 그렇기 때문에 import re를 해서 가져와야 한다. 9. re.search는 매개변수를 받아 문자열 내에서 검색하는 함수다. 10. re.findall 은 문자를 순회하면서 정해진 패턴을 만족하면 추출하는 함.. PY4E: Chapter 9 Dictionaries Chapter 9, Part 1 1. 프로그래머들이 파이썬에서 가장 좋아하는 부분이 바로 콜렉션(Collection)이다. 2. 딕셔너리는 인메모리 데이터베이스(in memory database)와 같다. 3. 콜랙션은 여러개의 정보를 저장하는 것이다. 4. 리스트는 컬렉션의 일종이며 순서가 있다. 리스트이 구조는 감자칩이나 프링글스와 비슷하다. 5. 딕셔너리 안에는 순서가 없다. 하지만 키를 기반으로 꺼낼 수 있다. 키-벨류 형식이다. 6. 딕셔너리는 지갑과 같다. 던져 놓은 모든 것에 레이블이 있다. 7. 딕셔너리는 연관 배열(Associative Arrays)이다 . 즉 키가 의미하는 것은 키와 값은 연결 관계이다. 7. 반면 리스트에는 위치가 있으며, 그 관계가 비교적 덜 강력하고, 덜 유연하다... PY4E: Chapter 8 Lists 8장 1부 1. 리스트 구조는 [](대괄호)로 표현된다. 2. 리스트는 위치와 순서가 정해져 있다. 3. 리스틑는 0부터 시작한다. 4. 리스트는 변형이 가능하다. 5. 스트링 자료형식은 변형이 불가능하다. 6. 리스트에 아이템을 할당할 때에는 변수가 속한 위치를 이용하여 바꿔 넣는다. 7, 리스트의 원소는 어떤 데이터 형식도 보유할 수 있다. 7. range()함수는 원하는 수의 정수형 원소를 가진 리스트를 생성할 수 있다. 8. 성능상의 차이가 없다면, 짧은 코드가 아름답다. 8장 2부 1. 리스트의 사칙연산은 해당 리스트를 변경하지 않고 새로운 변수에 연산된 값을 저장한다. 2. 리스트를 자를 때는 기억하자! "up to but not including" 3. 리스트[a:b] a부터 b-1까지 4... 이전 1 2 다음