1. 온라인러닝은 스톡케스틱과 비슷하다고 볼 수 있다. 데이터는 흘러 넘치고, 그 데이터를 모아 두었다 쓰기에는 흐름에 적절하지 않을 때, 실시간으로 세타를 갱신시키는 것이다.
2. 다만 실시간으로 바뀌는 입맛을 쫓는 것이니, 정답도 확인 할 수 없다는 것이 문제. 적절한 알파를 찾아야 하고, 때에 다라서는 적절한 미니 배치 사이즈도 찾아야 한다.
1. 맵리듀스 방법에 대해서 간단히 소개해주셨다. 핵심은 코어를 나눠서 계산하여 병렬로 처리한 뒤, 다시 그것을 모아서 계산하는 것이다. 한번에 하나밖에 처리 못하다가 4개를 처리하니 속도가 빨라지는 것은 당연하다.
2. 맵리듀스시의 데이터 분할이나 저장에 관해서는 또 다른 곳에서 공부를 해야할 듯 싶다.
'2019년 혁신성장 청년인재 집중양성(빅데이터) > [COURSERA] Machine Learning Stanford Uni' 카테고리의 다른 글
[week11] Problem Description and Pipeline, Photo OCR(Optical Character Recognition) (0) | 2019.11.16 |
---|---|
[week10] learning with large datasets (0) | 2019.11.14 |
[week9] Low Rank Matrux Factorization (0) | 2019.11.08 |
[week9] Collaborative Filtering (0) | 2019.11.07 |
[week9] Predicting Movie Rating (0) | 2019.11.07 |