https://brunch.co.kr/@rapaellee/4
엄청나게 잘 정리해주신 것 같다. 이해가 빡간다.
표준화(Standardization)
1. 데이터의 시간의 개념이 들어가면 데이터는 점점 멋져진다.
2. 표준화(Standardization)은 평균을 기준으로 얼마나 멀리 떨어져 있는지를 나타내는 값으로 이 방법을 적용하려는 때, 2개 이상의 대상이 단위가 다를 때 대상 데이터를 같은 기준으로 볼 수 있게 변환해준다.
3. 이 방법은 데이터를 다소 평평하게 만드는 특성을 가진다. 즉 간극이 줄어드는 효과가 발생한다.
*근데 이게 좋은 걸까? 아직 잘 모르겠다.
정규화(Normalization)
1. 정규화는 전체 구간을 0~100으로 설정하여 데이터를 관찰하는 방법이다.
2. 규모를 줄인 것이기 때문에, 특정 데이터의 위상을 파악할 때 좋다.
아직까지는 고놈이 고놈 같긴 하다. 0~100으로 놓고 보느냐, 평균에서 얼마나 떨어져 있는지를 보느냐가 차이점 이기는 하지만 말이다.
정답은 없을 듯
데이터를 어떻게 해석하는지가 문제일 뿐이다.
'2019년 혁신성장 청년인재 집중양성(빅데이터) > STACKOVERFLOW 1일 1질문' 카테고리의 다른 글
[가상화폐 감성분석 사례] DigiCurr Sentiment , AFINN-165 (0) | 2019.08.22 |
---|---|
마크업(MarkUp)과 마크다운(Markdown) (0) | 2019.07.24 |
다섯 번째 질문. Difference Between One-to-Many, Many-to-One and Many-to-Many? (0) | 2019.07.14 |
네 번째 질문. what is the true difference between lemmatization vs stemming? (0) | 2019.07.12 |
세번째 질문. [TRACEBACK] TypeError list indices must be integers not str (0) | 2019.07.11 |