[week3] Multiclass Classification
1. 이메일을 분류할 때, 업무는 1, 친구는 2, 가족은 3, 취미는 4로 분류할 수 있고 2. 의료에서는 아프지 않음을 1, cold는 2, Flu는 3으로분류할 수 있다. 3. 날씨의 경우 좋은날은 1, 구름은 2, 비는 3, 눈은 4로 분류할 수 있다. 2. 세개의 값을 어떻게 분류 할 것인가, 이때 쓰는 방법이 One-vs-all 또는 One-vs-rest라는 방법이다. 1. One vs all이라는 방법은 간단하다 분류하려는 대상을 놓고, 그 나머지는 하나로 묶은 후 표준 로지스틱 리그레션을 시행한다. 2. 3개의 분류군이 있다면, 위의 그림과 같이 가설을 세계 만들어 3번의 표준 로지스틱 리그레션을 수행한다. 3. 그렇다면 어떻게 분류를 하느냐? 세가지 가설을 기준으로 모두에 대해 그것이 각..
[week3] Classification and Representation
A. Classification 1. 종양의 크기에 따른 악성 유무 데이터가 있다고 했을 때, 우리가 저번에 배웠던 회귀모델을 적용시켜보자. 2. 회귀 모형은 데이터가 적을 때는 잘 적용되는 것처럼 보이지만, 크기가 큰 악성 종양 데이터가 생김으로써, 기울기인 세타 값이 작아지게 되며, 그로 인해 악성 종양을 분류하는 임계치가 커지게 되어 버린다. 3. 이로 인해서, 악성 종양이지만, 종양이 아니게 분류 되어 버린다. 1. 이 분류 문제에서, 예측 값은 0 또는 1의 값을 가지지만, 예측 값은 1보다 크고 0보다 작은 값을 가지는 상황이 발생 될 수 있는데, 이 문제를 해결하는 것이 로지스틱 리그레션이다. 리그레션이라는 말이 들어가지만, 역사적인 의미에서 들어간것 이기 때문에 분류라고 생각해라. 2. 로..