본문 바로가기

통계 시발점(욕이 아니라 시작의 의미로)

[Intuitive Biostatistics] CHAPTER 1 통계학과 확률은 직관적으로 이해하기는 어렵다.

1. 우리는 바로 결론으로 건너뛰려 한다.

 

하나의 표본에서 모집단으로 일반화하는 능력은 인간의 뇌가 본래부터 지닌 것으로 8개월 영아에게서도 관찰된다. 제한된 자료로부터 결론을 내리려는 강력한 본능에 저항하는 방편으로 과학자는 통계학을 사용할 필요가 있다.

 

주어진 정보를 통해 판단을 내리려는 본능은 그런데로, 생존에 도움을 주었던 것일까.

 

2. 우리는 과신하는 경향이 있다.

 

우리는 자신의 생각을 과신하는 경향이 있으므로, 과학자는 통계학을 이용하여 자신들이 이룬 결론이 갖는 확실성을 적절하게 정량화할 필요가 있다.

 

생각을 과신한다. 자신이 만들어낸 정보에 편향되는 경향이 있다. 당연한가? 가장 많이 만나는 정보가 가장 많이 나의 생각에 영향을 주니.

 

3. 우리는 무작위자료에서 패턴을 본다.

 

 

대부분의 사람은 패턴을 본다. 하지만 표1.1은 무작위로 생성된 것이다. 각 지점은 이전 지점의 결과 상관없이 무작윌 성공 또는 실패가 될 수 있다. 하지만 아마도 패턴으로 보이는 묶음을 발견할 것인데, 이는우리 뇌가 그런 패턴을 잘 보는 쪽으로 발달한 탓이다. 이 능력은 아마도 우리 조상이 침입자를 인지하거나 독성 식물을 피하는 데 도움이 되었을 것이다. 하지만 이처럼 내재된 사고 편향을 알아채는 것은 중요하다. 무작위 자료에서 겉으로 드러난 패턴에 기만당하지 않으려면 엄격한 통계적 사고가 필수적이다.

 

뭐가 있긴 개뿔, 딱 자신의 수준만큼 이해할 뿐이다.

 

4. 우리는 우연의 일치가 자주 일어나는 것을 깨닫지 못한다.

 

 

이런 특정한 일들이 연속해서 일어날 확률은 얼마나 될까? 매우 작다. 이런 특정한 우연의 일치가 일어날 가능성은 매우 낮다. 하지만 우리는 종종 놀라운 일들이 연속해서 일어나는 것을 명확하게 인지하다. 놀라운 우연의 일치는 대개 나중에 되돌아보는 과정에서 파악되는 것이며, 그런 일들이 일어날 것을 예측할 수는 없다.

 

어찌 되었든 일어나기 어려운 일들이 자주 일어난다고 이야기 하는 것일까? 

 

5. 확률에 대한 직관은 부정확하다.

 

 

우리의 뇌는 간단히 말해, 확률을 분별 있게 다루도록 진화하지 않았다. 따라서 대부분의 사람이 비논리적인 선택을 하게 된다.

 

 

그렇게 진화하지 않았다는 것은, 그럴 필요가 없었음을 말하는 것이 아닐까. 논리적인 것보다 비논리적인 것이 생존에 유리한 선택이었음을 말하는 것일까?

 

 

6. 우리는 확률을 결합하는 것을 어려워한다.

 

대부분의 사람이 직관적으로 잘못된 결론을 내리는데, 선택을 바꾸는 것이 도움이 되지 않는다고 생각한다.

 

그렇지 뭐, 그래서 훈수를 두면 다 잘하지. 

 

 

7. 우리는 베이즈 계산을 직관적으로 하지 않는다.

 

의사를 포함해 대부분의 사람들은 직관적으로 양성검사결과가 거의 명확하게 HIV 감염을 의미할 것으로 생각한다. 우리 뇌는 이미 아는 정보를 새로운 정보와 통합하는데 익숙하지 않다.

진짜 인정. 정보 결합이 쉽지 않다. 숫자에 속아 넘어간다.

 

8. 우리는 다중검정에 기만당한다.

 

이 연구는 다중검정을 시행할 때 통계적인 결과를 해석하는 작업이 얼마나 어려운지를 보여 주려는 목적으로 행해진 것이다.

 

다중검정이 뭔지 잘 모르겠다.

 

9. 우리는 대안적 설명을 쉽게 무시한다.

 

다른 가능성에 대해서, 충분히 생각하고 통제해야 한다.

 

10. 우리는 평균으로의 회귀에 기만당한다.

 

이것은 평균으로의 회귀에 대한 한 예다. 처음 측정한 변수가 극한 값을 가질수록 다음에 측정한 변수는 평균에 근접할 가능성이 커진다.

 

 

어찌보면 당연한 얘기다. 큰키의 아빠로부터 평균보다 큰키의 아이가 나올 확률은 크지만, 만약 아빠가 키라는 데이터에서 평균보다 큰 폭으로 큰 데이터 였다면, 아들의 키는 아빠의 키보다는 작을 수밖에 없다. 당연한 것에, 속지 말아야 한다.

 

11. 우리는 확실성을 갈망하나 통계학은 확률만을 제공한다.

 

많은 이들이 통계계산으로 확실한 결론을 얻기를 원한다. 하지만 실제 모든 통계 계산의 결론은 확률로 기술된다. 확실한 결론을 찾고자 한다면 통계학을 배우는 것은 매우 어려울 수 있다.

 

 

확실한 결론을 얻을 수 없다. 그 지점에서 통계는 가능해지며, 의미를 가진다. 확실하지 않기 때문에 모호해지는 것이 아니라 어떤 아름다움이 들어나게 된다.