A. 확률의 기초
1. "밖에(out there)"혹은 당신의 머리 밖에(outside your head)에 있는 확률. 장기간 빈도를 의미하는 확률이다. 어떤 특정한 사건이 발생할 확률은 정확한 수치로 표현된다. 하지만 대개의 경우 우리는 사건에 대한 충분한 정보를 얻기 힘드므로, 그 값을 자신할 수 없다.
2. 당신의 머리 안에(inside yout head) 있는 확률. 주관적 믿음의 강도로 표현되는 확률을 말한다. 이는 사람마다 다를 수 있으며, 한 개인에게서도 경우에 따라 차이가 발생하기도 한다.
B. 장기간 빈도를 의미하는 확률
1. 모형 한 개에서 얻은 예측으로서의 확률. 모델이 있고, 그 모델에 따른 사건에 대한 예측이다. 모델을 통한 예측이 완벽하지 않더라도 유용할 수는 있다.
2. 자료에 기반한 확률 : 2011년 신생아중 51.7%는 남아였다.
C. 믿음의 강도로서의 확률
1. 주관적 확률 : 당신과 나는 아이가 남아로 태어날 확률에 대해서 주관적으로 다른 믿음의 정도를 가지고 있다.
2. 무지를 정량화하는 확률 : 이미 임신을 한 상태에서, 남아일 확률을 예측하는 것은 무의미하다. 이때의 예측은 이미 일어난 사건에 대한 무지를 정량화한다.
3. 한 번 발생하는 사건의 정량적 예측: 많은 분석가들이 2012년 오바마의 당선을 예측 했다. 67%는 득표율을 의미하는 것이 아니라, 분석가의 확신의 정도를 정량화 한 것이다.
D. 자연빈도를 갖고 계산한다면 확률 계산은 더 쉬울 수 있다.
1. 어떤 일이 발생할 확률 5%로보다는, 100명 중 5명! 이 더 쉽다.
E. 확률에서 범하기 쉬운 실수
1. 가정을 고려하지 않는 것 : 어떤 경우에서든 그 확률의 배경이 되는 가정을 고려해야 한다.
2. 분자와 분모에 대한 확실한 정의 없이 확률을 이해하려 드는 것 : 확률의 배경이 되는 분자와 분모에 대한 확실한 정의가 없다면 확률을 이해 할 수 없다.
3. 확률기술을 반대로 하는 것 : 헤로인 중독자가 마리화나를 사용할 확률은 마리화나 사용자가 향후 헤로인에 중독될 화귤과 같지 않다. 또, 통ㄷ계책이 지루할 확류은 지루한 책이 통계에 대한 책일 확률과 같지 않다.
4. 확률에 기억렬이 있다고 믿는 것 : 도박사의 오류
F. 확률과 오즈
1.오즈(odds)는 정확하게 확률과 같은 개념을 표현하는 대체제다. 모든 확률은 오즈로도 기술되며, 따라서 모든 오즈 역시 확률로 표현이 가능하다. 어떤 개념이 항상 더 좋다는 것은 없다.
2. 오즈는 사건이 일어날 확률을 사건이 일어나지 않을 확률로 나눈 값으로 정의된다.
G. 확률과 통계학은 어떻게 다른가
1. 확률과 통계학은 학문과정이나 관려서에서 자주 연결되어 나오지만 둘을 구분할 수 있어야 한다.
2. 모집단 혹은 모형으로 불리는 일반적인 사건에서 출발해, 많은 자료 표본에서 어떤 일이 일어날지 예측하는 게 확률이다. 확률계산은 일반적인 것에서 특정한것 모집단에서 표본, 모형에서 자료라는 방향성을 가진다.
3. 통계적 계산은 이와 반대 방향으로 이루어진다. 하나의 자료를 출발점으로 삼아 전체 모집단이나 모형에 대해 추론하는 것이 통계다. 따라서 사고의 방향은 특정한 것에서 일반적인 것, 표본에서 모집단, 자료에서 모형으로 이루어지게 된다.
H. 통계학에서 확률
1. "밖에 있는" 확률을 통해 신뢰국간이나 P값에 대해 설명하는 통계학을 "빈도론자의 통계학"이라고 한다.
2. 많은 통계학자가 대안적 방법인 베이즈 통계학을 선호하는데, 이 방법은 이전의 믿음을 정량화하고 그 값을 통계계산에 사용한다. 이런 선행확률은 세련된 의견에 근거한 주관적 확률일 수도 있고, 명확한 자료나 잘 설정된 이론에 근거한 객관적 확률일 수 있다. 또는 모든 확률은 똑같다는 믿음에 근거한 정보로서 가치가 없는 확률일 수도 있다.
'2019년 혁신성장 청년인재 집중양성(빅데이터) > 통계 시발점(욕이 아니라 시작의 의미로)' 카테고리의 다른 글
[Intuitive Biostatistics] 비율의 신뢰구간 (0) | 2019.10.29 |
---|---|
[Intuitive Biostatistics] 표본에서 모집단으로 (0) | 2019.10.28 |
[통계학 스터디] 20191019 가우스 분포, 중심극한정리, 모수와 통계량, 표준오차, 변동계수 (0) | 2019.10.22 |
[통계학 스터디] 20191013. 불편성, 효율성, 일치성, 충분성, 점추정, 구간추정 (0) | 2019.10.13 |
[Intuitive Biostatistics] CHAPTER 1 통계학과 확률은 직관적으로 이해하기는 어렵다. (0) | 2019.10.07 |