취준일기

[통계학] 하버드 Statistics 110 Probability and Counting (with edwith )

둉영 2020. 3. 10. 22:44

해당 게시글은 edwith 에 등록된 하버드 대학 Joe Blitzstein 교수님의 statistics 110 강의를 듣고 정리한 내용입니다.

 


 

[Statistics 110] 1. 확률과 셈 원리 (Probability and counting) -1

 

 

확률론은 양자학, 물리학, 유전학 뿐만 아니라 역사학, 인문학, 사회과학, 정치, 금융에서 활용되고 있습니다.

도박이나 게임은 페르마와 파스칼의 서신을 통해 통계에서 이미 여러 번 연구된 주제임을 알 수 있습니다. 

 

수학확실성에 대한 학문이라면

확률불확실성에 대한 학문으로 이를 수치화(계량화)하는 것을 가능하게 해줍니다.

 

 

 

 

 

 

 

 

 

 

 

1. 표본 공간 (a sample space)과 사건 ( an event)

 

확률에 대해 설명할 때 표본공간과 사건에 대한 이해가 필요합니다. 

 

표본 공간(a sample space) 이란 실험의 모든 가능한 결과의 집합을 의미합니다.

A sample space is the set of all possible outcomes of an experiment.

 

사건(an event) 이란 표본 공간의 부분집합을 의미합니다.

An event is a subset of the sample space.

 

 

여기서 우리는 집합이라는 단어에 주의해야 합니다. 

 

과거에는 확률을 점성술로 생각하고 직관적으로 유사점을 찾아내서 다양한 발견법을 만들어 냈습니다.

여기서 말하는 다양한 발견법은 결과적으로 완전히 틀린 방법이지만요.

 

인류 역사상 가장 영향력 있는 사람 가운데 1명으로 꼽히는 물리학자이자 수학자인 아이작 뉴턴 또한 틀린 방법을 이야기했었습니다. 

 

도박에 대한 질문을 던졌던 도박쟁이에게 그의 주사위 도박에 대한 생각은 틀렸습니다. 

 

"직관은 대부분 틀리다"는 것을 알 수 있습니다. 

 

통계학은 직관에 어긋나는 경우가 더 많아서 미적분을 배울 때는 놀라지 않았던 사람도 통계학을 배우고 놀람을 느낄지 모릅니다.

그렇기 때문에 우리는 많이 배우고 수학적으로 더 정교화해져야 합니다.

 

수학적으로 큰 진전은 사건을 부분집합으로 생각하는 것부터 시작했습니다.  

 

 

2. Naive Definition of Probability 확률의 단순한 정의

 

사건 A에 대한 확률

 

여기서 P는 확률을 의미하고 A는 사건을 의미합니다.

 

예를 들어,

동전을 두 번 던졌다고 생각해보겠습니다.  발생 가능한 모든 경우의 수는 4가지입니다.

앞면

앞면

앞면

뒷면

뒷면

뒷면

뒷면

앞면

동전을 두 번 던졌을 때 모두 뒷면이 나오는 경우의 수의 확률은 정의에 따라 작성해보면 1/4입니다

 

만약 동전이 뒷면으로 떨어지는 성질이 있어서 뒷면을 더 많이 떨어진다면 어떻게 될까요?

 

이렇게 단순한 정의에 의해 확률을 정의할 때는 두 가지 중요한 가정이 필요합니다.

 

첫 번째로 ,

 

"모든 경우가 같은 확률로 나온다"입니다. 주사위처럼 대칭적인 경우를 생각해보면 이해하기 쉬울 것입니다.

 

두 번째로,

  

"가능한 경우가 유한하다"입니다. 이 말은 즉, 유한한 표준 공간(finite sample space)을 가진다고 이해할 수 있습니다.

 

 

극단적인 예를 들어보겠습니다.

우리는 해왕성에 생명체가 있을 확률을 계산하고 싶습니다. 

가능한 경우는 있다와 없다 두 가지 경우일 것입니다. 그중 생명체가 있을 확률은 1/2입니다.

 

그렇다면, 지능을 가진 생명체가 해왕성에 있을 확률은 무엇일까요?

앞선 경우와 같이 있다와 없다 두 가지 경우로 1/2이라고 답할 수 있습니다. 

 

하지만 지능을 가진 생명체가 있을 확률이 생명체가 있을 확률보다 낮아야 하는데 같은 확률이 나올 수가 있을까요?