Vienna

9장) 경우의 수와 확률 - 조건부확률과 베이즈 정리 본문

수학/수학 리부트

9장) 경우의 수와 확률 - 조건부확률과 베이즈 정리

아는개발자 2023. 5. 6. 23:52

■ 표본공간과 사건

◇ 표본공간(Sample Space)이란?

*시행에서 나올 수 있는 모든 **결과의 집합

 

*반복 가능한행위

** 사건

 

표본공간 s의 부분집합인 어떤 사건을 E라고 했을 때, 사건 E가 일어날 확률 P(E)는 다음과 같이 집합의 크기를 써서 정의.

$$P(E)=\frac{\left|E\right|}{\left|S\right|}$$

◇ 근원사건이란?

표본공간의 부분집합 중에서 원소가 하나인 것들로 더 이상 분리할 수 없는 사건

◇ 배반사건이란?

사건 중 서로 동시에 일어날 수 없는 사건들

(여사건도 배반사건의 일종)

 

예제: 다음 확률을 구하여라.

(1) 1~40 사이의 서로 다른 숫자를 6개 맞히는 게임에서 4개 이상 맞을 확률
(2) 5명이 원탁에 둘러 앉을 때, 그중 연인이 두 명이 서로 이웃하여 앉을 확률
(3) 세 가지 맛의 아이스크림을 랜덤으로 4개 시켰을 때 모두 같은 맛일 확률
(4) 1~6까지의 눈이 있는 주사위를 던져서 홀수 또는 소수가 나올 확률

풀이

(1)

내가 고른 숫자 중 4개가 정답일 사건을 E4, 5개가 정답일 사건을 E5, 6개가 정답일 사건을 E6이라고 가정.

표본 공간 S는 다음과 같이 구할 수 있다.

$$\left|S\right|=\binom{40}{6}=3838380$$

E4부터 구하면 다음과 같다.

정답 숫자 6개 중 4개를 선택하면서, 동시에 정답이 아닌 34개 중 2개를 고르는 경우의 수와 동일.

$$\mathrm{E}_{4}=\binom{6}{4}\cdot \binom{34}{2}=\frac{6!}{2!\cdot 4!}\cdot \frac{34!}{2!\cdot 32!}=15\cdot33\cdot17=8415$$

동일한 매커니즘으로 E5와 E6을 구한다.

$$\mathrm{E}_{5}=\binom{6}{5}\cdot \binom{34}{1}=\frac{6!}{1!\cdot 5!}\cdot \frac{34!}{1!\cdot 33!}=6\cdot34=204$$

$$\mathrm{E}_{6}=\binom{6}{6}=1$$

결과는 다음과 같다.

$$P(\mathrm{E}_{4})+P(\mathrm{E}_{5})+P(\mathrm{E}_{6})=\frac{8415+204+1}{3838380}=\frac{8620}{3838380}$$

 

(2)

5명이 원탁에 둘러앉을 원순열을 구하면 표본공간 S가 될 것이며,

4명이 원탁에 둘러앉을 원순열을 구한뒤 연인들끼리 줄세워야하므로 2를 곱하면 사건E가 될 것이다.

$$S=\frac{5!}{5}=(5-1)!=4!$$

$$E=3!\cdot 2$$

즉, 계산하면 다음과 같다.

$$P(E)=\frac{E}{S}=\frac{3\cdot 4}{4!}=\frac{1}{2}$$

 

(3)

중복조합의 수를 구하면 된다.

$$S=_{3}\mathrm{H}_{4}=\binom{6}{4}=\frac{6!}{4!\cdot2!}=15$$

즉, 계산하면 다음과 같다.

$$P(E)=\frac{E}{S}=\frac{3}{15}=20%$$

 

(4)

$$S=6$$

주사위를 던져서 홀수가 나올 Ea, 소수가 나올 Eb 사건.

$$\mathrm{E}_{a}=\frac{3}{6}=\frac{1}{2}$$

$$\mathrm{E}_{b}=\frac{3}{6}=\frac{1}{2}$$

Ea와 Eb는 동시에 일어날 수 있으므로, 해당 경우의 수 제외

$$\mathrm{E}_{a\cap b}=\frac{2}{6}=\frac{1}{3}$$

즉, 계산하면 다음과 같다.

$$\frac{1}{2}+\frac{1}{2}-\frac{1}{3}=\frac{2}{3}$$

 

■ 조건부확률

◇ 조건부확률(Conditional Probability)이란?

어떤 사건이 일어났음을 조건으로 전제하고 구하는 확률

◇ 결합확률(Joint Possibility)이란?

조건부확률과 대비하여 서로 다른 사건 A와 T가 동시에 일어날 확률

 

일반적으로, 사건 A가 일어남을 전제로 한 사건 B의 조건부확률은 다음과 같다.

$$P(B|A)=\frac{P(B\cap A)}{P()}$$

■ 독립사건과 종속사건

◇ 독립사건이란?

사건 B의 확률이 사건 A를 전제로 하는지 여부에 무관하게 적용되는 경우

◇ 종속사건이란?

독립사건이 아닌 것.

 

예제: 다음은 어떤 회사 직원들의 통근거리와 출퇴근 수단을 조사한 표다.
  대중교통 자가용 도보/자전거
10km 미만 15 3 7
10km 이상 19 8 3
임의로 한 직원을 선택하여 통근거리를 물어보니 15km라고 한다. 이 직원이 대중교통으로 출퇴근할 확률은 얼마나 되는가?

풀이: 15km의 경우에는 10km 이상이므로 하단의 수치에 집중한다.

대중교통/자가용/도보및자전거의 합은 표본공간 S = 30

그 중 대중교통의 수는 E = 19

즉, 19/30 = 0.63...

63.33%가 해당 직원이 대중교통으로 출퇴근할 확률이다.

 

■ 독립시행의 확률

◇ 독립시행이란?

한 시행이 다른 시행에 영향을 끼치지 않을 때

 

한 번의 시행에서 어떤 사건이 일어날 확률이 p라고 할 때, n번의 독립시행에서 이 사건이 k번 일어날 확률은 다음과 같다.

$$\binom{n}{k}\times p^k\times (1-p)^{n-k}$$

 

■ 베이즈 정리

결합확률을 구하는 식을 약간 변형하면 아래와 같다.

$$P(A\cap B)=P(B|A)\cdot P(A)=P(A|B)\cdot P(B)$$

$$\therefore P(A|B)=\frac{P(A|B)\cdot P(A)}{P(B)}$$

즉, P(A|B)를 알고 있다면 P(B|A)를 알아낼 수 있다는 의미.

이러한 식을 베이즈 정리라고 부른다.

베이즈 정리는 어떤 조건부확률을 계산하는 것이 쉽지 않은 상황일 때, 이미 알고 있는 다른 지식(조건과 결과가 뒤바뀐 조건부 확률)을 이용해서 원하는 확률을 얻게 해준다.

 

예제: 어떤 사람이 받는 이메일 중 통계적으로 20%는 스팸메일이라고 한다. 최근에는 '코인'이란 단어를 포함한 스팸메일이 많이 오고 있는데, 통계를 내어 보니 전체 메일 중 '코인'이 포함된 것은 6% 정도지만, 스팸메일 중에서 따지면 25%에 이르고 있다. 이제 '코인'이란 단어가 포함된 새 메일이 도착했을 때, 이 메일이 스팸메일일 확률은 얼마나 되는가?

 

풀이:

어떤 메일이 스팸메일인 사건 Ea

어떤 메일에 '코인'이라는 단어가 포함된 사건을 Eb

$$P(\mathrm{E}_{a})=0.2$$

$$P(\mathrm{E}_{b})=0.06$$

$$P(\mathrm{E}_{b}|\mathrm{E}_{a})=0.25$$

즉, 베이즈 정리를 이용하여 전개하면 다음과 같다.

$$P(\mathrm{E}_{a}|\mathrm{E}_{b})=\frac{P(\mathrm{E}_{b}|\mathrm{E}_{a})\cdot P(\mathrm{E}_{a})}{P(\mathrm{E}_{b})}=\frac{0.25\cdot0.2}{0.06}\approx 83.33%$$

 

■ 몬티 홀(Monty Hall) 문제

당신은 tv 쇼 프로그램에서 경품을 선택할 기회를 얻었다. 경품은 세 개의 문 뒤에 있는데, 그 중 하나는 자동차지만 나머지 두 곳에는 염소가 있다. 이제 당신이 문 하나를 고르면, 사회자는 나머지 두 문 중 염소가 있는 쪽의 문을 열어서 보여 준 다음에 선택을 바꿀지 여부를 묻는다. 이때 처음의 선택을 바꾸는 것이 과연 자동차를 얻는데 이득일까?

이를 조건부확률과 베이즈 정리로 확인해본다면 다음과 같다.

자동차가 문 A, B, C 뒤에 있을 확률을 각각 P(A), P(B), P(C) 라고 하면, 세 확률 모두 3분의 1이라는 것은 명백함.

$$P(A)+P(B)+P(C)=\frac{1}{3}+\frac{1}{3}+\frac{1}{3}=1$$

그리고 자동차의 위치 A, B, C에 따라 사회자가 특정 문을 여는 사건을 Mdoor이라고 한다.

 

내가 문 A를 선택했다고 가정해 본다.

$$P(\mathrm{M}_{b}|A)=\frac{1}{2} \cdots (a)$$

(a) - 자동차가 A에 있고 내가 문 A를 선택했으므로, 사회자는 문 B나 C 중 하나를 선택한다. 그러므로 50%

 

$$P(\mathrm{M}_{b}|B)= 0 \cdots (b)$$

(b) -  자동차가 B에 있기 때문에 사회자는 이 문을 열지 못한다.

 

$$P(\mathrm{M}_{b}|C)= 1 \cdots (c)$$

(c) - 자동차가 C에 있기 때문에 B를 고를 것이다. 그러므로 100%

 

즉, 다음과 같다.

 

P(A|Mb): 사회자가 문B를 열었을 때 자동차가 문 A 뒤에 있을 확률

P(B|Mb): 사회자가 문B를 열었을 때 자동차가 문 B 뒤에 있을 확률(=0)

P(C|Mb): 사회자가 문B를 열었을 때 자동차가 문 C 뒤에 있을 확률

 

그리고 각 확률은

$$P(A|\mathrm{M}_{b})=\frac{ P(\mathrm{M}_{b}|A)\cdot P(A)}{P(\mathrm{M}_{b})}$$

$$P(C|\mathrm{M}_{b})=\frac{ P(\mathrm{M}_{b}|C)\cdot P(C)}{P(\mathrm{M}_{b})}$$

 

전확률의 정리를 이용하면 P(Mb)를 구할 수 있다. 그리고 이를 적용하면 다음과 같다.

$$P(A|\mathrm{M}_{b})=\frac{\frac{1}{2}\cdot \frac{1}{3}}{\frac{1}{2}}=\frac{1}{3}$$

$$P(C|\mathrm{M}_{b})=\frac{1\cdot \frac{1}{3}}{\frac{1}{2}}=\frac{2}{3}$$

 

즉, 선택한 문을 바꾸는 쪽이 자동차가 나올 확률이 바꾸지 않는 확률의 2배다.

Comments