끵뀐꿩긘의 여러가지

5강- 조건부 확률과 전확률정리 (Conditioning Continued, Law of Total Probability) 본문

Naver boostcamp -ai tech/Statistics 110

5강- 조건부 확률과 전확률정리 (Conditioning Continued, Law of Total Probability)

끵뀐꿩긘 2022. 10. 10. 20:48

전확률정리(Law of Total Probability)

 

 $A_1,A_2\cdots A_n$은 서로소인 집합일때,

$$P(B) = P(B \cap A_1) + P(B \cap A_2) + ... + P(B \cap A_n)$$

$$= P(B|A_1)P(A_1) + P(B|A_2)P(A_2) +... + P(B|A_n)P(A_n) $$

 

 

조건부 확률 문제 1.

카드 한 벌에서 무작위로 두 장을 뽑았을 때,

1) P(두 장 다 에이스 | 에이스를 뽑는 경우)

2) P(두 장 다 에이스 | 스페이드 에이스를 하나 뽑는 경우)

조건부 확률 문제 2.

인구의 1%가 걸리는 병이 있고, 이 병의 검사 결과가 ‘95%의 정확도를 갖고 있다’고 하자. 검사가 양성으로 나왔을 때, 실제로 이 병에 걸렸을 경우는?

 

주어진 조건: $P(D) = 0.01, P(T|D) = 0.95 , P(T^C|D^C) =0.95$

베이즈 정리를 활용한 풀이:

$$P(D|T) = \frac{P(T|D)P(D)}{P(T)} = \frac{P(T|D)P(D)}{P(T|D)P(D) + P(T|D^C)P(D^C)}$$

$$= \frac{(0.95)(0.01)}{(0.95)(0.01) + (0.05)(0.99)} \approx 0.16$$

 

조건부 확률 문제를 풀며 자주하는 실수

1. $P(A|B)와 P(B|A)$를 헷갈리는 것

검사의 오류:

어느 범죄 현장에서 범인의 것으로 추정되는 담배꽁초 이외의 어떤 단서도 발견되지 않았습니다. 주변 지역의 전과자들을 대상으로 DNA 검사를 해보니 용의자가 하나 나왔습니다.
이 용의자는 범죄가 발생한 시점에 홀로 집에 있었다고 주장하지만 알리바이를 입증해줄 증인은 찾지 못했습니다.
검사는 다음과 같은 논리를 가지고 이 용의자를 범인이라고 기소했습니다.

1. 범인이 아닌 경우에 DNA가 일치할 확률은 1만분의 1이다.
2. 그러므로 용의자가 범인이 아닐 확률은 0.01%다. 따라서 범인일 확률은 99.99%이다.
(나라의 인구는 50000)

우리가 구해야하는 확률은 $P(A|B) = P(범인이 아닐 경우 | DNA가 같을 경우)$

검사가 주장한 논리는

$P(B|A) = P(DNA가 일치하는 경우 | 범인이 아닌 경우) = 0.01% $

$P(A|B) = P(B|A)* \frac{P(A)}{P(B)} = P(B|A)*1 = 0.01%$

$\therefore 1 - P(A|B) = 99.99%$

이므로, $\frac{P(A)}{P(B)}$를 1로 가정하고 있다.

 

하지만 $P(A) = \frac{전체 인구 -1}{전체인구} = \frac{49999}{50000}$

$P(B) = P(B \cap S) = P(B \cap A) + P(B \cap A^C) = P(B|A)P(A) + P(B|A^C)P(A^C) = \frac{1}{10000} *\frac{49999}{50000} + 1 *\frac{1}{50000} = 0.000119998$

$\frac{P(A)}{P(B)} \approx 8,333$

이므로 가정이 틀렸고

$\therefore P(A|B) \neq P(B|A)$

 

2. 사전확률($P(A)$)과 사후확률($P(A|B)$)을 헷갈리는 것

사전확률(prior probability): B가 관측되기 이전의 확률

사후확률(posterior probability): B가 관측된 이후의 확률

ex. A가 일어났다 $\neq P(A) = 1$ but $ P(A|A) = 1$

 

3. 독립과 조건부 독립을 헷갈리는 것

독립: $P(A,B) = P(A)P(B)$

조건부 독립: $P(A,B|C) = P(A|C)P(B|C)$

 

독립과 조건부 독립의 관계:

조건부 독립이면 독립인가? False

독립이면 조건부 독립인가? False

 

조건부 독립 개념이 좀 많이 어렵다

http://norman3.github.io/prml/docs/chapter08/2.html

 

2. Conditional Independence

2. Conditional Independence 여러 개의 변수를 다루고 있는 확률 문제에서 중요한 요소 중 하나는 조건부 독립(conditional independence) 문제. 세 개의 변수 \( a \) , \( b \) , \( c \) 가 있다. 이 때 \( b \) 와 \( c \)

norman3.github.io

 

Comments