파이썬/파이썬-AI 기본

베이지안 정리를 사용하는 상황에 대한 이해

용사냥꾼69 2023. 2. 15. 19:13
728x90

베이지안 정리


어떤 사건이 서로 배반하는 원인 둘에 의해 일어난다고 할 때 실제 사건이 일어났을 때 이것이 두 원인 중 하나일 확률을 구하는 정리, 이것이 베이지안 정리이다.

쉽게 보면 조건부 확률을 구하는 것이다.

A가 일어날 때, B가 일어날 확률을 구하는 것이 바로 베이지안 정리의 핵심이지만 이것이 데이터 수집에 따른 사후확률의 계산으로 이어지면서 의미있는 정리가 되고 있다...

그래서 언제 써야 하는가?


조건부 확률 P(B∣A)를 구할 수 있다고 가정할 때, P(A|B)를 구하는 것이 베이지안 정리의 활용이다.

예를 들어, P(병) - 병에 걸릴 확률을 알고 있다면 P(양성∣병)을 구할 수 있다면 P(병∣양성)을 구할 수 있다는 것이다.

2 + x = 4 라는 공식에서 x가 2라는 것을 모르는 사람은 없다. 베이지안 정리의 역할은 정확히 이러한 것이다.

문제는 P(양성∣병) 이라는 데이터를 수집할 수 있으면
왜 P(병∣양성)은 수집하지 못하는가?
라는 의문이 있다.

바로 이것에 대한 대답이 베이지안 정리를 어떻게 활용해야 하느냐에 대한 대답이 될 수 있다고 본다.

의문에 대한 대답


병이 걸린 사람 중에서 테스트를 통해 양성이 얼마나 나오는지 [P(양성∣병)]를 구하는 것이

테스트를 통해서 양성이 나온 사람 중에서 병에 걸린 사람을 알아보는 것[ P(병∣양성)]보다

비용이 적게 들기 때문이다.

베이지안정리1

병에 걸린 사람이 상대적으로 더 적기 때문에 병에 걸린 사람을 토대로 데이터를 수집하는 쪽이 효율적이다.

더 적은 데이터를 토대로 모집단을 설명할 수 있는 확률을 구하는 것.

마법처럼 보이는 베이지안 정리는 바로 이러한 것이다.

결론


결국 베이지안 정리는 "마법" 같은 확률을 구해주는 공식이 아니라

현실과 비용 속에서 상대적인 대안을 찾는 수단이라고 생각해야 실제 활용할 곳을 찾을 수 있다고 본다.