机器学习实战篇——贝叶斯定理算得病概率

问题:

准备工作:

  1. 贝叶斯公式

机器学习实战篇——贝叶斯定理算得病概率

2. 联合概率公式

机器学习实战篇——贝叶斯定理算得病概率

机器学习实战篇——贝叶斯定理算得病概率

解释一下:求A和B共同发生的概率,就等于求重叠那部分的概率,先看黄色的A的部分为背景,P(B|A)是当A发生的情况下B发生的概率乘以P(A) (A发生的概率),就是AB重叠的那部分的概率;同样的看蓝色B部分的背景,P(A|B)是当B发生的情况下A发生的概率乘以P(B) (B发生的概率),就是BA重叠的那部分的概率,称为联合概率,所以P(B|A)P(A)=P(A|B)P(B)

3.全概率公式:首先看一个等式

机器学习实战篇——贝叶斯定理算得病概率

原理: 一个联合分布,把其中一个变量的所有可能全部取完就会把这一项积掉,最后只剩 P(B) , 而根据联合概率公式,P(A,B)=P(B|A)P(A),可以得出:

机器学习实战篇——贝叶斯定理算得病概率

最后贝叶斯公式可以转化为:

机器学习实战篇——贝叶斯定理算得病概率

解题步骤:

首先我们来列一下已经知道的概率,(D:就是得病。T:就是检测)

  1. P(T=1|D=1)=0.99;就是说如果小明得病了,能检测出来得病的概率是99%

  2. P(D=1)=0.0001 这个病的得病率是0.01%

  3. P(D=0)=0.9999 这个病的不得病率是99.99% (因为这个病只有两种情况,要么得病,要么不得病,总概率是1,而题目条件给出的得病率是0.01%,所以不得病率是99.99%)

目标是要求出P (D=1|T=1),就是检测结果为阳性,得病的概率是多少。

用全概率公式展开,就是:(在本文上半部分的准备工作当中的第三条全概率公式)

机器学习实战篇——贝叶斯定理算得病概率

这样的话,我们把每一项的概率带入

P (D=1|T=1) = (0.99*0.0001)/ ((0.01*0.9999)+ (0.99*0.0001)) = 0.0098

总结:

今天通过一个反常识的例子,了解到联合概率的恒等式推导,进而得出贝叶斯公式,结合恒等式和贝叶斯公式用积分积掉其中一项,则可以得出全概率公式。大家可以认真想一下这几个公式的关系和相互推导的过程,最好拿张纸手写一下。


分享到:


相關文章: