天才一秒记住【狂风中文网】地址:https://www.kfzw.net
正中的长方形→0.5×0.33=0.165
右边的长方形→0.6×0.4=0.24
对于这3个长方形,需要画出一个使横向长度之和与面积之和一致的长方形,即虚线长方形。
这个长方形,横边的长度刚好等于1。
其理由是,由于3个长方形的横边长度为各类别的后验概率,根据标准化条件进行相加,其结果为1。
因此,虚线长方形的纵向边长的长度,与3个长方形的面积之和完全一致。
这是“把类别平均化的数值”
,即为“类别的期待值”
(图表4-8)
图表4-8计算类别的平均值
具体的计算过程如下所示:
(P的期待值)=0.4×0.27+0.5×0.33+0.6×0.4
=0.108+0.165+0.24
=0.513
因此,若把这对夫妇的类别(生女孩的概率)进行平均化,则得到结果0.513。
这也能够成为解释“这对夫妇第二胎生女孩的概率”
的理由。
在第19讲中,会针对“满足类别0≤p≤1中所有p的设定”
的例子进行说明。
第4讲·小结
1.用概率设定类别,设定其先验概率(因为无法获得数据,而采用了理由不充分原理将其设定为对等)。
先验概率是“概率的概率”
。
2.设定条件概率(设定类别概率本身即可)。
3.通过获得的信息(生了女孩)中,排除掉所有不可能的情况。
4.关于剩余情况下的概率数值,恢复标准化条件。
5.获得有关类别的后验概率(贝叶斯逆概率)。
6.根据获得的信息,先验概率更新为后验概率(贝叶斯更新)。
7.先验概率和后验概率都是主观概率。
8.因为获得了各个类别(由概率来表现)的概率,通过将其平均化(求期待值),来求类别的平均值。
这正是第二胎为女孩的概率。
练习题
答案参见此处
本文将所有的先验概率都设定为均等数值,但这似乎不太妥当。
比起其他可能性,p=0.5的可能性显然更大。
因此,我们在此改变一下先前的设定,将先验概率分为以下三类:
类别p=0.4的概率→0.2
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!