天才一秒记住【狂风中文网】地址:https://www.kfzw.net
由于这个面积不等于1,因此需要像之前一样,使用标准化条件,使其面积变为1。
这里需要注意的是,二次函数y=(常数)x2为α=3、β=1时的贝塔分布。
因此,满足标准化条件的后验分布为:(对于推理来说,“系数为3”
并不重要,故此处省略原因)。
y=3x2(0≤x≤1)
那么,根据上一讲中的公式,可以求出α=3、β=1的贝塔分布的期待值为:
图表19-6第二胎依然为女孩时的后验分布
19-4设定先验分布非均匀分布,并进行推理
如19-2中解说的那样,多数人认为,把“某对夫妇生女儿的概率”
的先验分布设定为均匀分布,并不十分恰当。
这是由于,一般来说很难认为当类别接近0或1时,与接近0.5时的情况是相同的;而最初的设定——接近0.5的类别容易发生,远离0.5的类别难以发生这样的思路则更为普遍。
最后,以这种情况为例来进行解说。
此时,可以将先验分布设定为α=2、β=2的贝塔分布。
正如第17讲中的解说,该分布为:(图表19-7)
y=6x(1-x)(0≤x≤1)
图表19-7非均匀贝塔分布的先验分布
在上述先验分布的情况下,离类别0.5越远,其概率密度越小。
此时,“类别x的夫妇生女孩”
的概率为:
p((类别x)&(女孩))
=p(类别x)×p(女孩|x)
=6x(1-x)×x
=6x2(1-x)
因此,实行标准化条件之后,从作为后验分布的贝塔分布中可以求出:(此处省略说明系数为12的理由)
z=12x2(1-x)
据此,这对夫妇第二胎依然为女孩的概率,可以从贝塔分布的期待值的公式(第18讲)
中推理得出,结果为0.6。
因此可以得出,相比于把均匀分布作为先验分布时(推算值约为0.67),推算出生女孩的概率的数值要更接近0.5一些的结论。
这个推理应该可以说服大多数人吧。
19-5在先验分布中运用贝塔分布的原因
读到这里,大家大概应该已经明白,为何把“某对夫妇生女孩的概率”
的贝叶斯推理中的先验分布设定为贝塔分布的原因了吧。
这是因为,后验分布也恰好为贝塔分布。
生女孩的概率是把类别x的概率密度乘以x,生男孩的概率是用类别x的概率密度乘以(1-x)计算出来的。
之后,把类别x的先验分布设定为贝塔分布,就知道后验分布也同样为贝塔分布了。
像这样,对于设定的概率模型,把后验分布设为与先验分布相同的分布,这样的先验分布称为“共轭先验分布”
。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!