第19讲在贝塔分布中使用概率分布图进行高级推理（第4页）

天才一秒记住【狂风中文网】地址：https://www.kfzw.net

由于这个面积不等于1，因此需要像之前一样，使用标准化条件，使其面积变为1。

这里需要注意的是，二次函数y＝（常数）x2为α＝3、β＝1时的贝塔分布。

因此，满足标准化条件的后验分布为：（对于推理来说，“系数为3”

并不重要，故此处省略原因）。

y＝3x2（0≤x≤1）

那么，根据上一讲中的公式，可以求出α＝3、β＝1的贝塔分布的期待值为：

图表19-6第二胎依然为女孩时的后验分布

19-4设定先验分布非均匀分布，并进行推理

如19-2中解说的那样，多数人认为，把“某对夫妇生女儿的概率”

的先验分布设定为均匀分布，并不十分恰当。

这是由于，一般来说很难认为当类别接近0或1时，与接近0.5时的情况是相同的；而最初的设定——接近0.5的类别容易发生，远离0.5的类别难以发生这样的思路则更为普遍。

最后，以这种情况为例来进行解说。

此时，可以将先验分布设定为α＝2、β＝2的贝塔分布。

正如第17讲中的解说，该分布为：（图表19-7）

y＝6x（1-x）（0≤x≤1）

图表19-7非均匀贝塔分布的先验分布

在上述先验分布的情况下，离类别0.5越远，其概率密度越小。

此时，“类别x的夫妇生女孩”

的概率为：

p（（类别x）＆（女孩））

＝p（类别x）×p（女孩|x）

＝6x（1-x）×x

＝6x2（1-x）

因此，实行标准化条件之后，从作为后验分布的贝塔分布中可以求出：（此处省略说明系数为12的理由）

z＝12x2（1-x）

据此，这对夫妇第二胎依然为女孩的概率，可以从贝塔分布的期待值的公式（第18讲）

中推理得出，结果为0.6。

因此可以得出，相比于把均匀分布作为先验分布时（推算值约为0.67），推算出生女孩的概率的数值要更接近0.5一些的结论。

这个推理应该可以说服大多数人吧。

19-5在先验分布中运用贝塔分布的原因

读到这里，大家大概应该已经明白，为何把“某对夫妇生女孩的概率”

的贝叶斯推理中的先验分布设定为贝塔分布的原因了吧。

这是因为，后验分布也恰好为贝塔分布。

生女孩的概率是把类别x的概率密度乘以x，生男孩的概率是用类别x的概率密度乘以（1-x）计算出来的。

之后，把类别x的先验分布设定为贝塔分布，就知道后验分布也同样为贝塔分布了。

像这样，对于设定的概率模型，把后验分布设为与先验分布相同的分布，这样的先验分布称为“共轭先验分布”

。

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

第19讲 在贝塔分布中使用概率分布图进行高级推理（第4页）