天才一秒记住【狂风中文网】地址:https://www.kfzw.net
关于类别x(x为某对夫妇生女孩的概率)的先验分布,设定如下:
y=1(0≤x≤1)
在图表19-1中,先验分布即为x轴上方的部分。
图表19-1类别为均匀分布的情况
接下来,x轴的下方的长方形,可以对应第4讲的图表4-3的长方形分割图,也就是划分出互不相同的几种可能性。
在图表4-3中,划分了6个长方形,但在图表19-1中,划分为无数条线段(AB或BC即为其中的1条)。
从有限变成无限的情形,如图表19-2所示。
图表19-2从有限到无限
那么,接下来可以这样分析图表19-1:例如,图中的x=0.7(点A)表示该夫妇的类别为0.7,换言之,表示“这对夫妇生女孩的概率”
为0.7这样一种可能性。
因此,这对夫妇生的第一胎为女孩(这样一种可能性)的概率密度为0.7,用线段AB来表示。
那么,生男孩的概率密度自然为0.3,用线段BC的长度来表示。
实际上,这里采用了“&的事件的概率法则”
(见15-3)。
换言之,表示为:
(AB的长度)=(类别是x=0.7的概率密度)×(类别在x=0.7的基础上,生女孩的概率)
=(x=0.7时的y)×p(女孩|x=0.7)
=1×0.7
=0.7
在19-3之后,这个问题将成为基本的知识点。
假设我们获得了“这对夫妇生的第一胎为女孩”
这样一条信息吧。
那么,就可以把图表19-1中涂有颜色中的浅色部分的线段(生男孩的可能性)排除在外,只留下涂有颜色中的深色部分的线段(生女孩的可能性),如图表19-3所示。
图表19-3排除生男孩的可能性
排除掉生男孩后的可能性之后,便不符合标准化条件(所有事件的概率之和为1)了。
由于表示生女孩这种可能性(涂有颜色的深色部分的三角形)的面积为0.5,那么,为了把它的面积变为1,需要在保持各线段的比例关系的同时,变更概率密度。
只要把每条线段延长到之前的2倍,就能满足标准化条件了(三角形的高度变为之前的2倍)。
图表19-3的右侧部分,表示这一步骤完成之后的状态——把左侧的x轴下方的部分翻转过来,再纵向延伸到之前长度的2倍。
需要注意的是,右侧部分的图像即为贝塔分布的α=2、β=1的情况(见17-4)。
这个是在获得了“该夫妇生的第一胎是女孩”
这条信息时,关于这对夫妇的类别x的后验分布。
同时还需注意的是,它表示的不是后验概率,而是后验分布。
这是因为,分布图表示的是概率密度。
后验分布如图表19-4所示。
图表19-4先验分布和后验分布
看图可知,虽然关于该夫妇生第一胎之前的类别x的先验分布,为均匀分布(无论哪种类别x,结果都是相同的)。
但在获得了“第一胎为女孩”
的信息之后,关于类别x的后验分布,就变更为z=2x这样的贝塔分布了。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!