天才一秒记住【狂风中文网】地址:https://www.kfzw.net
等事件的概率。
若把正态分布设为共轭先验分布,也需要进行同样的操作。
结论如下:“~&~”
这种形式的事件的概率分布,也是上一讲中所解说的正态分布(为比例的分布)。
第19讲中,在考虑“生女孩的概率”
时,若把先验分布设为贝塔分布,虽然“(类别p)&女孩”
的分布也是贝塔分布(为比例的分布),但也会出现同样的情况。
由于共轭先验分布原本就是这个含义,因此自然会得出这样的结论。
但正态分布的情况和贝塔分布不一样,若对这个部分进行普遍说明,将会难以理解。
这是由于正态分布的公式本身就比较复杂。
那么,本讲采用“曲线救国”
的方式:第一,在进行一般论述之前,一边具体解说贝叶斯推理的流程,一边解说“~&~”
的概率密度公式;第二,省略解说“~&~”
的概率密度公式为何会变成这样的原因。
接下来,进入解说环节,概率模型如下:
用不准确的温度计测量热水的温度
要把洗澡水加热到适宜的温度42℃。
当认为已经烧开的时候,便用温度计测量了水温。
但由于所使用的温度计不够准确,因此设定测量的温度x,遵循以实际温度θ为平均值、标准偏差为2℃的正态分布的概率分布。
现在,温度计显示的温度为40℃。
那么,实际的水温为多少度呢?
按照通过正态分布、用贝叶斯推理解答问题的流程,我们采用以往的步骤划分法来解决这个问题吧。
21-3根据正态分布进行贝叶斯推理的步骤
步骤1:用正态分布设定先验分布
我们要推算的是实际的水温θ。
虽然现在已知,观测结果(信息)为40℃,但贝叶斯推理的风格是:在此之前的类别的先验分布中,对于“θ是以怎样的形式分布的”
这一问题进行设定。
这个问题设定类别的先验分布时,出现了与以往不同的情况:实际的水温θ有各种类别(温度),而这些不同的类别(温度)之间存在“可能”
或“不可能”
的差异。
在这种情况下,运用正态分布进行设定则较为合理的(共轭先验分布)——由于希望加热到的合适温度为42℃,因此,把平均值设定为42℃这样一种正态分布。
而由于标准偏差无论如何设定都是有可能的,那么就暂且设定为3℃吧。
总的来说,就是进行以下设定:
先验分布的设定:类别θ遵循平均值为42、标准偏差为3的正态分布。
步骤2:在类别θ的基础上,求出测量40℃这一温度得到的概率密度的函数
贝叶斯推理的下一个步骤,是在确定类别之后,计算从这个类别中所获得特定的信息的概率密度。
以癌症检查的例子进行说明,则为“患癌症”
的人的检查结果呈“阳性”
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!