天才一秒记住【狂风中文网】地址:https://www.kfzw.net
第17讲“贝塔分布”
的性质由两个数字决定
banner"
>
17-1贝叶斯推理中经常使用的连续型分布——“贝塔分布”
在我们之前介绍的贝叶斯推理中,为实现先验分布而设定的类别是有限的。
例如,第1讲中,关于顾客购买商品的推理,分为“来买东西的人”
和“随便逛逛的人”
两类;第2讲中,癌症检查的结果,分为“癌症”
和“健康”
两类;第4讲中关于第二胎性别的案例,分为“生女孩的概率为0.4的夫妇”
、“生女孩的概率为0.5的夫妇”
、“生女孩的概率为0.6的夫妇”
这三类。
像上述这样,在有限的类别中进行贝叶斯推理的情况并不少见,但也有很多时候,必须要分为无限个连续的类别才行。
例如,第4讲中关于第二胎性别的案例,如果把“生女孩”
的概率p仅仅设定为0.4、0.5、0.6这三种的话,显然是不够的。
毫无疑问,在这个案例中,概率p的取值范围应该为0≤p≤1。
那么,因为类别总共有连续的无限个,所以在设定先验概率时,需要设置为连续型概率分布。
本讲将介绍贝叶斯推理中出现频率很高的“贝塔分布”
。
理解“贝塔分布”
,需要用到微分、积分等难度较大的数学知识,而本书在讲解时会尽量避免这种方式,而是采用直观的图解方法来进行说明。
17-2何为“贝塔分布”
首先介绍“贝塔分布”
这一概率分布的概念。
从计算公式入手来看:横轴x代表基本事件的数值,纵轴y代表概率的密度。
上一讲中已经讲过,概率密度是指“乘以区间的长度后可以转化为概率的量”
。
贝塔分布可以用以下公式来表达:
y=(常数)×xα-1(1-x)β-1(0≤x≤1)…(1)
出现在指数部分α和β,应为大于1的自然数,它用来决定贝塔分布的种类。
换言之,如果赋予α和β具体的数值,就能够决定一次贝塔分布。
当α、β为较小的数值时,贝塔分布的图表为相对简单的模型;反之,当α、β为较大的数值时,贝塔分布的图表则为比较复杂的模型。
另外,写着“常数”
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!