狂风中文网

第11讲 掌握多条信息时的推理② 以垃圾邮件过滤器为例(第4页)

天才一秒记住【狂风中文网】地址:https://www.kfzw.net

上述两种情况下,共有8种可能性,每一种的概率分别列出,如图表11-8所示。

图表11-88种互不相同的可能性

图表11-8的左列(垃圾邮件列)对应图表11-7正中的概率表,右列(正常邮件列)对应图表11-7最下面的概率表。

在这里,请大家进一步确认一个问题:类别的概率0.5也要乘进去。

原因在于,它是异于独立性而存在的。

而这一点是条件概率的特征,具体的相关内容会在第15讲中进行讲解,此处暂且不多作讨论。

11-6从2个信息可以消去不可能的情况

在设定上述概率的前提下,过滤器对邮件进行扫描,通过检查是否附带“链接”

、是否含有“幽会”

一词这两个条件,来计算该邮件为垃圾邮件的概率。

图表11-8中共有8种可能性,而只有最上面的2种有可能是垃圾邮件的。

于是,留下最上面的2个,排除掉下面的6个,结果如图表11-9所示。

图表11-9扫描之后只剩下两种可能性

总之,过滤器所检查的邮件分为两种情况,一种是垃圾邮件(附带链接且含有“幽会”

),一种是正常邮件(附带链接且含有“幽会”

)。

两者的比例关系,也就是图中的概率之比。

因此,接下来通过标准化条件,可以计算出附带链接且含有“幽会”

一词时的后验概率。

(垃圾邮件的后验概率):(正常邮件的后验概率)

=0.5×0.6×0.4:0.5×0.2×0.05

=0.6×0.4:0.2×0.05

=0.24:0.01

=24:1

=2425:125

通过标准化条件运算,在附带链接且含有“幽会”

一词的情况下,(垃圾邮件的后验概率)=2425=0.96

假若在垃圾邮件过滤器上设定一种情况:如果垃圾邮件的后验概率超过0.95,就自动把它移到垃圾箱。

那么,在这种情况下,这封邮件就会被移动到垃圾箱,而不会出现在收件箱中。

在获得以上两条信息的前提下,通过贝叶斯推理的过程,如图表11-10所示。

图表11-10扫描之前与扫描两次之后

如图所示,使用2条信息推算出的结论,比起仅仅使用1条信息来推算,检索出垃圾邮件的概率会更高。

第11讲·小结

1.使用2条信息进行贝叶斯推理的方法与之前基本一致。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

帝王宠之萌后无双我真不是天王啊被绿后,我嫁给了渣男他哥众神世界恋综直播:顶流把影后按在墙角亲黑科技,从每日签到开始我比阿p还能整活佛系权爷动凡心我一个人的游戏世界全网都在求我跟影帝复合重生之御医我用阴阳师颠覆火影拜师九叔桃运神戒李白之前世今生重生成偏执霍少的小仙女妙木山的塔姆仙人永续之镜弃少归来我与诡异称兄道弟都市逍遥邪医木叶养猫人随身一个迷雾世界从废墟崛起重生之万界主宰