天才一秒记住【狂风中文网】地址:https://www.kfzw.net
她脑子里正在进行高速运算。
分层博弈。
局部纳什均衡先行收敛,再通过层间通信机制实现全局协调优化。
这个思路……
不是没有人提过。
早在三年前,mit的一篇预印论文里就有过类似的模糊构想。
但那篇论文的作者自己都在结论部分承认,分层后的层间信息损失问题无法解决,最终放弃了这个方向。
全世界的研究者看完那篇论文,也跟著放弃了。
但林墨刚才那句话——“十个组长坐一块开个会”
——这种大白话背后的逻辑,恰恰指向了一种全新的层间通信协议。
如果用博弈论的语言翻译过来:每个子群在完成局部纳什均衡后,只向上层传递压缩后的策略摘要,而非完整的状態空间信息。
信息损失?
根本不存在。
因为上层协调者需要的从来就不是完整信息,而是每个子群的决策倾向。
这就绕开了mit那篇论文的死胡同!
吕青璇握笔的指节泛白。
他说得对。
不是“可能对”
,是完全正確。
她在少年班跟导师做了两年的多智能体研究,啃了几百篇论文,参加了三次国际学术会议。
没有一个人,一个团队,给出过这么清晰的破局思路。
而这个答案,出自一个高考物理选择题全蒙c的男生之口。
用的还是“组长开会”
这种说法。
“你確定……这是你犯病的时候写的?”
“大概吧。
记不太清了。”
林墨摆了摆手,“你別当真,我犯病写的东西都是乱七八糟的,跟我清醒的时候没关係。
我连这个纳什什么均衡是啥都不知道。”
他说得轻描淡写。
吕青璇却一个字都轻描淡写不起来。
分层博弈框架。
局部纳什均衡优先收敛。
层间压缩策略通信。
这三个概念被一个不知道纳什均衡是什么的男生,用聊天的方式讲了出来。
她攥著笔,指尖微微发白。
不够。
这些还不够。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!