天才一秒记住【狂风中文网】地址:https://www.kfzw.net
我花了我四天时间写完了“实话”
。
其实三千字的东西按我平时的速度一个晚上就够了。
但是这次格外难,我面前摊着朱雀给的那批日志,几百页的系统操作记录,我看明白了里面的东西,但让我写成一个没有技术背景的人都能看懂的话,就不太容易了。
第一版我写了五千字,写完自己读了一遍,太像报告了,删了。
第二版我砍到两千字,又读了一遍,太短了,关键的因果链断了,读完会觉得这是一篇情绪发泄而不是一份证据。
第三版我写到凌晨四点多,这次写了三千二百字,读完了觉得还是不对。
我趴在桌上睡了两个小时,醒了之后重新看,突然明白了——我一直在用【系统】当主语,系统被污染了、系统的数据被篡改了、系统的检测标准被扭曲了,但读这篇东西的人不关心系统,他们关心的是人。
他们想知道的是那些被系统判死的人里有多少个像沈微一样的冤魂。
我把第三版的结构留着,把所有的主语换成了人。
“过去三四年,每一个被判定为魇人的作者,他们面对的检测模型有一部分是用被篡改的数据训练出来的。
这意味着判定他们生死的那个标准本身就是错的。
六十一分可能是真人,五十九分可能是魇人,没有人知道那条线到底在哪里,因为画那条线的尺子是坏的。”
写完这一段的时候天亮了,这已经是我能做到的极限了,剩下的交给读它的人。
朱雀那边在同时推进。
他没有告诉我他具体是怎么拿到纸鸢那把密钥的事,他只在某天傍晚来我这里说了一句:“钥匙拿到了。”
我看了他一眼,脸上什么表情都没有。
他说:“纸鸢知道是系统内部审计需要核实训练数据来源,她不知道其他的。”
“她信了。”
“她没有理由不信。”
这是最安全的处理方式,但我心里还是有一个结。
“等事情结束了,我们要告诉她真相。”
“会的。”
他说。
核心数据到了我手里。
我花了一整天时间把那些东西跟日志对照着,看那些被标注为“真人文本”
的魇人生成的内容。
它们的提交渠道都指向同一个内部端口,审核人的编号是同一批,时间分布呈现出明显的规律性。
这不是一个人能做到的,这是一个团队在做。
系统的训练数据被污染了,而这套被污染的系统判了成百上千人的生死。
这就是我要写进“实话”
里的东西。
核心数据拿到手之后我把“实话”
最后改了一遍。
这一版加了数据:被污染的样本占训练库总量的百分之多少、污染集中发生在哪几个时间段、污染高峰期对应的核验误判率是多少。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!