天才一秒记住【狂风中文网】地址:https://www.kfzw.net
“自然语言,”
他在文档上敲下第一个标题,“无论中文、英文,还是任何人类语种,都有一个与生俱来的‘原罪’。”
他的思绪回到自己深耕十年的sap领域,那些庞大而严谨的系统,最终都依赖人来输入数据,而人,使用语言。
“这个原罪就是:语言所指代的,并非真正的‘实物’或‘意义本身’,而是一个被社会群体强制定义、约定俗成的‘含义’!”
语言、文字,其实是一套符号系统,这是当初在北京做项目时,偷师学到的。
张伟回忆起当时教授的讲课:“看,中文的‘山’,发音是‘shān’,字形是三个竖线加一个基座;英文的‘ounta’,发音完全不同,字形更是风马牛不相及。
但是,它们指向的是同一个客观存在——那个在地球表面隆起的、高大稳固的地貌实体。”
“‘山’≠山本身!
‘ounta’≠山本身!”
教授用力敲下这两个不等式。
“它们都只是符号,是标签,是任意的指代。
实物、文字、语音,这三者之间在物理上本无任何必然联系,是人类文明用数千年的时间,强行将这三者捆绑在一起的,赋予了它们共同的‘意义’。”
“而我们的人脑,在处理语言时,有一个专门的区域负责这种‘翻译’工作,它将内在的‘意思’或脑海中的‘意象’,转换成特定的语音波动或文字形状输出,同时将接收到的语音文字,再‘翻译’回内在的‘意思’。
我们输入输出的,从来不是‘意义实体’本身,而是它‘指代’的文字或语音!”
张伟大脑犹如被注入一股神秘的力量,感觉一扇通往底层逻辑的大门被瞬间推开:“所以,自然语言不是‘意义本体’,它只是一套庞大而精巧的‘指代体系’、‘一套符号系统’!”
“而现在的ai,基于transforr架构的大语言模型,它的全部养料就是人类产生的海量自然语言语料。
它学习的,不是‘山’这个实体为何物,不是它的地质构成、生态分布,而是‘山’这个字符、这个符号,在数以亿计的文本中,与‘高’、‘水’、‘攀登’、‘稳重’等等其他字符之间的统计关联性和共现概率!”
“transforr不是在理解世界,它只是在理解和模仿‘人类定义和描述世界的方式’!”
这个结论让张伟感到一阵战栗。
ai被困在了一个由人类编织的、名为“语言”
的符号牢笼里。
它能模仿理解,因为它学习了所有模仿的套路;但它永远无法“自证”
理解,因为它从未触及理解的对象本身。
张伟脑海中,浮现出一幅生动的图景:无数词汇、字符、标签,如同拥有生命般在空中漂浮、缠绕、编织,最终形成一个巨大无比、密不透风的茧。
ai就在这个茧的中心,它透过符号的丝线观察世界,以为看到了全部,实际上看到的只是符号与符号之间的关系网络。
“符号茧房……”
张伟低声念出这个词。
这是比“信息茧房”
更底层、更可怕的禁锢。
“信息茧房只是让你看到你想看的,而符号茧房,从根本上决定了你‘能’看到什么——你只能看到符号,以及符号的排列组合。”
张伟意识到,之前担忧的“智慧茧房”
,其根源正是这个“符号茧房”
。
当最顶尖的智慧工具,其思考的基石只是符号的概率游戏时,整个文明的智慧上限,似乎也被隐隐锁定了。
思维继续深入,张伟开始比较起不同的语言体系:“英语这类表音文字,字形本身没有意义,只是记录语音的符号,语音承载了全部意义。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!