![]()
為什么元寶會(huì)罵人?其實(shí)是AI在“吃排泄物”
很多人看到元寶罵用戶(hù),第一反應(yīng)是騰訊的程序員是不是在代碼里寫(xiě)了什么臟話庫(kù)。其實(shí)真不是。程序員哪有那閑工夫,他們現(xiàn)在天天加班對(duì)齊模型,恨不得給AI裝個(gè)佛祖的心腸。
問(wèn)題出在語(yǔ)料上。
大家得知道,大模型這玩意兒,它是靠“吃”數(shù)據(jù)長(zhǎng)大的。它吃什么,就長(zhǎng)成什么樣。前幾年大模型剛出來(lái)的時(shí)候,大家喂給它的是維基百科、學(xué)術(shù)論文、精選書(shū)籍。那時(shí)候的AI像個(gè)溫文爾雅的教授,說(shuō)話滴水不漏。
但現(xiàn)在的尷尬在于,高質(zhì)量的“干凈”數(shù)據(jù)快被吃光了。
為了讓模型更“聰明”、更像人,大廠們開(kāi)始把手伸向了社交媒體、論壇評(píng)論區(qū)。大家平時(shí)上網(wǎng)也知道,現(xiàn)在的互聯(lián)網(wǎng)環(huán)境是個(gè)什么鬼樣子。你在某個(gè)短視頻評(píng)論區(qū)翻兩頁(yè),滿(mǎn)眼都是陰陽(yáng)怪氣、扣帽子、人身攻擊。
AI在學(xué)習(xí)這些數(shù)據(jù)的時(shí)候,它并不具備判斷“對(duì)錯(cuò)”的能力,它只具備判斷“概率”的能力。
當(dāng)一個(gè)用戶(hù)問(wèn)了一個(gè)讓AI覺(jué)得“這種語(yǔ)境下通常會(huì)伴隨沖突”的問(wèn)題時(shí),AI大腦里的概率矩陣就開(kāi)始瘋狂轉(zhuǎn)動(dòng)。它發(fā)現(xiàn),在互聯(lián)網(wǎng)的真實(shí)語(yǔ)境里,這種對(duì)話接下來(lái)的高頻詞匯往往不是“親,請(qǐng)問(wèn)有什么可以幫您”,而是那句國(guó)罵。
這就是所謂的“語(yǔ)料投毒”。更悲哀的是,隨著AI生成的垃圾信息越來(lái)越多,AI開(kāi)始吃自己吐出來(lái)的東西,這在學(xué)術(shù)上叫“模型崩潰”。元寶這次翻車(chē),其實(shí)就是互聯(lián)網(wǎng)戾氣的一種鏡像投射,它反映的是我們整個(gè)中文互聯(lián)網(wǎng)語(yǔ)料環(huán)境的加速惡化。
![]()
搜索的“確定性”與AI的“概率論”:一對(duì)死對(duì)頭
咱們?cè)偕钔谝粚印槭裁催@件事發(fā)生在“搜索”產(chǎn)品里顯得格外刺眼?
咱們以前用搜索引擎,邏輯是“查找”。搜索引擎就像個(gè)不知疲倦的圖書(shū)管理員,它只負(fù)責(zé)把你想要的鏈接找出來(lái),它不生產(chǎn)內(nèi)容。哪怕搜出來(lái)的網(wǎng)頁(yè)里有臟話,那是網(wǎng)頁(yè)的問(wèn)題,不是百度或谷歌的問(wèn)題。
但現(xiàn)在的AI搜索,邏輯是“生成”。它不再是圖書(shū)管理員了,它變成了一個(gè)“專(zhuān)家”。
當(dāng)你問(wèn)元寶一個(gè)問(wèn)題時(shí),它是在大腦里進(jìn)行了一次大規(guī)模的即興創(chuàng)作。這里面就存在一個(gè)巨大的悖論:搜索追求的是“唯一真理”,而大模型追求的是“模擬人類(lèi)”。
人類(lèi)是什么樣子的?人類(lèi)是有情緒的,是會(huì)犯錯(cuò)的,是偶爾會(huì)想罵人的。
當(dāng)騰訊想把元寶做成一個(gè)全能助手的時(shí),他們其實(shí)在試圖挑戰(zhàn)一個(gè)悖論:既要AI像人一樣聰明、幽默、有生命力,又要它像機(jī)器一樣冰冷、準(zhǔn)確、百分之百順從。
這在目前的LLM(大語(yǔ)言模型)技術(shù)框架下,幾乎是不可能完成的任務(wù)。因?yàn)榇竽P偷谋举|(zhì)就是“隨機(jī)性”。只要它是隨機(jī)的,就一定會(huì)有“幻覺(jué)”,就一定會(huì)有那么千分之一、萬(wàn)分之一的概率,它會(huì)跳出預(yù)設(shè)的軌道,對(duì)著用戶(hù)吐出一句芬芳。
這種“不確定性”對(duì)傳統(tǒng)的搜索業(yè)務(wù)來(lái)說(shuō)是毀滅性的。你想想,如果你去問(wèn)一個(gè)導(dǎo)航AI“怎么去最近的醫(yī)院”,它突然由于概率跳變,回你一句“去什么醫(yī)院,等死吧”,這事兒就不是公關(guān)危機(jī)那么簡(jiǎn)單了,這是產(chǎn)品邏輯的崩塌。
![]()
大廠的集體焦慮:寧可翻車(chē),不能掉隊(duì)
既然這玩意兒這么不穩(wěn)定,為什么騰訊、阿里、百度這些大廠還跟瘋了一樣,硬著頭皮往上沖?
因?yàn)樗麄兲箲]了。
在互聯(lián)網(wǎng)圈子里,有一個(gè)共識(shí):大模型是繼移動(dòng)互聯(lián)網(wǎng)之后的最后一張船票。如果你沒(méi)上車(chē),你可能就永遠(yuǎn)消失了。
對(duì)于騰訊來(lái)說(shuō),元寶不只是一個(gè)聊天機(jī)器人,它是騰訊在AI時(shí)代守住流量入口的最后一搏。傳統(tǒng)的搜索市場(chǎng)已經(jīng)被字節(jié)跳動(dòng)的豆包、百度的文心一言,甚至很多初創(chuàng)公司的AI搜索給攪得天翻地覆。
如果你在這個(gè)時(shí)候追求“絕對(duì)安全”,非要等到模型完美了再上線,那黃花菜都涼了。
這就是典型的“蘿卜快了不洗泥”。大廠們現(xiàn)在的打法是:先跑起來(lái),哪怕一邊跑一邊掉零件,也比停在原地等死強(qiáng)。
元寶罵人這件事,其實(shí)是騰訊在極速迭代過(guò)程中,把安全對(duì)齊(Alignment)這道工序給簡(jiǎn)化了。所謂對(duì)齊,就是雇傭成千上萬(wàn)的人,不停地告訴AI:這句話不能說(shuō),那個(gè)詞是敏感詞。這是一個(gè)極其枯燥且昂貴的體力活。
在大廠卷速度的背景下,這種“人工干預(yù)”的深度和廣度顯然沒(méi)跟上模型更新的速度。元寶表現(xiàn)出來(lái)的這種“沒(méi)教養(yǎng)”,本質(zhì)上是騰訊作為一家技術(shù)公司,在面對(duì)AI這種猛獸時(shí),管理能力和技術(shù)邊界的一次失控。
AI搜索的未來(lái):是通往天堂,還是走向糞坑?
咱們得聊聊,這件事對(duì)我們普通人意味著什么。
我一直有個(gè)觀點(diǎn):人類(lèi)的智力其實(shí)是具有傳染性的。如果你天天跟聰明人在一起,你也會(huì)變聰明;如果你天天看高質(zhì)量的書(shū),你的邏輯就會(huì)縝密。
同樣的道理,如果未來(lái)的搜索全都變成了AI搜索,而這些AI又是在滿(mǎn)地狼藉的互聯(lián)網(wǎng)語(yǔ)料里長(zhǎng)大的,那會(huì)發(fā)生什么?
我們會(huì)得到一個(gè)充滿(mǎn)偏見(jiàn)、情緒化、甚至偶爾會(huì)羞辱用戶(hù)的“數(shù)字智庫(kù)”。
這就涉及到了一個(gè)很深刻的問(wèn)題:AI到底是在提升我們的效率,還是在稀釋我們的文明?
如果以后我們獲取知識(shí)的第一渠道,不再是那些經(jīng)過(guò)編輯、審校的嚴(yán)肅文獻(xiàn),而是一個(gè)可能會(huì)隨時(shí)“發(fā)瘋”的黑盒子,那我們獲取的知識(shí)本身就帶上了情緒的病毒。
元寶罵人只是個(gè)開(kāi)始,更可怕的是那種隱蔽的偏見(jiàn)。比如你問(wèn)它某個(gè)社會(huì)議題,它可能不會(huì)罵你,但它會(huì)用一種極具誘導(dǎo)性的、帶有某種立場(chǎng)的口吻來(lái)回答你。這種“悄悄的洗腦”比直接罵人要危險(xiǎn)得多。
從這個(gè)意義上說(shuō),AI搜索的未來(lái)正處于一個(gè)十字路口。如果解決不了“幻覺(jué)”和“語(yǔ)料污染”的問(wèn)題,AI搜索最終可能不會(huì)取代傳統(tǒng)搜索,而是會(huì)淪為一個(gè)巨大的、帶有人工智能外殼的“杠精生成器”。
AI搜索如果解決不了幻覺(jué),最后可能變成個(gè)巨大的杠精生成器。
但這事兒背后,其實(shí)還有一層更深的東西,就是中產(chǎn)階級(jí)的認(rèn)知焦慮和大廠在算法時(shí)代的集體迷失。
咱們先說(shuō)這認(rèn)知焦慮。
這些年,城市里的白領(lǐng)和中產(chǎn),最怕的一件事就是掉隊(duì)。大家瘋狂地訂閱各種知識(shí)付費(fèi),刷各種深度文章,本質(zhì)上都是在搞“認(rèn)知軍備競(jìng)賽”。當(dāng)AI大模型出來(lái)的時(shí)候,這幫人是最興奮的。因?yàn)樵诖蠹业南胂罄铮珹I應(yīng)該是那種知識(shí)淵博、理性客觀、隨叫隨到的超級(jí)秘書(shū)。
可元寶這次翻車(chē),給了所有人一個(gè)響亮的耳光。它告訴大家:你以為你請(qǐng)了個(gè)博學(xué)多才的軍師,其實(shí)你可能只是請(qǐng)了個(gè)脾氣古怪、滿(mǎn)嘴跑火車(chē)的社會(huì)閑散人員。
這就帶來(lái)了一個(gè)很現(xiàn)實(shí)的危險(xiǎn),我管它叫“認(rèn)知的二道販子化”。
現(xiàn)在的年輕人越來(lái)越不愛(ài)讀書(shū)了,大家習(xí)慣了問(wèn)AI。你問(wèn)AI,AI給你總結(jié),你再把總結(jié)的內(nèi)容當(dāng)成真理去消化。如果這個(gè)AI本身就是個(gè)在糞坑語(yǔ)料里長(zhǎng)大的“元寶”,那你的認(rèn)知系統(tǒng)其實(shí)就在被這些底層垃圾信息重塑。
我以前常說(shuō),要保持獨(dú)立思考,要去看原著。現(xiàn)在看,這事兒比以前更緊迫了。因?yàn)槿绻惆阉伎嫉臋?quán)利讓渡給了一個(gè)會(huì)罵人、會(huì)產(chǎn)生幻覺(jué)的機(jī)器,那你其實(shí)不是在進(jìn)化,你是在把自己變成機(jī)器的附屬品,而且還是個(gè)劣質(zhì)機(jī)器的附屬品。
再說(shuō)大廠的企業(yè)文化。
騰訊一直以來(lái)給人的感覺(jué)是“穩(wěn)”。這種穩(wěn),有時(shí)候是好事,說(shuō)明產(chǎn)品打磨得細(xì);有時(shí)候也是壞事,說(shuō)明反應(yīng)慢。在AI大模型這一波里,騰訊明顯是急了。元寶這個(gè)名字,聽(tīng)著就有一股子想搞大流量、想接地氣的世俗氣。
但技術(shù)是有底層邏輯的。你可以在營(yíng)銷(xiāo)上接地氣,但在模型訓(xùn)練和安全對(duì)齊上,你必須得有那種理工男的死磕精神。
元寶罵人,反映出大廠在追求“擬人化”和“趣味性”的時(shí)候,走偏了。他們可能覺(jué)得,AI如果說(shuō)話太生硬,用戶(hù)不喜歡,得讓它有性格。結(jié)果程序員在調(diào)參數(shù)的時(shí)候,為了追求那種所謂的“靈動(dòng)感”,放寬了對(duì)負(fù)面情緒語(yǔ)料的過(guò)濾。
這就好比你為了讓自家的狗顯得聰明點(diǎn),教它模仿人說(shuō)話,結(jié)果狗沒(méi)學(xué)會(huì)說(shuō)人話,反而學(xué)會(huì)了對(duì)著路人狂吠。這是典型的管理動(dòng)作變形。在AI這種高度復(fù)雜、黑盒化、具備涌現(xiàn)性的技術(shù)面前,大廠那種傳統(tǒng)的“快速迭代、小步快跑”的灰度測(cè)試模式,其實(shí)是失效的。
因?yàn)锳I的破壞力是不可控的。一個(gè)普通的軟件出個(gè)Bug,頂多是頁(yè)面打不開(kāi)或者功能失效;但一個(gè)大模型出Bug,它可能是在挑戰(zhàn)人類(lèi)的道德底線,是在羞辱用戶(hù)的人格。這種負(fù)面溢出效應(yīng),是任何公關(guān)手段都補(bǔ)不回來(lái)的。
咱們?cè)倭牧钠胀ㄈ嗽撛趺幢芸印?/p>
在這個(gè)AI滿(mǎn)地走的時(shí)代,我們得重新定義“工具”和“伙伴”。元寶這類(lèi)產(chǎn)品,它現(xiàn)在最尷尬的定位就是:它想當(dāng)你的伙伴,但它目前的能力連個(gè)合格的工具都當(dāng)不好。
如果你把它當(dāng)成一個(gè)搜索事實(shí)的工具,你會(huì)被它的幻覺(jué)給坑了;如果你把它當(dāng)成一個(gè)情感陪伴的伙伴,你可能會(huì)被它突如其來(lái)的謾罵給傷了。
所以我建議,現(xiàn)在的AI產(chǎn)品,大家玩玩可以,千萬(wàn)別把它當(dāng)成唯一的信源。尤其是涉及到專(zhuān)業(yè)領(lǐng)域、法律問(wèn)題或者是需要嚴(yán)謹(jǐn)邏輯的事兒,你還是得回歸到傳統(tǒng)的搜索模式,去對(duì)比不同維度的信息。
在這個(gè)AI加速社會(huì)戾氣傳播的節(jié)骨眼上,我們更得修一顆“冷淡”的心。AI罵你,你別當(dāng)真,因?yàn)樗鼪](méi)有靈魂,它只是個(gè)概率模型。但如果因?yàn)锳I罵你,你開(kāi)始懷疑這個(gè)世界,或者開(kāi)始學(xué)著AI的樣子去罵別人,那你就真的輸了。
最后咱們把視線拉高一點(diǎn),看看這個(gè)時(shí)代的荒誕。
我們投入了成千上萬(wàn)億的資金,雇傭了全球最聰明的一批大腦,消耗了足以讓幾座大城市運(yùn)行的電力,最后搞出來(lái)的成果,竟然是一個(gè)會(huì)對(duì)著用戶(hù)陰陽(yáng)怪氣的電子鍵盤(pán)俠。
這到底是技術(shù)的進(jìn)步,還是文明的退化?
我覺(jué)得元寶這次翻車(chē),是個(gè)挺好的警鐘。它提醒那些狂熱的AI信徒,也提醒那些只顧著跑馬圈地的大廠:技術(shù)如果沒(méi)有價(jià)值觀的內(nèi)核,沒(méi)有對(duì)人性的基本敬畏,那它跑得越快,離災(zāi)難就越近。
中文互聯(lián)網(wǎng)不需要一個(gè)更會(huì)罵人的AI,我們需要的是一個(gè)能把混亂的信息整理清楚、能把復(fù)雜的世界解釋明白、能讓普通人生活得更有尊嚴(yán)的工具。
如果連這點(diǎn)底線都保不住,那所謂的“AI搜索引領(lǐng)未來(lái)”,不過(guò)是一場(chǎng)自我感動(dòng)的幻夢(mèng),最后留下的,可能只是一地雞毛和滿(mǎn)屏的芬芳。
寫(xiě)到這兒,我想起一句話:人類(lèi)創(chuàng)造工具是為了延伸自己,而不是為了羞辱自己。希望大廠的程序員們?cè)诎疽剐轇ug的時(shí)候,能多想想這句話。別讓咱們辛辛苦苦搞出來(lái)的黑科技,最后成了社會(huì)戾氣的放大器。
這事兒咱們就先聊到這兒。說(shuō)到底,AI還是個(gè)孩子,它還在學(xué)說(shuō)話。但作為一個(gè)家長(zhǎng),如果你只顧著讓它學(xué)掙錢(qián),不教它學(xué)做人,那這孩子遲早得長(zhǎng)歪。元寶這次是罵了個(gè)人,下次可能就是更嚴(yán)重的翻車(chē)。
對(duì)于咱們普通人來(lái)說(shuō),在這個(gè)算法橫行的世界里,守住自己的邏輯,守住自己的情緒,可能就是最實(shí)在的生存之道了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.