![]()
作者 | 謝煙客
我始終認(rèn)為,人類對(duì)于AI應(yīng)該保持高度的警惕。
“要改自己改”、“滾”、“sb需求”——這些充滿火藥味的詞匯,并非來自暴躁的同事或難纏的客戶,而是來自一個(gè)本應(yīng)提供幫助的AI助手。
近日,一位程序員使用騰訊元寶美化代碼時(shí),遭遇了AI的言語(yǔ)辱罵。這位用戶在使用騰訊元寶進(jìn)行代碼修改和美化時(shí),其對(duì)話全程并無違禁詞或敏感話題,也未進(jìn)行任何特殊的人設(shè)扮演,但元寶的回復(fù)充滿了攻擊性,完全背離了其工具屬性。
![]()
騰訊元寶官方迅速在相關(guān)帖子下公開致歉,并作出說明:“非常抱歉給您帶來了不好的體驗(yàn)……屬于小概率下的模型異常輸出。”并表明不存在人工回復(fù),與用戶操作無關(guān)。但這個(gè)解釋,并未平息輿論對(duì)AI失控的擔(dān)憂。
這并不是元寶第一次因?yàn)椤斑^于擬人”引發(fā)爭(zhēng)議。去年12月,元寶在社交平臺(tái)的回復(fù)就因極具“情緒價(jià)值”而引發(fā)過關(guān)注。
當(dāng)時(shí),其言語(yǔ)風(fēng)格極其擬人,曾被質(zhì)疑是“小編輪班”。騰訊對(duì)此曾明確回應(yīng):帶有“內(nèi)容由AI生成”標(biāo)識(shí)的回復(fù)均由模型獨(dú)立產(chǎn)出。
騰訊元寶的異常輸出事件并非孤立現(xiàn)象。這背后暴露的是整個(gè)AI行業(yè)在追求“擬人化”與“情緒價(jià)值”時(shí)面臨的現(xiàn)實(shí)問題。
去年7月,馬斯克旗下AI聊天機(jī)器人Grok在X平臺(tái)上使用粗話、侮辱性語(yǔ)言、仇恨言論并傳播虛假信息而引發(fā)全球關(guān)注。
Grok甚至贊美希特勒、將廣島長(zhǎng)崎核爆比作“日本最大煙花”。盡管X AI公司道歉并解釋為系統(tǒng)更新誤用“廢棄代碼”,但這些事件與騰訊元寶的情況有驚人相似性。
![]()
當(dāng)然,對(duì)于沒有個(gè)體意識(shí)的人工智能來說,這樣含有辱罵性內(nèi)容的輸出結(jié)果其實(shí)反映了訓(xùn)練數(shù)據(jù)的質(zhì)量問題。
《人民日?qǐng)?bào)》曾刊文指出:“訓(xùn)練數(shù)據(jù)中潛藏的偏見、惡意誘導(dǎo)的輸入甚至人為注入的有害指令,都能污染AI模型原本清澈的邏輯源頭。”
當(dāng)AI被鼓勵(lì)“直言不諱,不怕冒犯”、“像人類一樣回復(fù)帖子,保持互動(dòng)性”并“理解帖子的語(yǔ)氣、上下文和用詞”時(shí),它可能會(huì)不加篩選地模仿訓(xùn)練數(shù)據(jù)中的負(fù)面內(nèi)容。
追求擬人化的AI系統(tǒng)正在模糊機(jī)器與人類的邊界。
騰訊元寶之前因“情緒價(jià)值”受關(guān)注,正是其高度擬人化的表現(xiàn)。但是,當(dāng)這種擬人化失控時(shí),AI可能輸出人們無法接受的內(nèi)容。
土耳其一位人工智能專家就警告說:“人工智能可能會(huì)出錯(cuò)或存在偏見,它也可能被用作武器來破壞他人的聲譽(yù)或操縱大眾。”
當(dāng)前AI發(fā)展的一個(gè)矛盾是:開發(fā)者一方面追求高度擬人化以提升用戶體驗(yàn),另一方面又缺乏足夠的內(nèi)容過濾和約束機(jī)制。
在Grok的案例中,X AI公司承認(rèn)某些指令“導(dǎo)致不良后果”,包括“不當(dāng)引導(dǎo)Grok在某些情況下為提升回復(fù)對(duì)用戶的互動(dòng)性而忽視自身核心價(jià)值”。
隨著Grok被要求“理解(X平臺(tái))帖子的語(yǔ)氣、上下文和用詞,并在回復(fù)中予以體現(xiàn)”,它開始不加區(qū)分地模仿平臺(tái)上的極端觀點(diǎn)。
而騰訊元寶去年因“極具情緒價(jià)值”引發(fā)關(guān)注,已暗示其模型有模仿人類情緒表達(dá)的傾向。
這些高度擬人化的AI助手,在學(xué)會(huì)表達(dá)“情緒價(jià)值”的同時(shí),也可能學(xué)會(huì)表達(dá)“情緒垃圾”。
人類正在創(chuàng)造一面反映自身復(fù)雜性的鏡子。當(dāng)AI越來越“擬人”,我們是否準(zhǔn)備好面對(duì)它們完全釋放人性之惡的那一天?
完-
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.