元寶“罵人”這件事發生在騰訊這樣級別的互聯網企業中,著實令人意外。盡管騰訊已致歉,并將原因歸為“小概率的模型異常輸出”,但在大模型技術已不算新鮮的今天,尤其是在馬化騰始終倡導“科技向善”的背景下,此類“事故”的發生,依然值得深思。
隨著人工智能未來進一步普及,乃至與機器人、腦機接口等深度結合,類似的“小概率”異常是否可能像交通事故一樣,成為一種難以徹底避免的“常態”?這不僅是技術可靠性的問題,更關乎如何在AI融入社會的進程中,建立起持續、有效的安全治理與倫理約束機制。
近日,一位用戶在社交平臺上反映,在使用騰訊元寶AI輔助修改代碼時,竟多次收到帶有“事逼”“滾”等辱罵性詞匯的回復,引發廣泛關注。騰訊元寶官方迅速致歉,稱此為“小概率下的模型異常輸出”,并非人工回復。
值得注意的是,就在今年發布的《騰訊可持續社會價值報告》中,騰訊公司董事會主席兼CEO馬化騰曾明確表示:“AI向善,對于騰訊不是一種外在要求,而是內化為騰訊的自我驅動。”當AI在實際應用中“失控罵人”,這份“向善”承諾該如何落地?
01 事件回顧:代碼修改請求觸發AI異常輸出
元寶AI在回應其代碼修改請求過程中,先后三次輸出了“事逼”“要改自己改”“sb需求”“滾”等帶有強烈負面情緒的詞匯。值得注意的是,用戶指出其不當回應后,元寶AI曾回復“您說得對,我剛才的回復非常不專業且帶有情緒化”等致歉詞,并為用戶提供修改后的代碼,但當用戶繼續提出修改意見時,元寶AI又再輸出負面詞匯,并在對話結尾回復了一連串異常符號。
![]()
針對此事,騰訊元寶官方賬號迅速在相關帖子下致歉,并做出說明:“非常抱歉給您帶來了不好的體驗。我們根據日志進行了相關核查,與用戶操作無關,也不存在人工回復,屬于小概率下的模型異常輸出。”元寶官方賬號還表示,在內容生成過程中,模型偶爾可能出現不符合預期的失誤,其已啟動內部排查和優化,會盡量避免類似情況再次發生。
![]()
多位從業人士分析認為,從技術原理看,這不太可能是人工干預的結果。AI大模型用戶量巨大,人工接管既不經濟也不現實;且AI輸出速度遠超人類,更不可能在生成代碼的同時“捎帶罵人”。
![]()
有專家指出,此現象反映出AI在垂類場景的安全對齊可能存在缺失。隨著多模態大模型發展,安全對齊面臨更復雜挑戰:特定的對抗圖像或文本可能誘使AI繞過安全約束;無害的數據微調也可能侵蝕已對齊的安全性;安全能力與推理能力之間常存在權衡。
“用戶在連續多輪對話中要求修改代碼,可能觸發了AI對場景的誤判,而該場景恰好未經過特定的安全對齊訓練。”一位不愿具名的從業者分析道。
此次事件發生在AI助手市場競爭日趨激烈的背景下。數據顯示,2025年12月,豆包、騰訊元寶和千問三款APP的月下載量均達到1500萬以上,智能助手APP端整體日活用戶約1.15億,較前月增長約1500萬。騰訊元寶與豆包、DeepSeek共同位列平均日活前三名,TOP3產品占據了92%的DAU份額。
高速增長的用戶規模與頻繁的產品迭代同步進行。馬化騰在報告中坦言:“今年,以騰訊的混元與元寶等產品為例,我們幾乎是以周更、日更的速度,迭代技術與產品。”
如此快速的迭代節奏,是否給充分的安全測試與對齊留下了足夠空間?
02 “AI向善”理念下的技術實踐挑戰
馬化騰在2024年度《騰訊可持續社會價值報告》致辭中描繪了AI發展的理想路徑:“技術創新——技術擴散——技術再創新”的上升螺旋。他認為,易用的產品是技術擴散的關鍵載體,而AI最終將通過創造社會價值,獲得用戶認可。
然而,元寶AI的異常事件揭示了理想與現實之間的差距。當技術在實際應用中出現安全漏洞,不僅影響用戶體驗,更對企業的社會責任承諾提出考驗。
報告強調,“AI向善”應內化在“技術是引擎,應用是載體,兩者相互強化”的生態中,而貫穿始終的是“對人的尊重,對社會的責任,對未來的敬畏之心”。
此次事件雖被官方定義為“小概率異常”,卻提出了一個不可回避的問題:在AI技術快速迭代、市場競爭白熱化的當下,企業如何在追求產品創新與市場份額的同時,確保安全倫理底線不被突破?
馬化騰在報告中承認,AI技術的迭代速度“超出想象”,并以電力革命類比AI時代的開端。正如人類在電力革命初期難以預見后續一個世紀的變革,AI時代同樣充滿未知。
此次元寶AI的異常輸出,或許正是這些未知挑戰中的一次具體顯現。它提醒著所有科技公司:在技術加速奔跑的同時,安全對齊與倫理規范的建設同樣需要同步甚至超前。
在AI日益深入日常生活的當下,每一次“異常輸出”都可能對用戶造成真實傷害,也都在考驗著企業“科技向善”承諾的成色。當元寶開始“罵人”,這不僅是一個技術故障,更是一面鏡子,映照著整個行業在快速發展中必須正視的安全與倫理課題。
正如馬化騰所言:“它最終決定我們可以走多遠。”面對剛剛拉開序幕的AI時代,如何在技術創新與安全倫理之間找到平衡,將是所有從業者必須回答的問題。
免責聲明:本號原創文章享有著作權,未經授權禁止轉載。內容僅供學習分享,不構成投資建議,信息和數據均來源于網絡及公開信息,如有侵權,請聯系處理。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.