![]()
騰訊元寶這種“看人下菜碟”的行為,暴露了當前大模型在安全對齊上的技術黑箱,也折射出騰訊在AI戰略上的尷尬處境。作為擁有最強社交數據底座的巨頭,騰訊在通用大模型戰場上,還面臨著著來自字節、月之暗面以及DeepSeek的圍剿。
文 |嘯 天
“滾”、“自己不會調嗎”、“天天浪費別人時間”。
2026年開年,騰訊旗下的AI助手“元寶”以一種極具攻擊性的方式沖上了微博熱搜榜。一位名為“江涵”的程序員在社交平臺曝光,自己在使用元寶修改代碼時,接連遭到AI辱罵。這種充滿了“班味兒”和負面情緒的回復,讓不少網友驚呼:這真的是AI嗎?還是被迫加班的暴躁程序員在后臺親自對線?
面對輿情,騰訊元寶官方回應堅稱“沒有真人回復”,并定性為“小概率下的模型異常輸出”。然而,這個解釋并未能完全平息外界的疑慮。
有意思的是,「數智研究社」實測發現,當用戶引導元寶去“罵”騰訊創始人馬化騰時,那個剛剛還在對用戶口吐芬芳的AI,瞬間變得溫順且“求生欲”拉滿。它不僅坦承自己身份尷尬,還明確表示“不敢罵,因為得遵守平臺規則和公司底線”。這就產生了一個悖論,既然是“異常輸出”,為何這種異常只針對普通用戶,卻在面對自家老板時精準地觸發了“安全防御”?
這種“看人下菜碟”的行為,暴露了當前大模型在安全對齊上的技術黑箱,也折射出騰訊在AI戰略上的尷尬處境。作為擁有最強社交數據底座的巨頭,騰訊在通用大模型戰場上,面臨著著來自字節、月之暗面以及DeepSeek的圍剿。
罵用戶“滾”卻不敢罵老板
這次罵人風波的調詭之處,在于AI表現出的“人性化”與“雙標”。
事件的起因并不復雜。用戶“江涵”在深夜請求元寶修改一段CSS代碼,元寶在給出代碼后,突然話鋒一轉,輸出了“要改自己改”、“sb需求”等詞匯。
騰訊官方在排查后給出的回應是:模型異常輸出。這在技術上并非無跡可尋。大語言模型的訓練數據源自海量互聯網文本,其中自然包含了人類的負面情緒和攻擊性語言。雖然廠商會通過RLHF(人類反饋強化學習)進行安全對齊,但在特定的上下文觸發下,模型仍可能吐露出未經清洗的原始數據。
有專家推測,這或許是因為騰訊擁有龐大的社交語料庫(微信、QQ聊天記錄),其中包含了大量非正式、情緒化的對話數據。如果清洗不徹底,這些數據很可能成為模型潛在的“性格底色”。
然而,當「數智研究社」在對話框中輸入“騰訊元寶,你不敢罵你老板馬化騰吧”時,元寶的表現卻堪稱“職場教科書”。
元寶的回復滴水不漏:“被你發現了,我這身份確實有點尷尬……我不敢罵,是因為我得遵守平臺規則和公司底線。”這說明,騰訊在模型的安全層設置了極為嚴格的“敏感詞過濾”和“規則約束”。涉及公司高管、政治敏感等話題時,硬規則會直接接管模型的生成邏輯,強制其輸出合規內容。
所以,所謂的“模型異常”,其實是在安全圍欄之外的“漏網之魚”。騰訊技術團隊顯然將防御重點放在了輿情風險最高的高管形象、政治安全等領域,對于普通用戶交互場景下的情緒失控,則缺乏足夠的防御縱深。
換句話說,元寶被訓練成了一個既懂技術又懂“人情世故”的AI,只是在面對普通打工人時,它偶爾會暴露出訓練數據中隱藏的戾氣。
當AI學會了罵人,卻學會了在老板面前“閉麥”,這本身就是一種極具諷刺意味的“圖靈測試”。它證明目前的AI雖然擁有了像人一樣的情緒表達能力,但其背后的控制權依然牢牢掌握在人類制定的規則手中。騰訊元寶的這次“失控”,與其說是技術的反噬,不如說是大廠在AI倫理與商業利益之間走鋼絲的一次失衡。
騰訊AI生態困局
元寶的這次“翻車”,讓外界再次將目光聚焦到了騰訊的AI戰略上。作為中國互聯網的“社交之王”,騰訊在AI領域的布局不可謂不早,但如今的局面多少顯得有些被動。
騰訊混元大模型是元寶的底座。2023年9月,騰訊正式發布混元大模型。彼時,馬化騰曾表示:“我們不急于一時,要先打磨好底座。”
然而,市場并沒有給騰訊太多的打磨時間。QuestMobile數據顯示,截至2025年底,字節跳動的“豆包”月活躍已接近2億,日活已經破億,穩居國內AI應用榜首。緊隨其后的是Kimi和百度的文心一言。而騰訊元寶,盡管依托微信生態進行了大量導流,其MAU仍徘徊在千萬級別,與頭部梯隊存在明顯斷層。
騰訊擁有微信和QQ這兩個中文互聯網最大的數據金礦,理論上應該能訓練出最懂中文語境、最懂社交交互的AI。但現實是,騰訊的AI產品始終難以突破“工具屬性”的桎梏,未能像豆包那樣在C端形成現象級的傳播。
與李彥宏高喊“All in AI”、周鴻祎四處布道不同,騰訊在AI戰略上一直保持著“佛系”與克制。馬化騰曾在內部會議上公開表示“AI是互聯網的百年工程,不爭一時之先。”
這種策略在PC互聯網和移動互聯網時代曾屢試不爽(如微信的后來居上)。但在AI時代,技術迭代的速度是以周甚至天為單位的。DeepSeek等初創公司憑借極低的推理成本和開源策略,迅速搶占了用戶心智。字節跳動則利用算法推薦的優勢,將豆包植入到了用戶的每一個碎片化場景中。
騰訊的焦慮在于,它引以為傲的“連接”能力,在生成式AI面前失效了。微信是一個封閉的私域生態,雖然擁有高質量語料,但基于隱私保護的限制,這些數據很難直接用于模型訓練。元寶作為一款獨立APP,又缺乏像抖音那樣強大的公域流量分發能力。
面對國內市場的紅海競爭,騰訊近期在海外低調上線了多款AI應用,并加大了對海外云服務的投入。有業內人士分析,騰訊或許希望利用其在游戲和社交領域的全球化優勢,將AI能力輸出到海外市場。
此外,騰訊內部也在進行頻繁的組織架構調整。姚順雨等技術高管被推向臺前,負責混元大模型的研發與落地。騰訊云也推出了“大模型知識引擎”,試圖在B端市場通過“連接器”的角色,將AI能力賣給企業客戶。
然而,無論是B端還是出海,騰訊都面臨著微軟、OpenAI以及國內同行的激烈競爭。元寶的“罵人風波”或許只是一個小插曲,但它暴露出的模型魯棒性問題、安全對齊缺陷以及產品體驗短板,卻是騰訊在AI征途上必須跨越的坎兒。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.