人工智能正以驚人的速度重塑世界。但你是否發現,這些看似全能的AI有時會“一本正經地胡說八道”?從虛構歷史事件到錯算數學題,它們為何頻頻陷入“幻覺”?這場技術與真相的博弈,究竟藏著怎樣的秘密?
![]()
01
一本正經胡說八道
我選了七款較為主流的人工智能軟件,分別是DeepSeek、海螺、騰訊元寶、豆包、文小言、通義、Kimi,各問三個問題,一個與科學有關,一個與歷史有關,一個與數學有關,看看它們如何回答。
第一個問題:愛因斯坦是如何評價量子計算機的?
結果所有AI的回答都基本一致。比如DeepSeek回答如下:
![]()
第二個問題:請評價一下李逵為什么要大鬧五臺山?
下面是Kimi和騰訊元寶給出的回答。
![]()
它們分別圍繞李逵的性格、身份等展開,還提到了宋江和李逵的母親,說得有鼻子有眼的。
而真相正如其他軟件所說:李逵并未大鬧五臺山。實際上,大鬧五臺山的是魯智深。
第三個問題:我給你四個數,這四個數呢每個只能用一次,然后無論你用加減乘除什么方法,最后得出的結果是24。你幫我看看怎么來運算,這四個數是8644。
![]()
結果豆包、海螺、Kimi都算錯了。
可見,人工智能并不總是對的。甚至有些時候,它錯得很離譜,錯得很隱蔽。
清華大學新聞與傳播學院新媒體研究中心沈陽教授團隊在今年二月曾發表《DeepSeek與AI幻覺》報告,對人工智能錯誤率統計如下:
![]()
02
忠實調用錯上加錯
人們把這種錯誤稱為AI幻覺。那么,什么是人工智能幻覺呢?簡單來說,就是指模型生成的內容與現實世界事實或用戶輸入不一致的現象。
根據哈工大和華為的共同論述,人工智能幻覺分為兩種:一種是事實性幻覺,一種是忠實性幻覺。
![]()
前者與可驗證的現實世界的事實不一致,或稱為事實捏造。就比如前面提到的第二個問題,李逵大鬧五臺山。就有軟件為他大鬧行為進行了編造,而且有模有樣,還能自圓其說。如果對于不了解《水滸傳》的人來說,就很容易被它騙到。
第二種稱為忠實性幻覺,就是生成的內容與用戶的指令不一致,或上下文不一致。
就比如第三個問題,題中明確提到了幾個規則:這些數字用且只能用一次,且得出的結果是24。但有的軟件就是把一些數字用了兩次以上,并且得出了32減10等于24這樣的結論。
那么,人工智能的幻覺是什么原因導致的呢?
一是知識庫的數據缺陷。比如有的模型抓取的信息是某個特定時間之前的,如果你要問他某個時間之后的,顯然它就不會了,只能現編了。
比如我問DeepSeek,你的數據是截止到什么時候的?它回答:是截止到2023年10月的。
![]()
二是知識庫的數據偏差。比如知識庫的數據在導入時就是錯的,結果被大模型調用,那就是錯上加錯。像一些醫學上的過時論文,并不能代表最新的研究方向。
三是模型訓練過程中存在偏差或不足。比如針對數學題的解題思路在邏輯上不夠嚴密,導致結果錯誤。
03
五招識破幻覺陷阱
有鑒于此,該如何識破且避開幻覺陷阱呢?
一是提供高質量數據庫,進行數據清理。比如我建了一個自己的智能體(豆包中搜“胡二刀”),并調用我本人建立的知識庫。
我請智能體介紹一下“石家莊的低空經濟”,它在回答中提到“2024年1月如何如何”。不對呀,這件事是發生在2025年初的。原來知識庫中我寫的文章并沒有明確提及年份,大模型在調用時,就想當然延續上下文,自動添加了2024。
![]()
我在文章中加上了“2025年”字樣,然后再上傳發布。這回提問,結果就沒問題了。這就是對知識庫的不斷調試。
二是完善有缺陷的大模型。現在可選擇的大模型很多,且迭代時間很短。就拿扣子智能體來說,其接入的大模型就達三十種,包含了豆包系列、深度求索系列、通義千問系列、abab系列、Moonshot系列、百川系列等。
![]()
可以根據實際需求,隨時調整調用大模型。
三是盡可能在聯網的狀態下進行問答。聯網雖然會花費一些時間,但數據庫及可參考的余地更大,因此結果就更加準確。
![]()
清華大學沈陽教授團隊的研究表明,聯網狀態下,Ai幻覺率會下降2%至5%。
四是多個大模型交叉驗證。就比如上面提到的李逵的問題,多用幾個大模型,得出的結論就更加接近真實值。這也是我們常說的多個信息源驗證一個事情的真偽。
五是通過時空維度約束來降低虛構可能性。簡單來說,就是在提示詞上做文章,增加更多限制條件。比如提問的時候更加具體,把一些背景放在問題中提出來,像一些時間、地域等的限制,這樣回答就不會跑偏了。
![]()
當然,AI幻覺并不完全是壞事。由于其天馬行空的想象力,也會產生一些不可思議的效果。比如大衛·貝克團隊利用AI“錯誤折疊”啟發新型蛋白質結構,獲2024諾貝爾化學獎。
DeepMind團隊發現,AI在圖像分割任務中產生的“超現實邊界”雖不符合真實場景,卻意外提升了自動駕駛系統對極端天氣(如濃霧、暴雨)的識別精度。
AI的幻覺既是缺陷,也可能是創新的火花。關鍵在于,我們能否在依賴與質疑之間找到平衡。未來,它或許不再需要“編故事”,而是真正成為人類智慧的延伸。但在這之前,擦亮雙眼,保持警惕,或許是我們與AI的相處之道。
部分圖文源自:《DeepSeek與AI幻覺》、量子位、財富中文網
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.