網易首頁 > 網易號 > 正文申請入駐

AI也會說謊？五招教你識破人工智能的幻覺陷阱

2025-03-10 17:17:17　來源: 胡二刀

河北舉報

分享至

人工智能正以驚人的速度重塑世界。但你是否發現，這些看似全能的AI有時會“一本正經地胡說八道”？從虛構歷史事件到錯算數學題，它們為何頻頻陷入“幻覺”？這場技術與真相的博弈，究竟藏著怎樣的秘密？

一本正經胡說八道

我選了七款較為主流的人工智能軟件，分別是DeepSeek、海螺、騰訊元寶、豆包、文小言、通義、Kimi,各問三個問題，一個與科學有關，一個與歷史有關，一個與數學有關，看看它們如何回答。

第一個問題：愛因斯坦是如何評價量子計算機的？

結果所有AI的回答都基本一致。比如DeepSeek回答如下：

第二個問題：請評價一下李逵為什么要大鬧五臺山？

下面是Kimi和騰訊元寶給出的回答。

它們分別圍繞李逵的性格、身份等展開，還提到了宋江和李逵的母親，說得有鼻子有眼的。

而真相正如其他軟件所說：李逵并未大鬧五臺山。實際上，大鬧五臺山的是魯智深。

第三個問題：我給你四個數，這四個數呢每個只能用一次，然后無論你用加減乘除什么方法，最后得出的結果是24。你幫我看看怎么來運算，這四個數是8644。

結果豆包、海螺、Kimi都算錯了。

可見，人工智能并不總是對的。甚至有些時候，它錯得很離譜，錯得很隱蔽。

清華大學新聞與傳播學院新媒體研究中心沈陽教授團隊在今年二月曾發表《DeepSeek與AI幻覺》報告，對人工智能錯誤率統計如下：

忠實調用錯上加錯

人們把這種錯誤稱為AI幻覺。那么，什么是人工智能幻覺呢？簡單來說，就是指模型生成的內容與現實世界事實或用戶輸入不一致的現象。

根據哈工大和華為的共同論述，人工智能幻覺分為兩種：一種是事實性幻覺，一種是忠實性幻覺。

前者與可驗證的現實世界的事實不一致，或稱為事實捏造。就比如前面提到的第二個問題，李逵大鬧五臺山。就有軟件為他大鬧行為進行了編造，而且有模有樣，還能自圓其說。如果對于不了解《水滸傳》的人來說，就很容易被它騙到。

第二種稱為忠實性幻覺，就是生成的內容與用戶的指令不一致，或上下文不一致。

就比如第三個問題，題中明確提到了幾個規則：這些數字用且只能用一次，且得出的結果是24。但有的軟件就是把一些數字用了兩次以上，并且得出了32減10等于24這樣的結論。

那么，人工智能的幻覺是什么原因導致的呢？

一是知識庫的數據缺陷。比如有的模型抓取的信息是某個特定時間之前的，如果你要問他某個時間之后的，顯然它就不會了，只能現編了。

比如我問DeepSeek，你的數據是截止到什么時候的？它回答：是截止到2023年10月的。

二是知識庫的數據偏差。比如知識庫的數據在導入時就是錯的，結果被大模型調用，那就是錯上加錯。像一些醫學上的過時論文，并不能代表最新的研究方向。

三是模型訓練過程中存在偏差或不足。比如針對數學題的解題思路在邏輯上不夠嚴密，導致結果錯誤。

五招識破幻覺陷阱

有鑒于此，該如何識破且避開幻覺陷阱呢？

一是提供高質量數據庫，進行數據清理。比如我建了一個自己的智能體（豆包中搜“胡二刀”），并調用我本人建立的知識庫。

我請智能體介紹一下“石家莊的低空經濟”，它在回答中提到“2024年1月如何如何”。不對呀，這件事是發生在2025年初的。原來知識庫中我寫的文章并沒有明確提及年份，大模型在調用時，就想當然延續上下文，自動添加了2024。

我在文章中加上了“2025年”字樣，然后再上傳發布。這回提問，結果就沒問題了。這就是對知識庫的不斷調試。

二是完善有缺陷的大模型。現在可選擇的大模型很多，且迭代時間很短。就拿扣子智能體來說，其接入的大模型就達三十種，包含了豆包系列、深度求索系列、通義千問系列、abab系列、Moonshot系列、百川系列等。

可以根據實際需求，隨時調整調用大模型。

三是盡可能在聯網的狀態下進行問答。聯網雖然會花費一些時間，但數據庫及可參考的余地更大，因此結果就更加準確。

清華大學沈陽教授團隊的研究表明，聯網狀態下，Ai幻覺率會下降2%至5%。

四是多個大模型交叉驗證。就比如上面提到的李逵的問題，多用幾個大模型，得出的結論就更加接近真實值。這也是我們常說的多個信息源驗證一個事情的真偽。

五是通過時空維度約束來降低虛構可能性。簡單來說，就是在提示詞上做文章，增加更多限制條件。比如提問的時候更加具體，把一些背景放在問題中提出來，像一些時間、地域等的限制，這樣回答就不會跑偏了。

當然，AI幻覺并不完全是壞事。由于其天馬行空的想象力，也會產生一些不可思議的效果。比如大衛·貝克團隊利用AI“錯誤折疊”啟發新型蛋白質結構，獲2024諾貝爾化學獎。

DeepMind團隊發現，AI在圖像分割任務中產生的“超現實邊界”雖不符合真實場景，卻意外提升了自動駕駛系統對極端天氣（如濃霧、暴雨）的識別精度。

AI的幻覺既是缺陷，也可能是創新的火花。關鍵在于，我們能否在依賴與質疑之間找到平衡。未來，它或許不再需要“編故事”，而是真正成為人類智慧的延伸。但在這之前，擦亮雙眼，保持警惕，或許是我們與AI的相處之道。

部分圖文源自：《DeepSeek與AI幻覺》、量子位、財富中文網

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

時間去哪兒了？

孤獨大腦 2025-09-10 23:29:47
0 跟貼 0
波士頓機器狗練成“輕功”！連續七個后空翻

量子位 2025-09-07 01:03:18
19 跟貼 19

LLM-in-Sandbox：給大模型一臺電腦，激發通用智能體能力

機器之心Pro 2026-01-30 14:15:23
0 跟貼 0

我交付的代碼我自己都不讀！Clawdbot沖上10萬星，作者揭秘開發內幕

智東西 2026-01-30 17:42:13
4 跟貼 4
大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0

釘釘發布DeepResearch多智能體框架，已在真實企業部署

機器之心Pro 2025-11-12 13:06:22
2 跟貼 2

荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0

行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
未來醫生摘得全球第一，臨床安全有效性評估新基準

量子位 2025-11-19 11:14:03
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
兩個LLM互相對線，推理起飛：康奈爾團隊發布大模型版類GAN訓練法

機器之心Pro 2025-12-08 16:16:12
0 跟貼 0
5秒出4張2K大圖！阿里提出2步生成方案，拉爆AI生圖進度條

量子位 2026-01-30 21:16:54
0 跟貼 0
AI agent正在默默記住那些你隨口一提的瑣事

DeepTech深科技 2026-01-30 16:54:43
0 跟貼 0
楊植麟為何親自為Kimi站臺？

虎嗅APP 2026-01-29 06:13:04
52 跟貼 52
馬斯克：最強對手來自中國

極目新聞 2026-01-30 15:34:51
5364 跟貼 5364
字節阿里DeepSeek決戰春節：一場關乎14億人的重磅AI大戰

新智元 2026-01-30 18:48:13
84 跟貼 84
頂尖模型離“科學家”還差得遠？AI4S亟待邁向2.0時代

機器之心Pro 2026-01-30 18:56:44
0 跟貼 0
AI硬件3個一線信號，決定誰能活過2026

虎嗅APP 2026-01-31 01:00:26
0 跟貼 0
AI核心人才持續流失，蘋果再失4名研究員與一名Siri高管

華爾街見聞官方 2026-01-31 05:34:17
1 跟貼 1
80后"量子鬼才"陸朝陽，中國自己的愛因斯坦

雷科技 2025-12-15 20:25:30
0 跟貼 0
如果愛因斯坦和尼古拉特斯拉相比，誰更厲害？

萬物研究 2026-01-29 16:39:13
50 跟貼 50
量子計算機越來越復雜，科學家如何用AI學會與它對話?

DeepTech深科技 2025-10-04 18:47:24
2 跟貼 2
騰訊元器如何讓教育智能體在微信生態零代碼落地

芥末堆看教育 2025-12-27 18:22:21
0 跟貼 0
你就說這是不是人工智能吧！

包子同學呀 2026-01-28 12:03:19
4 跟貼 4
象甲神局，陷阱反飛刀，刀光劍影，激動人心，極限反殺

蘇小宇的棋 2026-01-30 03:03:48
0 跟貼 0
野狼明知有陷阱，還是擋不住食物的誘惑，落入深坑想跑也晚了

動匹說生活 2026-01-29 15:51:17
0 跟貼 0
奧特曼談馬斯克：我曾視他為英雄，如今不再說話

量子位 2025-09-16 04:14:37
0 跟貼 0
六張圖透視Kimi的2025年：App月活“腰斬”，與DeepSeek四次“撞車”，手握100億元現金，停止燒錢投流

每日經濟新聞 2026-01-30 15:11:27
6 跟貼 6
馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
0 跟貼 0
發現一個寬敞的大山洞，第二天拉船進去下陷阱，以后天天有魚吃了

壯鄉小莫 2026-01-29 23:40:53
35 跟貼 35
誰在賦能這場數字樂章？主板背后的算力底座與生態力量

量子位 2025-11-29 16:58:47
0 跟貼 0
這是防步兵專用的陷阱

蟲蟲看大劇 2026-01-27 09:05:33
1 跟貼 1
大模型的魅力在于突發涌現的能力

量子位 2025-12-11 03:38:02
0 跟貼 0
工程師租8張H100復現mHC架構，數據反超原論文

量子位 2026-01-30 03:29:45
0 跟貼 0
AI建造者如何使用AI？《時代》周刊專訪三位科技領袖

量子位 2025-12-16 08:37:19
1 跟貼 1

胡二刀

新媒體運營專家

303文章數 32關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

家居

旅游

教育

軍事航空

耳石癥分類型，癥狀大不同

家居要聞

手機 / 數碼

房產 / 家居

AI也會說謊？五招教你識破人工智能的幻覺陷阱

中國車企和特斯拉的下一戰，戰場已定

盒馬"錯配"致顧客誤食水仙中毒 賠償方案仍未達成一致

盒馬"錯配"致顧客誤食水仙中毒 賠償方案仍未達成一致

“假賭黑”的子彈，還要再飛一會兒嗎？

成龍入駐小紅書，懟臉近照沒有老年斑

白銀，暴跌！黃金，40年最大跌幅！

新款賓利歐陸GT S/GTC S官圖發布 V8混動加持

態度原創

耳石癥分類型，癥狀大不同

藍調空舍 自由與個性

明光黃寨草原：風吹草低見“新景”

衡水一中還狠的日本監獄學園，手摳馬桶，暗黑體罰，超出想象！

轟-6k在黃巖島戰備警巡示意圖公布

盒馬"錯配"致顧客誤食水仙中毒賠償方案仍未達成一致

盒馬"錯配"致顧客誤食水仙中毒賠償方案仍未達成一致

藍調空舍自由與個性