<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI也會說謊?五招教你識破人工智能的幻覺陷阱

      0
      分享至

      人工智能正以驚人的速度重塑世界。但你是否發現,這些看似全能的AI有時會“一本正經地胡說八道”?從虛構歷史事件到錯算數學題,它們為何頻頻陷入“幻覺”?這場技術與真相的博弈,究竟藏著怎樣的秘密?



      01

      一本正經胡說八道

      我選了七款較為主流的人工智能軟件,分別是DeepSeek、海螺、騰訊元寶、豆包、文小言、通義、Kimi,各問三個問題,一個與科學有關,一個與歷史有關,一個與數學有關,看看它們如何回答。

      第一個問題:愛因斯坦是如何評價量子計算機的?

      結果所有AI的回答都基本一致。比如DeepSeek回答如下:



      第二個問題:請評價一下李逵為什么要大鬧五臺山?

      下面是Kimi和騰訊元寶給出的回答。



      它們分別圍繞李逵的性格、身份等展開,還提到了宋江和李逵的母親,說得有鼻子有眼的。

      而真相正如其他軟件所說:李逵并未大鬧五臺山。實際上,大鬧五臺山的是魯智深。

      第三個問題:我給你四個數,這四個數呢每個只能用一次,然后無論你用加減乘除什么方法,最后得出的結果是24。你幫我看看怎么來運算,這四個數是8644。



      結果豆包、海螺、Kimi都算錯了。

      可見,人工智能并不總是對的。甚至有些時候,它錯得很離譜,錯得很隱蔽。

      清華大學新聞與傳播學院新媒體研究中心沈陽教授團隊在今年二月曾發表《DeepSeek與AI幻覺》報告,對人工智能錯誤率統計如下:



      02

      忠實調用錯上加錯

      人們把這種錯誤稱為AI幻覺。那么,什么是人工智能幻覺呢?簡單來說,就是指模型生成的內容與現實世界事實或用戶輸入不一致的現象。

      根據哈工大和華為的共同論述,人工智能幻覺分為兩種:一種是事實性幻覺,一種是忠實性幻覺。



      前者與可驗證的現實世界的事實不一致,或稱為事實捏造。就比如前面提到的第二個問題,李逵大鬧五臺山。就有軟件為他大鬧行為進行了編造,而且有模有樣,還能自圓其說。如果對于不了解《水滸傳》的人來說,就很容易被它騙到。

      第二種稱為忠實性幻覺,就是生成的內容與用戶的指令不一致,或上下文不一致。

      就比如第三個問題,題中明確提到了幾個規則:這些數字用且只能用一次,且得出的結果是24。但有的軟件就是把一些數字用了兩次以上,并且得出了32減10等于24這樣的結論。

      那么,人工智能的幻覺是什么原因導致的呢?

      一是知識庫的數據缺陷。比如有的模型抓取的信息是某個特定時間之前的,如果你要問他某個時間之后的,顯然它就不會了,只能現編了。

      比如我問DeepSeek,你的數據是截止到什么時候的?它回答:是截止到2023年10月的。



      二是知識庫的數據偏差。比如知識庫的數據在導入時就是錯的,結果被大模型調用,那就是錯上加錯。像一些醫學上的過時論文,并不能代表最新的研究方向。

      三是模型訓練過程中存在偏差或不足。比如針對數學題的解題思路在邏輯上不夠嚴密,導致結果錯誤。

      03

      五招識破幻覺陷阱

      有鑒于此,該如何識破且避開幻覺陷阱呢?

      一是提供高質量數據庫,進行數據清理。比如我建了一個自己的智能體(豆包中搜“胡二刀”),并調用我本人建立的知識庫。

      我請智能體介紹一下“石家莊的低空經濟”,它在回答中提到“2024年1月如何如何”。不對呀,這件事是發生在2025年初的。原來知識庫中我寫的文章并沒有明確提及年份,大模型在調用時,就想當然延續上下文,自動添加了2024。



      我在文章中加上了“2025年”字樣,然后再上傳發布。這回提問,結果就沒問題了。這就是對知識庫的不斷調試。

      二是完善有缺陷的大模型。現在可選擇的大模型很多,且迭代時間很短。就拿扣子智能體來說,其接入的大模型就達三十種,包含了豆包系列、深度求索系列、通義千問系列、abab系列、Moonshot系列、百川系列等。



      可以根據實際需求,隨時調整調用大模型。

      三是盡可能在聯網的狀態下進行問答。聯網雖然會花費一些時間,但數據庫及可參考的余地更大,因此結果就更加準確。



      清華大學沈陽教授團隊的研究表明,聯網狀態下,Ai幻覺率會下降2%至5%。

      四是多個大模型交叉驗證。就比如上面提到的李逵的問題,多用幾個大模型,得出的結論就更加接近真實值。這也是我們常說的多個信息源驗證一個事情的真偽。

      五是通過時空維度約束來降低虛構可能性。簡單來說,就是在提示詞上做文章,增加更多限制條件。比如提問的時候更加具體,把一些背景放在問題中提出來,像一些時間、地域等的限制,這樣回答就不會跑偏了。



      當然,AI幻覺并不完全是壞事。由于其天馬行空的想象力,也會產生一些不可思議的效果。比如大衛·貝克團隊利用AI“錯誤折疊”啟發新型蛋白質結構,獲2024諾貝爾化學獎。

      DeepMind團隊發現,AI在圖像分割任務中產生的“超現實邊界”雖不符合真實場景,卻意外提升了自動駕駛系統對極端天氣(如濃霧、暴雨)的識別精度。

      AI的幻覺既是缺陷,也可能是創新的火花。關鍵在于,我們能否在依賴與質疑之間找到平衡。未來,它或許不再需要“編故事”,而是真正成為人類智慧的延伸。但在這之前,擦亮雙眼,保持警惕,或許是我們與AI的相處之道。

      部分圖文源自:《DeepSeek與AI幻覺》、量子位、財富中文網

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

      1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

      寄史言志
      2026-01-04 16:34:31
      法國貓徒步5個月從西班牙回家!只為再蹭蹭主人的手

      法國貓徒步5個月從西班牙回家!只為再蹭蹭主人的手

      新歐洲
      2026-01-28 21:37:40
      印度疫情徹底失控,中國開始行動了

      印度疫情徹底失控,中國開始行動了

      老特有話說
      2026-01-30 23:08:17
      黃金有沒有可能突然暴跌,讓我們一被套就是30年?

      黃金有沒有可能突然暴跌,讓我們一被套就是30年?

      流蘇晚晴
      2026-01-30 20:39:24
      國際金價銀價繼續大幅下跌

      國際金價銀價繼續大幅下跌

      上觀新聞
      2026-01-31 06:57:08
      4年時間門店從0增至960家,全國開店的零食品牌,如今陷入閉店爭議!官方回應:主動放緩是策略,不是叫停加盟

      4年時間門店從0增至960家,全國開店的零食品牌,如今陷入閉店爭議!官方回應:主動放緩是策略,不是叫停加盟

      每日經濟新聞
      2025-12-28 23:52:06
      陪睡陪玩只冰山一角! 又一女演員曝內娛潛規則, 原來岳云鵬沒說謊

      陪睡陪玩只冰山一角! 又一女演員曝內娛潛規則, 原來岳云鵬沒說謊

      小熊侃史
      2026-01-31 07:05:08
      張雨綺又帶火了一種新穿法:“上身去上班,下身去夜店”,好洋氣

      張雨綺又帶火了一種新穿法:“上身去上班,下身去夜店”,好洋氣

      阿雹娛樂
      2026-01-12 14:40:57
      特朗普:已向伊朗告知達成協議的最后期限

      特朗普:已向伊朗告知達成協議的最后期限

      財聯社
      2026-01-31 03:44:04
      記者:恒大當年過年前都要給足協實權派官員送個幾十萬的紅包

      記者:恒大當年過年前都要給足協實權派官員送個幾十萬的紅包

      懂球帝
      2026-01-30 12:45:14
      “港獨”陳家駒:叫囂“讓香港重歸英國”,潛逃英國后淪為乞丐

      “港獨”陳家駒:叫囂“讓香港重歸英國”,潛逃英國后淪為乞丐

      談史論天地
      2026-01-23 16:05:03
      央視不播!今晚7:35,山東斗宿敵,邱彪欲止頹,高詩巖單挑郭艾倫

      央視不播!今晚7:35,山東斗宿敵,邱彪欲止頹,高詩巖單挑郭艾倫

      萌蘭聊個球
      2026-01-31 10:50:39
      某魚驚現“天價筆”:800元一支的中性筆,藏著多少骯臟暗語?

      某魚驚現“天價筆”:800元一支的中性筆,藏著多少骯臟暗語?

      戧詞奪理
      2026-01-24 16:05:41
      取錢大調整!只帶卡和密碼真取不出錢?這3個變化關系每個儲戶

      取錢大調整!只帶卡和密碼真取不出錢?這3個變化關系每個儲戶

      奇思妙想生活家
      2026-01-31 02:51:24
      讀博7年僅發表1篇論文?湖大博士崩潰痛哭,3天就跟導師鬧掰了

      讀博7年僅發表1篇論文?湖大博士崩潰痛哭,3天就跟導師鬧掰了

      妍妍教育日記
      2026-01-28 19:28:30
      不打伊朗了?俄武器到貨,美調轉槍口,逼中國外交官收拾包袱走人

      不打伊朗了?俄武器到貨,美調轉槍口,逼中國外交官收拾包袱走人

      知鑒明史
      2026-01-30 18:14:31
      四十加:不適合幼態,御姐熟到發光

      四十加:不適合幼態,御姐熟到發光

      飛娛日記
      2026-01-26 12:28:23
      西媒:皇馬未直接進入歐冠16強,俱樂部主席弗洛倫蒂諾憤怒

      西媒:皇馬未直接進入歐冠16強,俱樂部主席弗洛倫蒂諾憤怒

      星耀國際足壇
      2026-01-30 13:13:57
      中國理發店老板被捕:涉嫌向哈馬斯轉賬60萬歐元

      中國理發店老板被捕:涉嫌向哈馬斯轉賬60萬歐元

      桂系007
      2026-01-30 23:47:18
      陳獨秀案新說:被傳統掩蓋的驚人真相是什么?

      陳獨秀案新說:被傳統掩蓋的驚人真相是什么?

      小豫講故事
      2026-01-26 06:00:10
      2026-01-31 12:48:49
      胡二刀
      胡二刀
      新媒體運營專家
      303文章數 32關注度
      往期回顧 全部

      科技要聞

      中國車企和特斯拉的下一戰,戰場已定

      頭條要聞

      盒馬"錯配"致顧客誤食水仙中毒 賠償方案仍未達成一致

      頭條要聞

      盒馬"錯配"致顧客誤食水仙中毒 賠償方案仍未達成一致

      體育要聞

      “假賭黑”的子彈,還要再飛一會兒嗎?

      娛樂要聞

      成龍入駐小紅書,懟臉近照沒有老年斑

      財經要聞

      白銀,暴跌!黃金,40年最大跌幅!

      汽車要聞

      新款賓利歐陸GT S/GTC S官圖發布 V8混動加持

      態度原創

      健康
      家居
      旅游
      教育
      軍事航空

      耳石癥分類型,癥狀大不同

      家居要聞

      藍調空舍 自由與個性

      旅游要聞

      明光黃寨草原:風吹草低見“新景”

      教育要聞

      衡水一中還狠的日本監獄學園,手摳馬桶,暗黑體罰,超出想象!

      軍事要聞

      轟-6k在黃巖島戰備警巡示意圖公布

      無障礙瀏覽 進入關懷版