網易首頁 > 網易號 > 正文申請入駐

AI時代，蝴蝶和海嘯之間只隔一個錯誤

2025-12-31 16:43:31　來源: 長三角momo

浙江舉報

分享至

如果一篇論文錯信了“AI幻覺”，會造成多米諾骨牌效應，引發一連串的數據錯誤復發，怎么破？用魔法打敗魔法，還是要靠AI工具。

開頭講兩個故事。

第一個故事，關于普遍性。

現在的學生和老師，都在普遍地使用AI。前幾天去親戚家串門，他正在教育他閨女不要用AI寫作文了，一定要自己寫。結果她閨女特別委屈地方告訴他：這是老師讓的，老師說寫完之后，要傳給AI，讓AI給出修改意見。

前段時間，我去參加了一個大學教授和我們這些民間自媒體從業者的論壇，我特意問了關于使用AI的問題，答案是老師們也在普遍用AI做課件。

第二個故事，關于準確性。

前段時間，良渚的自來水事件，鬧得沸沸揚揚，但是突然有個信息沖了出來，說農夫山泉在良渚有工廠，一時間快速發酵，幸虧事件查的及時，發這個微博的博主很快刪除了信息，并且道了歉，說是AI上查到的信息，搞錯了。一句搞錯，差點給企業釀成大禍。

很顯然，AI在過去的兩年中，已經證明了自己能夠給出比傳統搜索更優質答案的能力，人們也更愿意毫無底線地相信AI的答案，這種相信，在教授、媒體、教師、學術界、科學界、行政公務中都普遍存在，但是我們有沒有想過一個問題，如果AI在這些嚴肅學科領域，犯了良渚農夫山泉那個錯，帶來的后果會是什么？

我覺得就是蝴蝶效應。

一個媒體報道，或者一篇論文，用錯一個數據之后，會引發一連串的數據錯誤復發，最終徹底讓AI陷入一種認知錯誤，誤導后面所有的人，這是一個多米諾的關系。

百度文心，最近弄了一個“放心寫”功能，大大提高了媒體和教育行業的AI使用確定性，我實話實說，之前為了確保數據不出錯，我還是會對比幾個AI一起交叉驗證，然后再配合權威媒體的報道，確保自己不出錯，現在有了這個功能，直接把寫好的文章，傳給文心，有什么問題直接就會給我標注出來，我在線就可以修改，二次再審。

這等于給每個寫作者，加了一道風控，有沒有數據錯誤，有沒有政策解讀錯誤，有沒有論點論據錯誤，我在內部開玩笑，我們行業的校對可以徹底下崗了，的確，我們公司的校對下崗很久了。

為什么學術界、媒體界是AI最應該關注的對象？因為AI的很多數據來源要取自這里，如果這里出錯，會交叉污染數據，所以百度文心現在用“放心寫”，堵住這個交叉污染的可能性，是抵制AI幻覺的一個非常有效的手段。

我也試用了一下，拿“最近汽車行業監管政策解讀”這個問題生成了一篇文章，具體細節和最終成果我就不展開說了，只說結論：質量很可用，以對話助手的方式，達到了我以前用某些大模型的智能體的水平。

這個檢驗過程有意思，提示未通過部分，我專門查了一下，為什么AI判定「歐盟《新電池法》要求2027年動力電池回收利用率達到95%」不通過？原來法案是針對不同材料的，確實不能一概而論，很嚴謹。

再次重寫后通過，下載分享也很絲滑。

還有一點要提示，記住要把左下角的“事實校對”打開。

近期還看到一條訊息，LMArena大模型競技場新發布了最新排名，文心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜，排名中國第一，特別是在創意寫作等方面表現突出。

值得點贊，不管從模型上還是應用上，文心在中文寫作方面都很強勁，目前在文心APP最新版本可以體驗最新的模型能力了。我了解到，放心寫中文寫作準確率已經超過了99%，幻覺率大大降低。

總之，我覺得未來如果要確保AI不產生過多幻覺，“放心寫”還真是一條可行之路。

首先，數據庫如何建立？

既然是一個幫助用戶避免AI幻覺的寫作工具，那就是要有一個屬于自己的細分數據庫，這個數據庫不是開放式的，“放心寫”采用的數據庫都是權威可信機構媒體和政府官網，并沒有從海量的互聯網數據中去辨別，幻覺往往是因為錯誤信息權重大于正確信息之后，產生的結果。而且這種干擾，目前來看，是完全可實行的。

所以，用來二次辨別的工具，數據庫一定不是開放式全網數據。

其次，在小細分領域循環。

現在，文心“放心寫”對于公文、教育課件、行業報告、會議紀要等領域，已經有強大的復盤能力，但是這種能力有個特性，就是服務辦公室工作比較多，并不是偏向娛樂和個人化需求，基本都是嚴肅話題，在這種特定場景中，數據就更容易保持干凈，這種干凈就可以傳染給外面的大數據庫。

第三，能夠幫助新手快速上手工作。

其實，對于很多辦公室新人，甚至新教師來說，如何規范自己的行文，規范自己的課件，是一件非常頭疼的事，因為這些東西，往往都有固定的格式，其實不需要太多個性化的東西，但是這個格式需要經驗，文心“放心寫”除了可以檢測錯誤之外，也可以幫你根據你提供的參考文檔調整格式。

在過去的一年時間里，AI在很多公司，有了一個新名字，背鍋俠。

以前，公司里的人們辦公過程中出了錯，會把鍋甩給供應商，說是供應商的錯，但是現在大家發現，AI也可以承接這種錯誤，這從側面也說明了一個問題，AI幻覺的確普遍性存在，是一個現實問題。

無數的專家在擔憂，我們社會未來的信息安全問題，人類在未來，到底還能不能真的分辨出哪些信息是真實的，哪些是AI杜撰出來的，今年良品鋪子的花生酥，被AI做出了一張花生長在樹上的圖，成了鬧劇，事實上，這種事情，以后這會越來越多。

百度這次做“放心寫”，算是從反方向做了一次嘗試，AI不僅僅可以是數據信息的提供者，也可以是數據信息的糾正者，幻覺可能是AI創造出來的，也可以是AI糾正的。

時間來到了2026年，AI的競爭很顯然會陷入一種白熱化，功能上的差異越來越小，那么下半場大家比什么？如果一個問題，所有AI給出的答案都大差不差，那么用誰都一樣。那么如果一個問題，有一個AI能夠給出不一樣的答案，并且能夠做到錯誤率很低，或者不出錯，這就是勝算。

確保自己和物理世界的強關聯，不出現幻覺，對自己的交付負責，這就是我心中AI后面的取勝法寶。

AI，在2026年，不能變成人們犯錯的背鍋俠，而應該是糾錯俠。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

人民網評：日本內政分裂加劇，用向外轉嫁掩蓋無力

澎湃新聞 2026-02-11 10:51:38
16064 跟貼 16064
美方指控中方曾于2020年6月開展核爆炸試驗中方回應

財聯社 2026-02-11 15:54:18
140 跟貼 140

祝賀！長征十號一級箭體安全濺落預定海域（新華網）

北青網-北京青年報 2026-02-11 17:35:35
227 跟貼 227

春節期間將向消費者發放20.5億元

每日經濟新聞 2026-02-11 13:49:48
12110 跟貼 12110
遼寧GDP增速，為什么全國倒第一？

中國日報網 2026-02-11 11:43:05
309 跟貼 309

接好運！貴陽一公司把10元刮刮樂當開單獎，員工隨手一刮中30萬元，當事人：將作為孩子的教育基金

揚子晚報 2026-02-11 12:39:39
3514 跟貼 3514

女子將敬酒服穿臟后，將吊牌重新焊接退貨退款，商家：估計學的電焊專業

大象新聞 2026-02-11 19:45:21
292 跟貼 292
女子騎電動車獨自從上海返回廣西南寧，歷時近兩個月，行程3000多公里

極目新聞 2026-02-11 15:30:38
132 跟貼 132

山西一高速路邊發現一只小獅子，當地：動物園運輸途中出逃，“很小很溫順”，已經歸還

瀟湘晨報 2026-02-11 18:23:20
18 跟貼 18
哥倫比亞總統險遭暗殺攜子女緊急改道繞飛4小時逃生

中國新聞周刊 2026-02-11 20:49:03
76 跟貼 76
比爾·蓋茨時隔兩年半再度到訪中國

界面新聞 2026-02-11 20:27:46
1277 跟貼 1277
突破！冬奧跳臺滑雪混合團體中國隊創歷史最好成績

天下泉城 2026-02-11 07:25:08
400 跟貼 400
前美國財長顧問：我剛從中國回來美國沒贏

澎湃新聞 2026-02-11 20:06:58
1 跟貼 1
中國電信新卡默認開啟境外電話攔截功能留學生打不通國內父母電話

信網 2026-02-11 18:23:09
442 跟貼 442
解放軍與外軍編隊空中較量緊咬其中一架飛機將其驅離

大風新聞 2026-02-10 16:30:28
668 跟貼 668
華裔研究生研發約會軟件斯坦福超5000名學生"淪陷"

紅星新聞 2026-02-11 14:15:36
334 跟貼 334
永輝超市CEO發全員信：在追求規模的道路上，欲望超越了能力，今年戰略聚焦三大方向

紅星資本局 2026-02-11 11:59:45
420 跟貼 420
俄羅斯與歐盟會打起來嗎？

新民晚報 2026-02-11 10:51:31
14 跟貼 14
我國載人登月新突破！

每日經濟新聞 2026-02-11 12:03:05
451 跟貼 451
網友稱青海一事業編崗位招聘要求“獨立抓捕野牦牛”引熱議，當地：是2020年的招聘信息，野牦牛是種牛場用來科研的野生牦牛，并非純野生

揚子晚報 2026-02-11 08:59:37
136 跟貼 136
古巴多家機場停供航空煤油一個月

環球網資訊 2026-02-11 06:34:01
630 跟貼 630
鐵路部門：節后客流高峰時段增開夜間高鐵列車

央視新聞客戶端 2026-02-11 18:01:34
104 跟貼 104
多門店被曝停業，年夜飯訂金、儲值卡余額無處可退

沈陽生活圈i 2026-02-12 02:07:41
0 跟貼 0
列車上的寵物蜥蜴“爬”過了法律邊界

北青網-北京青年報 2026-02-12 02:16:48
0 跟貼 0
浙江寧波一餐廳大圓桌可坐55人，網友調侃“有些菜，一旦錯過就不再”；餐廳回應：年底人多，需提前3天預定

極目新聞 2026-02-11 13:09:25
0 跟貼 0

長三角momo

專注大公司組織問題和職場文化分析。

82文章數 37關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

手機

教育

家居

公開課

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

AI時代，蝴蝶和海嘯之間只隔一個錯誤

V4來了？DeepSeek 灰度測試新版本

遭特朗普威脅 卡尼一個電話打過去：47億美元我們付的

遭特朗普威脅 卡尼一個電話打過去：47億美元我們付的

搞垮一個冬奧選手，只需要一首歌?

大孤山風波愈演愈烈 超50位明星扎堆

廣州前首富被判無期 200億集資窟窿何償

比亞迪最美B級SUV? 宋Ultra這腰線美翻了

態度原創

下一站是嘉禾望崗，請各位乘客做好哭泣準備

網傳魅族23項目已經停止，公司手機業務即將解散

初中三年像爬坡，穩定節奏很關鍵

簡雅閑居 靜享時光柔

遭特朗普威脅卡尼一個電話打過去：47億美元我們付的

遭特朗普威脅卡尼一個電話打過去：47億美元我們付的

大孤山風波愈演愈烈超50位明星扎堆

簡雅閑居靜享時光柔