<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      RAG系統的隨機失敗問題排查:LLM的非確定性與表格處理的工程實踐

      0
      分享至

      RAG教程里說的流程是:分塊、嵌入、向量搜索、生成答案??雌饋矸浅:唵?,按這個思路搭了一套系統,測試沒問題就上線了。但是結果出了怪事,經常會隨機的失敗。

      輸入一樣,但是輸出卻不一樣,而且這不是偶發,是還有一定的規律,這是怎么回事呢?

      本文將介紹RAG在真實場景下為什么會崩,底層到底有什么坑,以及最后需要如何修改。

      現象:測試結果飄忽不定

      一套端到端的PDF處理管道,專門針對表格密集型文檔。比如:財報、研究論文等,這類文檔的特點是關鍵信息都在結構化表格里,傳統RAG基本處理不好。



      我用20個測試用例進行測試就開始玄學了:

      運行1 → 3個失敗
      運行2 → 2個失敗
      運行3 → 0個失敗
      運行4 → 1個失敗
      運行5 → 0個失敗

      代碼都一樣。但是調試的時候每次跑出來結果都不一樣?

      ? 逐層排查

      為了搞清楚到底哪個環節出了問題,我哦們把每一步的中間狀態都dump出來看。

      MongoDB:表格提取正常,數據干凈,索引也沒問題。

      Qdrant:向量嵌入一致,分塊存儲正常,語義搜索返回的內容也是相關的。

      LLM的上下文窗口:檢查了好幾遍,模型每次拿到的context都是對的。

      那么問題就來了:既然上下文沒錯,為什么模型有時候答對,有時候胡說八道或者漏掉數據?

      那么問題只能是管道本身沒壞,問題出自LLM。

      三個隱藏的坑

      經過一天的排查,最后定位到是下面三個問題疊加在一起造成的。

      1、LLM的非確定性

      Ollama溫度的默認值大概在0.8左右。也就是說,同樣的prompt可能給出不同答案,同樣的數據可能產生不同推理,同樣的表格也可能被解讀出不同結果。

      這導致RAG表面上看是確定性的流程,但實際上根本不是。0.8的溫度讓邊界case變得完全不可預測,所以這一個問題就解釋了一半的"隨機"失敗。

      2、重復的表格數據

      PDF本身就會有一些問題,比如同一張表格:



      在文檔里可能同時存在另一種形態:

      Table data: Phase Requirements 2024-01-15 Review docs […]

      于是LLM同時看到兩個版本:一個是結構清晰的表格,一個是被打散成文本塊的亂碼版本。相同數據、不同格式、互相矛盾。

      模型根本分不清該信哪個,有時從正經表格里提取,有時從噪聲文本里提取,有時兩邊混著來。這是另外一個間歇性bug來源。

      3、Prompt模糊

      最開始寫的指令大概是這種風格:

      "使用提供的表格??紤]所有行。"

      對LLM來說這就是一個建議,碰到邊界情況,模型會直接無視第一行、括號里的備注、文檔標題、日期列,列表也經常給會你截斷。

      敘述性文本用這種模糊指令沒太大問題,但結構化數據不行,模糊指令會產生很多的問題。

      ? 重構方案

      問題定位清楚之后,解決思路就明確了。

      1、鎖死溫度參數

      引入固定的溫度預設:

      class QueryEngine:
      TEMPERATURE_DETERMINISTIC = 0.0 # default

      temperature設成0,相同查詢就能得到相同輸出,測試也變得可以可復現,并且隨機性也消失,系統立刻穩定下來。

      2、過濾重復的表格分塊

      使用一套啟發式規則來識別和剔除那些"看起來像表格"的文本塊:檢測"Table data:"前綴、統計YYYY-MM-DD日期模式出現次數、貨幣格式密度、文本和數字交替出現的模式、異常的空白字符分布。

      在embedding之前把這些重復的表格噪聲干掉,LLM就只能看到每張表格的唯一正確版本。

      3、把Prompt寫成硬性規則

      重寫了整個提示詞,從"建議"改成"命令":

      文檔標題必須納入考慮(包含時間上下文);每張表格的每一行都要讀完;被問到提取數據時必須給出全部值;列表項不許跳過;括號里的備注(比如"(extended)")必須保留。

      這樣表格讀取錯誤就沒有了

      最終架構:混合RAG

      穩定之后的攝取和查詢流程長這樣:



      詳細攝取流程如下:



      為什么要混合存儲?表格數據需要SQL那種精確匹配能力,文本內容需要語義相似度搜索,兩者結合才能把召回率拉到接近完美。

      改完之后:

      運行1: 20/20
      運行2: 20/20
      運行3: 20/20

      穩定、確定、可上線。

      總結

      如果真要給實際業務文檔做RAG不是那種demo用的博客文章,基本都會碰上這些問題:表格和文本混在一起、格式亂七八糟、LLM輸出不穩定、提取結果模棱兩可、檢索匹配不準等等。

      但這些都是工程問題,都有工程解法。確定性的LLM配置、靠譜的預處理流程、混合檢索架構,三件套配齊,RAG系統就能做到穩定、準確、可以扔到生產環境里跑。

      https://avoid.overfit.cn/post/c7aab3faef8948b29d54c0068a43abd6

      作者:Islam Taha

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      歐爾班宣布反制措施:在我們耗盡石油之前,烏克蘭人將先耗盡資金

      歐爾班宣布反制措施:在我們耗盡石油之前,烏克蘭人將先耗盡資金

      陳恧侃故事
      2026-03-07 11:31:12
      現場直擊:伊朗防空系統攔截美以目標

      現場直擊:伊朗防空系統攔截美以目標

      新華社
      2026-03-06 10:54:01
      鄭爽分享美國近況,穿搭不輸當紅明星,自曝做醫美網友直呼認不出

      鄭爽分享美國近況,穿搭不輸當紅明星,自曝做醫美網友直呼認不出

      萌神木木
      2026-03-06 17:33:33
      河南女孩六年前為救父親性命,稱誰給40萬就嫁給誰,如今過得如何

      河南女孩六年前為救父親性命,稱誰給40萬就嫁給誰,如今過得如何

      牛鍋巴小釩
      2026-03-06 19:45:04
      致敬西虹市首富?切爾西眾人開球前將球圍在中間,解說員啞然失笑

      致敬西虹市首富?切爾西眾人開球前將球圍在中間,解說員啞然失笑

      懂球帝
      2026-03-07 13:08:08
      廣西女子發現罕見青竹鯉,時不時側身蹭水底,網友:魚生天花板!

      廣西女子發現罕見青竹鯉,時不時側身蹭水底,網友:魚生天花板!

      貍貓之一的動物圈
      2026-03-06 09:38:48
      小學生實名投訴極氪 建議取消讓她寫作業的小桌板!極氪回應

      小學生實名投訴極氪 建議取消讓她寫作業的小桌板!極氪回應

      快科技
      2026-03-06 23:12:33
      王震堅決反對中顧委副主任排名,薄一波:我是常務,就這么定了

      王震堅決反對中顧委副主任排名,薄一波:我是常務,就這么定了

      芊芊子吟
      2026-03-06 09:45:07
      莫雷加德全家抵達重慶:對這座城市印象深刻,會請樊振東推薦美食

      莫雷加德全家抵達重慶:對這座城市印象深刻,會請樊振東推薦美食

      乒談
      2026-03-07 00:19:01
      中國女籃72-66再勝巴西,不是張子宇王思雨,她17+7成新核

      中國女籃72-66再勝巴西,不是張子宇王思雨,她17+7成新核

      林子說事
      2026-03-07 08:15:14
      速度滑冰世錦賽:寧忠巖收獲短距離全能、男子1000米兩項季軍

      速度滑冰世錦賽:寧忠巖收獲短距離全能、男子1000米兩項季軍

      懂球帝
      2026-03-07 07:21:57
      高市早苗被逼到絕路:派也死,不派也死

      高市早苗被逼到絕路:派也死,不派也死

      鯨探所長
      2026-03-07 12:02:36
      霍爾木茲海峽船只遭襲4死3重傷!兩萬海員被困,伊朗稱不會關閉海峽,但與以美有關船只不得通行;普京與伊總統通話:通過多種渠道保持聯系

      霍爾木茲海峽船只遭襲4死3重傷!兩萬海員被困,伊朗稱不會關閉海峽,但與以美有關船只不得通行;普京與伊總統通話:通過多種渠道保持聯系

      大風新聞
      2026-03-07 10:05:06
      霍震霆也沒想到,46歲的霍啟剛,會在兩會上憑一個舉動給霍家長臉

      霍震霆也沒想到,46歲的霍啟剛,會在兩會上憑一個舉動給霍家長臉

      攬星河的筆記
      2026-03-06 23:55:22
      結束了!整整27年生涯!曝冠軍主帥最后一舞

      結束了!整整27年生涯!曝冠軍主帥最后一舞

      籃球實戰寶典
      2026-03-06 18:57:43
      晴好周末,出游安排起來 | 天氣早知道

      晴好周末,出游安排起來 | 天氣早知道

      上觀新聞
      2026-03-07 11:57:06
      針對“不敢休、不讓休”怪圈,國家出手了!

      針對“不敢休、不讓休”怪圈,國家出手了!

      國是直通車
      2026-03-07 09:12:15
      村里紅白事從不回,男子母親離世,鄰居等著看笑話,結果長了見識

      村里紅白事從不回,男子母親離世,鄰居等著看笑話,結果長了見識

      子芫伴你成長
      2026-02-23 12:21:40
      重回國乒?塵埃落定,劉國梁發聲,崗位曝光,布局國乒男隊發展

      重回國乒?塵埃落定,劉國梁發聲,崗位曝光,布局國乒男隊發展

      卿子書
      2026-03-06 09:25:27
      比賽還沒開打,上海申花先迎來兩個壞消息,新賽季斬獲開門紅懸了

      比賽還沒開打,上海申花先迎來兩個壞消息,新賽季斬獲開門紅懸了

      零度眼看球
      2026-03-07 08:58:12
      2026-03-07 13:40:49
      deephub incentive-icons
      deephub
      CV NLP和數據挖掘知識
      1940文章數 1456關注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養蝦人"自述與AI共生

      頭條要聞

      特朗普突然放話"先解決伊朗后解決古巴" 梅西聽懵了

      頭條要聞

      特朗普突然放話"先解決伊朗后解決古巴" 梅西聽懵了

      體育要聞

      塔圖姆歸來:凱爾特人的春之綠

      娛樂要聞

      周杰倫田馥甄的“JH戀” 被扒得底朝天

      財經要聞

      針對"不敢休、不讓休"怪圈 國家出手了

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      健康
      親子
      教育
      房產
      數碼

      轉頭就暈的耳石癥,能開車上班嗎?

      親子要聞

      六個月寶寶查出散光,原因竟是父母長期身旁玩手機,媽媽懵了:我一直以為他閉著眼就沒事

      教育要聞

      兩會速遞|教育部部長:將實施新一輪學生心理健康促進行動

      房產要聞

      傳統學區房熄火?2月海口二手房爆火的板塊竟然是…

      數碼要聞

      蘋果M5 Pro芯片GeekBench跑分曝光:多核破2.8萬

      無障礙瀏覽 進入關懷版