網易首頁 > 網易號 > 正文申請入駐

Agentic RAG：用LangGraph打造會自動修正檢索錯誤的 RAG 系統

2026-01-06 21:42:01　來源: deephub

北京舉報

分享至

標準 RAG 流水線有個根本性的毛病：檢索到的文檔一旦與用戶意圖對不上號，模型照樣能面不改色地輸出一堆看似合理的胡話，既沒有反饋機制也談不上什么糾錯能力。

而Agentic RAG 的思路截然不同，它不急著從檢索結果里硬擠答案，而是先判斷一下拿回來的東西到底有沒有用，如果沒用則會重寫查詢再來一輪。這套機制實際上構建了一條具備自我修復能力的檢索鏈路，面對邊界情況也不至于直接崩掉。

本文要做的就是用 LangGraph 做流程編排、Redis 做向量存儲，搭一個生產可用的 Agentic RAG 系統。涉及整體架構設計、決策邏輯實現，以及狀態機的具體接線方式。

傳統 RAG 的"一錘子買賣"

假設知識庫里有一篇《大語言模型的參數高效訓練方法》，用戶問的是"怎么微調 LLM 效果最好"。

語義相似度確實存在但不夠強。檢索器拉回來的可能是模型架構相關的內容雖然沾邊但答非所問，LLM 本身沒法意識到上下文是錯的，照樣能生成一段貌似專業實則離題萬里的回答。

傳統 RAG 對這種失敗模式完全沒有辦法。查詢文檔、生成答案，整個過程是單向的沒有任何質量把關環節。

Agentic RAG 的解法是在流程中插入檢查點：智能體先判斷要不要檢索；檢索完了有評分環節確認相關性；不相關就重寫查詢再試；如此循環直到拿到合格的上下文，或者把重試次數耗盡為止。

系統架構拆解

整個系統拆成六個模塊：

配置層負責環境變量和 API 客戶端的初始化工作。Redis 連接串、OpenAI 密鑰、模型名稱全部歸攏到這里統一管理。

檢索器模塊承擔文檔攝取的全套流程，文檔經過 WebBaseLoader 加載后用 RecursiveCharacterTextSplitter 切塊，再通過 OpenAI Embedding 向量化，最后存進 RedisVectorStore。檢索器本身會被包裝成 LangChain 工具供智能體調用。

智能體節點是決策入口。拿到用戶問題后先做判斷：這個問題需要查資料還是直接能答？需要查就調檢索器，不需要就直出答案。

評分（Grade Edge）決定檢索結果的去向。相關性夠就往生成環節走；不夠就觸發重寫。這是整個系統里最關鍵的質量關卡。

重寫節點把原始問題改寫成更適合檢索的形式，用戶表述太口語化、缺少關鍵詞，這些問題都在這里修正。

生成節點只有在評分環節確認上下文合格后才會執行，基于檢索到的文檔產出最終答案。

流程圖和代碼

關鍵在于從"重寫"回到"智能體"這條反饋路徑。系統不會因為一次檢索失敗就直接給出一個牽強附會的答案，它會調整策略重新嘗試。

src/
├── config/
│ ├── settings.py # 環境變量
│ └── openai.py # 模型名稱和 API 客戶端
├── retriever.py # 文檔攝取和 Redis 向量存儲
├── agents/
│ ├── nodes.py # 智能體、重寫和生成函數
│ ├── edges.py # 文檔評分邏輯
│ └── graph.py # LangGraph 狀態機
└── main.py # 入口點

職責劃分很清晰：配置歸 config/，智能體相關的都在 agents/，向量存儲操作全在 retriever.py。這種結構調試起來方便，單測也好寫。

配置模塊設計

配置層解決兩個問題：環境變量加載和 API 客戶端復用。

settings.py 集中讀取 Redis 連接信息、OpenAI API Key、索引名稱，不用滿項目找配置。

openai.py 負責實例化 Embedding 模型和 LLM 客戶端。切換到別的模型、調整 Embedding 維度等等配置也只要一處

這個設計在生產環境里很實用，因為模型會迭代、Key 會輪換、服務商可能換掉，集中管理意味著改動成本可控。

檢索器實現

檢索器負責整條數據攝取鏈路：抓文檔、切塊、向量化、入庫。

語料選的是 Lilian Weng 關于 Agent 和 Prompt Engineering 的博客文章。WebBaseLoader 負責抓取，RecursiveCharacterTextSplitter 切分成適當大小的塊，OpenAI Embedding 完成向量化。

向量存儲用 RedisVectorStore。檢索器通過 create_retriever_tool 封裝成 LangChain 工具形態。這一步的意義在于讓智能體能夠"調用"檢索而不是被動觸發，意味著它有權決定什么時候需要查資料、什么時候直接回答。

為什么用Redis？因為夠快，夠簡單。向量相似度搜索本身 Redis 就能做，不用額外引入專門的向量數據庫。對于已經跑著 Redis 的技術棧來說，加 RAG 能力幾乎零額外運維負擔。

智能體節點

nodes.py 里有三個核心函數。

智能體函數接收當前狀態（用戶問題、歷史對話等），判斷下一步怎么走。它能調用包括檢索器在內的工具集。問題需要外部知識就調檢索，不需要就直接生成回答。

重寫函數處理那些被評分環節打回來的查詢。它會讓 LLM 把原始問題改寫成檢索友好的形式，用詞更精準、關鍵信息更突出。改寫后的查詢再交回智能體重新發起檢索。

生成函數產出最終答案。輸入是原始問題加上已確認相關的文檔，輸出是基于這些上下文的回答。

三個函數都是無狀態的。狀態走圖，不走函數內部變量。這對測試和排查問題都有好處。

文檔評分邏輯

edges.py 里的 grade_documents 是整個 Agentic 機制的核心。

檢索完成后它會逐個審視返回的文檔：這東西跟用戶問的相關不相關？能不能幫上忙？

評分本身是通過一次 LLM 調用完成的，Prompt 設計成要求模型返回二元判斷——相關或者不相關。

判定相關就返回 "generate"，流程走向答案生成；判定不相關則返回 "rewrite"，觸發查詢改寫。

這個環節的價值在于攔截那些本會導致標準 RAG 胡說八道的情況，與其硬著頭皮從不靠譜的上下文里編答案，不如給系統一次修正查詢的機會。

狀態機接線

graph.py 用 LangGraph 的狀態機原語把所有節點串起來。

圖結構定義了節點（智能體、檢索、生成、重寫）和邊（節點間的連接關系，包括基于評分結果的條件路由）。

接線邏輯如下：查詢先到智能體節點，智能體決定調檢索器的話流程就到檢索節點，檢索完進評分，評分過了走生成，沒過走重寫，重寫完的查詢再回智能體重新來過。生成節點執行完流程結束。

LangGraph 接管狀態流轉的細節。每個節點只管接收當前狀態、返回狀態更新，具體消息怎么路由由圖引擎根據邊的條件邏輯處理。

運行時流程

main.py 是入口，做三件事：構建圖、接收問題、流式輸出結果。

build_graph() 在啟動時執行一次，完成 LangGraph 狀態機的構建和檢索器工具的初始化.

問題進來之后的流轉過程：智能體接收問題決定調檢索 → Redis 返回文檔 → 評分環節判斷相關性 → 相關就生成答案，不相關就重寫查詢繼續循環。

腳本會把各節點的輸出實時打到控制臺，方便觀察決策過程——什么時候觸發了檢索、評分結果如何、有沒有走到重寫環節，一目了然。

架構的優勢

自校正能力：檢索質量差能發現并修復，不會悶頭輸出一個基于垃圾上下文的錯誤答案然后假裝沒事發生。

決策透明：狀態機讓每個分支點都是顯式的。路由決策可以全量記錄，想排查為什么系統選擇了重寫而不是直接生成，日志里全有。

模塊解耦：每個組件職責單一。想把 Redis 換成 Pinecone？改檢索模塊。想把 OpenAI 換成 Anthropic？改配置層。其他部分不受影響。

總結

標準 RAG 把檢索當黑盒，查詢丟進去、文檔出來，至于相不相關全憑運氣。Agentic RAG 打開這個黑盒在關鍵位置加了質量控制。

LangGraph 加 Redis 的組合提供了一個可以直接上生產的骨架。流程編排的復雜度 LangGraph 消化掉了，向量檢索的性能 Redis 兜住了，剩下的評分和重寫邏輯負責兜底那些簡單系統搞不定的邊角案例。

代碼：

https://avoid.overfit.cn/post/a45e19af576a4826a605807d8fcfe298

作者：Kushal Banda

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.