
作者 | Leela Kumili
譯者 | 田橙
Swiggy 近日推出 Hermes V3,這是一款基于生成式 AI 的 Text-to-SQL 助手,員工可以直接用自然語言向數據發起查詢。Hermes 運行在 Slack 中,通過向量檢索、會話記憶、智能體編排以及解釋層,將日常語言準確轉化為可執行的 SQL 查詢。
作為一家印度在線食品訂購與配送平臺,Swiggy 最初推出 Hermes 時,目標很簡單:給員工一個輕量級入口,讓他們能問一些基礎問題,并自動生成對應的 SQL,在內部數據倉庫中執行。但在實際使用中,這個早期版本很快遇到了瓶頸,例如難以處理派生指標、無法理解上下文、多次提問結果不一致,以及缺乏對生成 SQL 的校驗和解釋能力。
為了解決這些問題,Swiggy 工程團隊對 Hermes 進行了徹底重構,引入 少樣本學習(few-shot learning)、元數據檢索機制,并圍繞大語言模型設計了更加結構化的工作流。
![]()
早期版本的 Hermes 整體架構
在第三個版本中,Hermes 的核心升級之一,是基于向量的提示檢索系統。該系統建在 Snowflake 中歷史執行過的 SQL 查詢之上。但一個現實問題是,大多數生產環境中的 SQL 并沒有清晰的描述性元數據,很難直接理解查詢的真實意圖。
為此,團隊借助具備大上下文能力的語言模型,將已有 SQL 自動轉化為自然語言解釋,從而“補齊”這些查詢背后的意圖信息。生成的自然語言提示隨后被向量化并建立索引,在新請求到來時,作為少樣本示例注入模型,使 Hermes 能夠參考過往的分析模式,顯著提升 SQL 生成的準確性。
正如 Swiggy 工程師 Meghana Negi 和 Rutvik Reddy 所總結的那樣:
Hermes 現在可以從一個經過整理的歷史查詢與提示數據庫中進行檢索,通過向量相似度匹配并結合會話上下文,將 SQL 生成準確率從 54% 提升至 93%,同時支持更加自然的多輪對話。
![]()
Hermes V3 的整體工作流程
Hermes V3 還引入了會話記憶能力,支持真正的多輪交互。用戶在提問時無需反復補充背景信息,系統會自動跟蹤當前會話狀態,在已有上下文基礎上繼續推理,將簡單指標逐步擴展為更復雜的組合查詢。
在系統內部,一個編排型智能體(orchestrator agent)采用類似 ReAct 的推理循環,將復雜問題拆解為一系列清晰、可復用的步驟,包括意圖解析、問題完整性校驗、元數據查找、示例檢索、中間邏輯構建、SQL 生成,以及在必要時向用戶發起澄清請求。
![]()
查詢生成中的結構化智能體工作流程
另一個關鍵改進,是 Hermes V3 增加了解釋層。系統會主動展示生成 SQL 時所依據的假設,并為結果給出置信度評分。這種做法讓非技術背景的業務人員也能理解查詢是如何形成的,從而提升對機器生成分析結果的信任度。
在基礎設施層面,Hermes V3 與 Swiggy 現有的安全、合規和元數據體系進行了深度整合。通過基于角色的訪問控制(RBAC)、單點登錄(SSO)、臨時響應機制以及審計日志,系統確保對敏感數據的訪問符合內部治理要求。同時,Hermes 采用混合式元數據檢索策略,高效獲取相關 schema、數據表和字段信息,在控制 token 使用量的同時,保證查詢性能。
從整體架構來看,Hermes 覆蓋了多種開源與云原生技術組件。檢索模塊基于向量數據庫和嵌入模型實現;智能體編排邏輯借助 LangChain 等工具構建結構化提示工作流;數據溯源和運行監控則通過可觀測性框架完成。Snowflake 等分析型數據庫、PostgreSQL 等事務型數據庫,以及 API 網關,共同構成了支撐 Hermes 正常運行的技術生態。
https://www.infoq.com/news/2026/01/swiggy-hermes-conversational-ai/
聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.