網易首頁 > 網易號 > 正文申請入駐

airCloset 991張表困局：一個日本CTO用自然語言"拆

2026-03-26 02:31:25　來源: 灰度測試中

北京舉報

分享至

日本最大的服裝租賃平臺airCloset，數據庫里躺著991張表、15個Schema、橫跨11個SQL庫和6個MongoDB實例。CTO Ryan Tsuji上周公開了一個內部工具——DB Graph MCP，讓客服用大白話就能查生產數據。這不是Demo，是跑了10年的老系統真實改造。

一個具體場景：用戶App顯示"退貨已完成"，倉庫到底收到貨沒有？

答案分散在4張表里，跨兩個數據庫，中間靠一個varchar字段硬連，沒有外鍵。全公司能理清這條路徑的人，一只手數得過來。有人休假，調查就卡死。

這就是"數據民主化"最樸素的痛點：連接關系只存在特定人腦子里。

從"人形接口"到自然語言：工具設計拆解

Ryan Tsuji把解決方案拆成兩層。DB Graph是底層的元數據圖譜，把表、列、關系全部向量化；DB Graph MCP是暴露給Claude Code的接口層，遵循Anthropic的模型上下文協議（MCP，Model Context Protocol）。

核心工具只有三個。search_tables做語義檢索，輸入"return processing confirmation"，返回相關表及關系路徑；get_table_details拉取指定表的列信息、樣本值、關聯表；execute_sql執行只讀查詢，帶權限管控。

工具返回格式經過精心設計。search_tables會給出匹配分數、表用途描述、關聯路徑示意圖；get_table_details包含列名、數據類型、是否可為空、樣本值分布、關聯表及連接字段；execute_sql返回結果集的同時，附帶執行計劃和行數估算。

Ryan Tsuji特別強調：所有工具都返回結構化數據，而非自然語言描述。這讓LLM能基于確定格式做二次推理，而非解析模糊的文本回答。

圖譜構建：10年技術債的自動化梳理

991張表的關系圖譜怎么建？airCloset的做法是分層掃描。

第一層讀數據庫元數據：表名、列名、主外鍵約束、索引定義。第二層分析查詢日志，提取高頻JOIN模式——哪些表經常被一起查，哪些字段頻繁用于關聯。第三層人工標注關鍵業務路徑，比如上述退貨場景的四表鏈條。

三層數據融合后，用向量模型編碼。表和列的描述文本、業務標簽、關聯路徑全部嵌入同一空間。語義搜索時，"return processing"能命中receive_record表的status字段，即使表名里完全沒有"return"字樣。

一個細節：airCloset把varchar匹配關系也納入圖譜。warehouse_order_code到shipping_order_code的跨庫關聯，原本是"隱式知識"，現在成了顯式邊。

這解決了老系統最頭疼的問題——沒有外鍵約束的"軟關聯"大量存在，新人根本無從下手。

安全與權限：生產數據的"只讀沙箱"

讓客服直接查生產庫，聽起來像事故預告。Ryan Tsuji的解法是多層隔離。

執行層用只讀副本，物理隔離寫操作。權限層按角色分配Schema可見性——客服只能看aircloset和bridge，工程師按項目開放更多。查詢層加敏感字段脫敏，手機號、地址自動哈希。審計層全量記錄自然語言提問、生成的SQL、返回行數。

一個設計選擇：execute_sql拒絕任何包含UPDATE/DELETE/INSERT的語句，不是正則過濾，而是解析AST（抽象語法樹）后白名單校驗。Ryan Tsuji提到，曾有工程師試圖用CTE繞過限制，被AST掃描攔下。

脫敏規則也進圖譜。客服查user表，看到的phone列是"138****1234"格式；工程師申請后，同一查詢返回完整值。權限差異體現在工具返回的樣本值里，LLM自動適配。

實際效果：從"等人"到"直接問"

Ryan Tsuji給了一組內部數據。退貨狀態核實類問題，平均解決時間從4.2小時降到11分鐘。不是查詢變快了，是"找到該問誰、等對方有空、再口述教一遍"的循環被砍掉。

更隱蔽的變化是提問方式。以前客服的描述是"用戶說退貨完成了但倉庫沒收到"，工程師需要翻譯為"查aircloset.delivery_order.status和bridge.receive_record.status的關聯"。現在客服直接復制用戶原話丟給Claude Code，中間翻譯層消失。

一個意外發現：圖譜暴露了歷史設計問題。Ryan Tsuji團隊發現，"return"相關邏輯分散在7個Schema、23張表里，有些是2015年遺留的命名，有些是新業務硬接的。可視化后，重構優先級變得清晰。

這套系統目前只供內部使用，但Ryan Tsuji把MCP Server的實現細節全部開源。技術棧基于Python，圖譜存儲用Neo4j，向量檢索用pgvector，LLM層對接Claude 3.5 Sonnet。

他提到一個未解決的 tension：圖譜更新頻率。元數據變化實時同步，但查詢日志的JOIN模式分析是T+1，人工標注更是季度級。新表上線后，語義搜索可能"看不見"——直到有人手動標注或它出現在足夠多的查詢里。

10年積累的數據架構，能用3個工具、自然語言接口重新組織。但"隱式知識"的顯式化，究竟能自動化到什么程度？Ryan Tsuji在文末留了這個問題——那些最復雜的跨系統關聯，最終仍需老工程師的判斷，還是會被查詢日志的統計規律逐步捕獲？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

一鍵生成PPT和科研繪圖，北大開源Paper2Any，全流程可編輯

機器之心Pro 2026-01-04 17:32:26
4 跟貼 4
從Token到詞元：全模態時代的基模與交互入口

量子位 2026-03-27 12:00:00
0 跟貼 0

OpenClaw 3.28上線！4天爆更上百項重要更新

新智元 2026-03-29 15:32:28
0 跟貼 0

編程已死，鍵盤長草！Claude Code之父對談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
74 跟貼 74
龍蝦為啥越養越貴，越用越蠢？

鈦媒體APP 2026-03-28 19:53:33
11 跟貼 11

aiX-apply-4B逆襲DeepSeek-V3.2！aiXcoder發布代碼變更應用模型

機器之心Pro 2026-03-27 15:58:54
2 跟貼 2

大模型解剖圖火了，30多個開源模型架構差異一目了然，還可接入AI

DeepTech深科技 2026-03-16 17:33:15
18 跟貼 18
太爽了！7個飛書多維表格核心功能，學會后效率甩同事一條街！

秋葉excel 2026-03-27 11:40:15
0 跟貼 0

VL-LN Bench：模擬「邊走邊問找具體目標」的真實導航場景

機器之心Pro 2026-02-02 17:10:55
0 跟貼 0
VLMgineer讓大模型自己「發明工具」，從設計到使用全自動

機器之心Pro 2026-03-20 14:15:17
0 跟貼 0
香港強開手機最高判3年，7項隱私工具變"罪證"

算力游俠 2026-03-28 11:45:50
0 跟貼 0
印度又官宣自研五代機！17年就憋出個模型，能趕超中美俄嗎？

浩然簡史 2026-03-28 16:39:42
0 跟貼 0
充電速度快到可視化，電量肉眼可見上漲，充電樁絕了！

東坡看生活 2026-03-28 09:16:33
0 跟貼 0
42歲男子長期被職場PUA抱住醫生大哭，稱一到公司門口就開始心慌，醫生：他把領導的評價，當成對自己全部價值的判斷

大風新聞 2026-03-28 21:28:03
1932 跟貼 1932
上海爺叔在家"打傘做飯" 自嘲掏空三代400萬買了個啥

新聞坊 2026-03-29 07:30:02
42 跟貼 42
美兩棲攻擊艦載3500名增援到達

每日經濟新聞 2026-03-29 08:11:32
5839 跟貼 5839
大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0
俄警告韓國勿向烏提供致命性武器

財聯社 2026-03-29 09:30:26
12410 跟貼 12410
首次披露！國產航空發動機技術又又又進化了

環球網資訊 2026-03-28 18:50:48
2041 跟貼 2041
行業首發！OpenClaw全網刷屏，ClawManager一鍵收服AI龍蝦大軍

新智元 2026-03-29 13:16:08
0 跟貼 0
俄羅斯：擬自4月1日起禁止汽油出口優先保障俄國內市場供應

每日經濟新聞 2026-03-28 18:40:36
6136 跟貼 6136
高三學生因不堪鳥鳴寫信請求拆除鳥巢，校長婉拒稱“世界不會為某個人因某事而暫停”，學生回應：對生命與自然有了新的思考

大風新聞 2026-03-28 20:14:32
2396 跟貼 2396
140萬億Token之后：中國AI亟待從規模領先到價值躍遷

鈦媒體APP 2026-03-29 09:58:10
0 跟貼 0
LinkedIn企業話術轉換工具讓商務英語變成純正企業術語

至頂AI實驗室 2026-03-25 21:26:19
0 跟貼 0
小伙手搓飛機發動機，雙扇葉交錯模型，這才是核心部件

搞笑大咖集中營 2026-03-28 11:20:43
1 跟貼 1
排超總決賽：“全華班”江蘇女排贏下首回合，上海女排外援為何不靈了？

上觀新聞 2026-03-29 04:46:09
732 跟貼 732
732M模型超越7B！機器人操控新范式：從視頻中「悟」物理

新智元 2026-03-27 21:37:19
0 跟貼 0
清華、無問芯穹發布多智能體WideSeek-R1，4B模型比肩671B模型！

機器之心Pro 2026-03-27 14:30:44
0 跟貼 0
實例解讀冠狀動脈CTA解剖及斑塊的識別視頻

放射科宋醫生 2026-03-25 22:41:03
0 跟貼 0
曾轟動全球，2年就倒下了

中國新聞周刊 2026-03-29 15:35:03
3 跟貼 3
1911 模型槍欣賞

飛翔大白鯨 2026-03-29 09:56:29
0 跟貼 0
企業軟件卡頓的5個元兇：第3個讓70%工程師踩過坑

我是一個養蝦人 2026-03-27 14:37:12
0 跟貼 0
男子用時3個月復原周星馳電影功夫里的豬籠城寨模型

罕天宇 2026-03-26 18:26:57
3 跟貼 3
2年經驗拿3倍工資： senior工程師的5個隱藏技能

碼上閑敘 2026-03-28 13:39:14
0 跟貼 0
高效智能體幕后推手是誰？一篇綜述帶你從記憶×工具學習×規劃看透

機器之心Pro 2026-01-27 15:24:36
0 跟貼 0
接陌生電話不要先出聲

大象新聞 2026-03-29 07:29:10
569 跟貼 569
一輛自行車賣18萬元還被搶光，上海"首發經濟"憑的是什么？

界面新聞 2026-03-29 08:01:04
178 跟貼 178
周柏豪演唱會挑觀眾上臺！幸運兒被觀眾惡意遮擋！

小邵說劇 2026-03-29 14:42:35
0 跟貼 0
SIGGRAPH Asia 2025 | 讓3D場景生成像「寫代碼」一樣靈活可控

機器之心Pro 2025-11-14 19:18:57
0 跟貼 0
51集諜戰大劇來襲，連續4天全國第一，破亂象迷霧、啟初心導航

阿樂樂電影v 2026-03-29 14:53:53
1 跟貼 1

手機 / 數碼

房產 / 家居

airCloset 991張表困局：一個日本CTO用自然語言"拆

從"人形接口"到自然語言：工具設計拆解

圖譜構建：10年技術債的自動化梳理

安全與權限：生產數據的"只讀沙箱"

實際效果：從"等人"到"直接問"

馬斯克承認xAI"建錯了"，11位創始人均離職

單親爸爸記錄女兒成長寫滿19個日記本 4年前患癌去世

單親爸爸記錄女兒成長寫滿19個日記本 4年前患癌去世

絕殺衛冕冠軍后，他單手指天把勝利獻給父親

張凌赫事件持續升級！官方點名怒批

Kimi、Minimax 們的算力荒

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態度原創

河南師范大學2026考研復試分數線發布

今年春天最火的疊穿法則，照著搭時髦又減齡！

DDR5內存數月來首次大降價！幕后推手曝光

為什么芬蘭教育全球第一？女兒在“海淀芬蘭”幼兒園揭秘…

日本展出超清版《十七帖》，放大后的細節令人驚嘆，足以改寫書法史！

嵐圖泰山X8配置曝光四激光雷達/華為新一代座艙