![]()
“像設計芯片一樣設計流計算。
初冬的黃浦江畔寒意料峭,但在“第八屆金猿大數據產業發展論壇”的現場,關于“AI Infra”的討論卻熱度驚人。這并非一場普通的行業聚會,在大數據國家戰略落地十周年的節點上,技術圈的焦慮與興奮并存:當大模型狂飆突進兩年之后,企業界赫然發現,那個被寄予厚望的“Data Agent”,正被陳舊的數據基礎設施卡住了脖子。
“在數字孿生的世界里,你的最終用戶不一定是人,它可能是一個Agent。”
站在聚光燈下的程訓燾語速極快,透著技術專家的干練。作為浙江智臾科技DolphinDB的首席架構師,他在當天的演講《實時決策時代:AI與低延時計算如何重塑數字孿生》中,拋出了一個讓在場眾多CIO(首席信息官)深思的命題:當數據庫的“甲方”從秒級反應的人類,變成了微秒級反應的AI智能體,我們的基礎設施該如何重構?
當用戶不再是“人”
“過去十年,我們所有的軟件界面、查詢速度、交互邏輯,本質上都是為人設計的。”程訓燾在演講開篇便直擊痛點。
人類是感性的,也是遲緩的。在傳統的商業智能場景中,一個SQL查詢如果能在3秒內返回報表,分析師就會覺得“很快”。然而,這種“快”在AI Agent眼中,無異于慢動作回放。
程訓燾打了個比方:“人不可能像機器一樣以微秒級的速度去對一個事件作出響應。但是進入了智能時代,Agent不知疲倦,它可能在短短一小時內,代表幾百萬個消費者對你的廣告策略進行了一輪又一輪的模擬反饋。在這個過程中,它對底層數據的吞吐量和延遲要求,是人類用戶的成千上萬倍。”
這種用戶主體的變更,正在倒逼底層架構發生地質層級的斷裂。
在程訓燾看來,傳統的以“存儲+事后分析”為主的數據庫模式,已經無法支撐Agent的需求。Agent需要的是“感知-決策-行動”的實時閉環。他描繪了一個典型的金融場景:在瞬息萬變的A股市場,當某只股票的價格觸發了特定指標,人類交易員可能需要5秒鐘來反應、確認、下單,而這5秒鐘,“市場已經變了”。但對于一個裝備了高性能計算底座的Agent來說,從捕捉信號到完成風控計算再到發出指令,只需要“幾微秒”。
“這不僅僅是速度的提升,這是維度的跨越。”程訓燾強調,“當計算延時被壓縮到微秒級,量變就引發了質變。我們不再是看著后視鏡開車,而是讓AI坐在駕駛位上,實時規避路面上的每一顆石子。”
為了應對這種變革,DolphinDB在2025年密集推出了被稱為“深海艦隊”的新產品矩陣,包括CPU-GPU異構計算平臺Shark、極速嵌入式引擎Swordfish以及企業級流計算平臺Orca。這些產品的命名本身就帶有強烈的攻擊性與速度感,似乎在暗示DolphinDB正如海豚一般,在數據的深海中構建起敏捷而龐大的生態系統。
超越物理的“邏輯孿生”
演講過程中,程訓燾對當下火熱的“數字孿生”概念進行了祛魅與重構。
“以前大家談數字孿生,想到的就是GIS或者BIM。我們要把物理世界1:1地復刻進電腦里,每一根水管、每一面墻都要對得上。”程訓燾認為,這種基于物理復刻的孿生雖然在無人機導航、城市規劃中價值巨大,但它有一個致命弱點,“你在這個模型里跑一次仿真,可能需要幾個小時。”
DolphinDB眼中的新一代數字孿生,是“邏輯孿生”。
“數字世界沒有必要跟物理世界長得一模一樣,”程訓燾指出,“它不需要遵守物理定律,它只需要遵守業務邏輯。”
他舉了電商的例子,企業不需要在數字世界里復刻商場的物理貨架,而是需要復刻幾百萬消費者的購買行為邏輯。當企業向市場推出新化妝品時,Agent可以模擬海量用戶的點擊、瀏覽、下單行為。這種仿真不依賴物理空間的坐標,而是依賴海量事件流的實時計算。
“這才是流計算真正的戰場。”程訓燾表示,無論是工業物聯網中對發電機組震動的實時監控,還是金融市場中對千只股票的毫秒級盯盤,本質上都是在對“邏輯世界”進行實時推演。
然而,要支撐這種“邏輯孿生”,現有的技術棧顯得捉襟見肘。傳統的SQL數據庫只能處理靜態的關系數據,無法表達復雜的流式邏輯;而專業的流計算框架對于普通業務開發者來說,門檻又太高。
“你很難想象一個業務專家去手寫幾千行代碼來管理流計算的狀態水位線,”程訓燾搖了搖頭,“這就像讓建筑師去親手燒磚一樣荒謬。”
![]()
像設計芯片一樣設計流計算
如何解決“好用”與“高性能”的矛盾?程訓燾給出的答案是聲明式流計算。
“以前設計芯片,工程師不可能手動去擺放每一個加法器和乘法器,也不可能手動布線,因為約束條件太多,人腦處理不過來。EDA軟件解決了這個問題,它讓工程師只關注邏輯,軟件自動完成布局布線。”
程訓燾透露,DolphinDB正在做的事情,就是構建流計算領域的“EDA”。
“我們希望用戶只需要聲明他的意圖:‘我要監控這1000個傳感器,如果過去5分鐘的平均溫度超過標準值的20%,就給我報警’。至于這個數據流怎么拆分、中間狀態怎么存儲、是在內存里算還是落盤算,用戶不需要關心。”程訓燾解釋道,“系統會自動推導依賴關系,自動生成底層的計算圖,自動部署分布式引擎。”
這種“聲明式”的變革,不僅解放了人類開發者,更重要的是,它對AI Agent極度友好。
“讓Agent去寫復雜的C++代碼是不現實的,但讓Agent用自然語言描述一個業務規則,然后轉化為聲明式的腳本,這是目前大模型最擅長的事情。”程訓燾興奮地表示。
在DolphinDB的架構圖中,存在著獨特的“流數據表”設計。程訓燾將其比作“河流上的碼頭”。數據像河流一樣奔涌而下,流數據表就是沿途的碼頭。數據可以在碼頭暫存、清洗,或者直接流向下個碼頭。用戶可以根據業務拓撲,自由定義這些“碼頭”的功能,是作為短期記憶的緩存,還是作為長期記憶的倉庫。
誰為Agent提供“海馬體”?
隨著演講的深入,話題不可避免地觸及了AI落地的深水區,記憶與隱私。
在程訓燾提出的“智能化底座三層架構”中,“認知記憶管理”被擺在核心位置。他認為,當前的大模型雖然智商很高,但普遍患有“健忘癥”,上下文窗口有限,且難以利用企業私有的行業知識。
“如果把大模型比作大腦的皮層,那DolphinDB正在試圖成為它的海馬體(負責記憶)和神經末梢(負責感知)。”
程訓燾詳細拆解了這個“認知記憶系統”:最前端是感知層,處理傳感器和市場的原始流數據,這需要極高的寫入吞吐量;中間是短期記憶層,為Agent提供當下的工作上下文。“這部分數據必須駐留在內存中,哪怕DRAM價格再貴,為了微秒級的響應,這個成本是必須付出的。”
后端是長期記憶層,存儲企業沉淀下來的規則、預案和歷史數據。“比如電網公司在臺風天氣的應急預案,或者資深醫生的診療路徑。這些數據是企業的核心資產,絕不能上傳到公有云去訓練大模型。”
為了打通這三層記憶,DolphinDB研發了跨模態聯合索引技術。以醫療場景為例,一個病人在醫院的活動,會產生血液檢測的浮點數、CT掃描的圖像數據、醫生診斷的文本數據。傳統的數據庫是將這些數據割裂存儲的,浮點數存時序庫,圖像存文件系統,文本存搜索引摯。
“但這在邏輯上是同一個病人。”程訓燾強調,“我們的底座必須有能力打破這些數據的‘次元壁’,將不同模態的數據關聯到同一個自然實體上。只有這樣,Agent才能像一個經驗豐富的主任醫師一樣,綜合所有信息做出精準判斷。”
![]()
突圍:從金融腹地到工業藍海
作為技術驅動型公司,智臾科技的發展路徑帶有鮮明的“硬科技”色彩。
自2016年成立以來,DolphinDB選了全棧自研這條最艱難的道路。在那個開源數據庫大行其道的年代,他們堅持不基于任何開源項目二次開發,從底層存儲引擎到計算引擎一行行代碼寫起。官方數據顯示,其核心代碼自研率超過95%。
這種“笨功夫”在初期不僅研發周期長,還面臨著商業化的巨大壓力。但程訓燾堅信,只有掌握底層代碼,才能在性能優化上做到極致。
事實證明,這條路走通了。DolphinDB首先攻下的,是對性能要求最苛刻的量化金融領域。國泰海通證券、華泰證券、華夏基金等頭部機構紛紛成為其客戶。在金融這個“練兵場”里,DolphinDB經過了高并發、低延遲的極限壓測,練就一身“金鐘罩”。
“如果你能處理好每秒百萬筆的股票交易數據,那你去處理工廠里的傳感器數據,就是降維打擊。”
隨著工業4.0的推進,DolphinDB正在快速將金融級的能力復制到工業物聯網領域。長江電力的發電機組監測、比亞迪的智能制造、甚至新能源車的電池熱失控預警,都開始出現DolphinDB的身影。在DB-Engines的全球排名中,DolphinDB已穩居國產時序數據庫第一名,并在全球榜單中躋身前列。
資本市場也敏銳地嗅到這股技術紅利。雖然程訓燾在采訪中對融資細節保持低調,但公開資料顯示,智臾科技已完成了由方廣資本領投的億元級B輪融資,投資方名單中不乏朗瑪峰創投等硬科技推手。
![]()
演講臨近結束時,程訓燾談到了對未來的展望。
他坦言,數據主權與技術共享之間存在著天然的張力。企業既想利用最先進的AI能力,又恐懼核心數據資產的流失。對此,他提出了“開源數據標準+商業化計算引擎”的解題思路。
“數據的格式應該是開源的,比如Parquet、Arrow,這樣用戶的數據不會被鎖定。但處理數據的引擎,應該是商業化的、私有的。”程訓燾總結道,“就像電網是通用的,但你家里的電器可以是高端定制的。企業可以用DolphinDB這樣的商業引擎在本地安全地處理標準數據,既享受了極致性能,又守住了數據安全。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.