![]()
智東西
作者 許麗思
編輯 漠影
智東西11月22日報道,今天,一年一度的IDEA大會在深圳舉行。這場人工智能盛會由IDEA研究院創院理事長、美國國家工程院外籍院士沈向洋發起,深入探討了關于AI發展、AI Agent、具身智能、低空經濟等前沿技術與熱點議題。
沈向洋進行了近3個小時主題演講,期間發布了多個IDEA研究院創新成果,包括企業決策智能體、數據分析智能體、藥物計算發現平臺、金融大模型、GPU原生渲染器、視覺大模型、低空管理與服務操作系統等。
想要理解人工智能演進,沈向洋強調,需要在算力、算法和數據之外,增加兩個考慮維度:交互與載體。如今,談大模型總繞不開英偉達CEO黃仁勛,沈向洋打趣說,“黃仁勛每天醒來都在笑,整個世界的人在給他捐錢。。”
在具身智能方面,沈向洋對格外看重靈巧手,強調,“人手的魔法在于它手既能搬箱子,也能穿針引線。所以,靈巧手可以說是人類在人工智能面前,最后的尊嚴。”他還提到去年與黃仁勛的對談時,黃仁勛說,“具身智能是粵港澳大灣區非凡的機遇。”
據了解,IDEA大會于2021年首度舉行,匯聚產學研企界領袖,致力構建一個凝聚數字經濟多方力量的國際化平臺,是粵港澳大灣區最具影響力的科技盛會之一。
一、AI發展路線五大維度:算力算法與數據之外,還要關注交互和載體
除了廣為人知的了算力、算法、數據這三要素之外,沈向洋提出,未來理解AI的演進還必須加入兩個維度:交互和載體。
![]()
1、算法范式
算法是AI發展的核心支撐。AI的算法演進有三個階段:監督學習構筑表達與生成能力,強化學習引入因果與執行,自主學習邁向高層認知。技術本身從Transformer架構出發,向更高效、更穩健的體系演化;從自回歸到擴散,再到混合式生成方法,這些變化共同推動智能的表達邊界不斷拓展。
2、智能載體
AI的載體發展遵循從抽象到具體、從虛擬到物理的擴展路徑:從早期的語言模型,逐步演進到涵蓋聲音、圖像、視頻甚至4D內容的多模態模型;在此基礎上,融入物理世界規律的世界模型成為新方向,而當世界模型落地到機器人、自動駕駛車輛、飛行器等物理實體時,便形成了具身模型。
“從載體的這個維度來看,AI很快就會幫助我們從理解這個世界,走向改變這個世界。”沈向洋說。
3、交互范式
過去七八十年,計算機科學的一條主線就是人機交互方式的演進:從命令行,到圖形界面,到互聯網搜索,再到推薦系統。AI的到來,則帶來了自然語言和多模態的交互。
早期的第一代大模型,更像問一句答一句的搜索;而近兩年的推理模型則讓對話成為一個持續迭代的過程:你問、它答,你再追問、它再推理,過程越來越像真實的科研活動。
在他看來,“探索世界就應該是Search less,research more。”未來,AI會越來越多地主動提出問題、主動執行任務,但在人機系統中,人仍需在關鍵節點做決策、做最終判斷,以確保AI的行為不偏離邊界。
4、計算架構
GPU從2006年作為通用并行計算系統起步,從打游戲到“挖礦”再到支撐大模型訓練,如今已成為基礎設施。但當前算力需求呈現新變化:推理需求已經遠超訓練,端側芯片和強化學習專用芯片的需求也迅速上升。強化學習芯片必須支持高速交互和大規模并行,推理芯片則要做到低功耗、高吞吐。
GPU刺激了深度學習的第一波爆發,但能耗與成本也不斷攀升。隨著應用多樣化,推理、端側、強化學習等專用芯片不斷涌現;未來光子、量子、類腦等也可能在特定領域帶來性能躍升。
5、數據
在智能演進的三個階段,數據扮演不同的角色:在模擬世界階段,數據是靜態教材;在探索世界階段,數據是動態反饋;在歸納世界階段,數據是驗證假設的證據。
當我們轉向強化學習、探索世界時,模型需要的就不再是靜態數據,而是帶反饋的動態數據。沈向洋用一個樸素的類比強調這一點:“就像騎自行車這件事,你光看書的話不可能會學會騎自行車的。”
從人類數據枯竭到合成數據興起,再到AI主動探索并獲取實驗數據,這一過程代表著數據從限制模型能力的約束,逐步轉變為推動AI主動學習的工具。
在沈向洋看來,未來AI最強大的能力之一,是能夠自己提出假設,并自己收集證據來提升智能水平。在這個過程中,數據和智能是相互推動的。
二、發布金融大模型、GPU渲染引擎等,下個月開源MoonBit agent SDK
合成數據已經成為大模型訓練的剛需要素,尤其在小語種、隱私敏感行業、小樣本場景等長尾領域,數據稀缺更是主要瓶頸。
成立于2025年的DataArc數創弧光,專注大模型合成數據技術,是IDEA研究院成立以來孵化速度最快的項目,成立不足一年已完成兩輪融資。本屆大會上,DataArc發布了SynData開源框架。
在沈向洋看來,除了數據層面的機會,模型層面也遠不止超大模型這一條路,各類垂直應用場景同樣蘊含巨大空間。金融,就是其中的典型代表。
本次大會發布的Quant 5.0,是一個基于金融時間序列的底座大模型。
傳統金融投資面臨行情預判精度不足、風險管控難度較大的挑戰,Quant 5.0融合AI技術,憑借大參數算力支撐及高頻數據訓練,可支持三類任務:對未來收益和走勢的預測,服務投資決策;為交易所、監管機構及機構投資者提供風控能力;為監管與決策提供市場模擬和壓力測試工具。
由于Quant 5.0是通用時間序列底座模型,它可以輕松遷移到其他市場、其他資產類別以及其他交易策略上,并通過Agent方式實現策略自動化部署。
![]()
現場發布了國內首個提供公共服務的工業級AI驅動GPU渲染引擎SMARAY,在保證高質量渲染效果的前提下,其渲染效率較傳統渲染器提升數十至數百倍,且可兼容主流動畫特效建模軟件,無需改變現有工作流 。
目前,SMARAY已獲《流浪地球2》視效制作方More VFX、《哪吒》系列出品方光線動畫等頭部影視團隊項目實踐驗證。
![]()
另外,現場還介紹了IDEA研究院的MoonBit團隊的最新成果。MoonBit是IDEA研究院自研的AI時代新編程語言,今年,MoonBit從支持多后端的編程語言,逐步演進為涵蓋AI原生工具集的全棧工具鏈,覆蓋WebAssembly邊緣計算、C/LLVM系統編程、JavaScript前端開發等全場景,構建起集開發者工具鏈與智能體開發生態于一體的開發者平臺。
今年,MoonBit也開放了全球首個語言原生的智能體開發環境MoonBit Pilot,智能輔助生成MoonBit工具包,可快速擴展MoonBit生態。
![]()
下個月,IDEA研究院將正式開源用MoonBit編程語言開發的智能體平臺MoonBit agent SDK,支持使用多種編程語言。
截至目前,MoonBit社區用戶已從早期的500人、去年的2.6萬人,增長到十萬級規模;全球貢獻代碼行數超過1000萬行,生態庫約3000個。
三、從個體、公司到治理、創新,AI Agent帶來了哪些影響?
AI Agent是大模型落地的重要產品載體,也是人工智能行業從業者多年來關注的核心方向。進入2025年,全球尤其是中國的AI Agent創新全面爆發。沈向洋從四個層面來梳理AI Agent的影響:個體、公司、治理與創新。
1、個體
AI Agent帶來了生產力的巨大提升,徹底改變了傳統工作模式,一個人加上一堆AI Agent,就會成為所謂的超級個體。這種生產力的飛躍直接推動了生產關系、組織機構、分工形式與協同方式的變革,而成為超級個體的關鍵在于是否愿意學習和運用AI Agent。
同時,沈向洋覺得,未來CEO可能不再是單純的Chief Executive Officer,而更像Chief Entertaining Officer,個體與組織的關系將被重新定義。
2、企業決策
沈向洋判斷,未來越來越多企業將成為“AI Native公司”,從組織結構到業務流程,從供應鏈到市場拓展,都圍繞AI重新設計。
為此,IDEA研究院推出了KAIROS決策智能體,核心就是讓AI真正進入企業的決策鏈路。
其能通過三大能力打造“決策-執行-反饋”閉環:一是借助通用大模型語言理解能力,結合企業數據與經驗,精準解讀業務需求;二是針對復雜決策提供更優的端到端優化方案;三是通過自動編程、代碼生成實現模型自適應演變,降低維護成本。
落地場景中,KAIROS應用覆蓋物流、倉儲、港口、零售等多場景,可支撐規劃類、調度類、預測類等全類型決策。
![]()
3、政府治理
在政府治理體系中,統計部門是一類關鍵角色。長期以來,統計局的工作人員需要“肩挑手扛”:去各處找數據、整材料,為領導寫報告。而大模型的發展,正在推動這項流程走向自動化和智能化。
IDEA研究院去年發布的“經濟超腦1.0”已能看懂數據、理解背后邏輯,而升級后的“經濟超腦2.0”,能夠構建全流程自動化數據分析體系,依托Agents驅動的智能框架,實現效率提升10-30倍,關聯模糊需求與業務指標、自動拆解宏觀分析需求,讓數據分析回路從被動調試升級為主動修正,推動實現數據驅動的智能化決策,釋放數據資產價值以形成更優政策建議。
![]()
4、科學創新
AI Agent對未來創新的影響,是沈向洋最為看重的。
去年,IDEA研究院已發布分子、抗體、反應、藥物文獻四大化學大模型;今年取得更大突破,研發的LightUnity模型用于創新藥發現。
在此基礎上,IDEA研究院發布Mozi平臺,以“Agent+Toolbox”模式,結合多智能體架構、專家工具箱與自動化流程,解決傳統藥物早期計算發現中工具誤導、研發黑箱、工作流瓶頸等痛點。
![]()
四、舉辦全球靈巧手+即時配送賽事,推出全新視覺大模型
不久前,傳聞特斯拉人形機器人因手部“難產”而被迫縮減生產計劃。沈向洋表示,在具身智能的眾多攻關點里,靈巧手是技術復雜度的珠峰。
他分享到,今年的深圳智能機器人靈巧手大賽,是國內首個將靈巧手技術與即時配送場景結合的賽事。從取包裹、拆包裹、折紙箱、到按電梯,以場景為旗幟,以需求為標尺,牽引技術前進的方向。
![]()
在具身智能技術發展中,視覺感知是人工智能與物理世界交互的核心基礎,更是賦能“感知-決策-執行”閉環的關鍵支撐。一年前,DINO-X視覺大模型誕生,以開放世界檢測能力,“讓機器看懂物理世界”。
今年IDEA大會上,DINO-X Grasp發布,實現世界開集2D認知理解、物體級抓取位姿預測、物體級3D形狀感知,打造“更強”具身大腦。
![]()
沈向洋總結,過去一年,IDEA研究院在具身智能方面,新成立了三個中心:
福田實驗室:這是由粵港澳大灣區數字經濟研究院(IDEA)與騰訊合作共建的省級實驗室,旨在通過跨領域合作提升技術研發能力,聚焦人居環境具身智能領域的研究。福田實驗室聯合騰訊Robotics X實驗室推出的Tairos具身智能開放平臺,是一款以模塊化方式提供大模型、開發工具與數據服務的具身智能軟件平臺。
國際先進技術應用推進中心(深圳):聚焦人工智能、具身智能、低空經濟等重點領域,依托粵港澳大灣區數字經濟研究院建設的先進技術應用推廣平臺。
深港高等研究交流中心(SHARE):旨在依托深圳與香港的區位優勢和大灣區的優質科研教育資源,搭建跨學科科研合作與國際交流平臺。中心聚焦人工智能賦能的前沿科學問題,推動其在生物醫藥、材料科學、低空經濟、無線通信、具身智能等關鍵領域的應用與突破。
會上,孵化自IDEA研究院的視覺大模型企業視啟未來還宣布完成近億元天使輪融資,該團隊創始人兼CEO張磊曾任微軟總部及亞洲研究院首席研究員。
低空經濟方面,大會發布的OpenSILAS 2.0,通過可進化框架解構六大核心技術,依據城市與空域復雜度構建產品矩陣,實現“規劃—運行—監管—服務”全環節管理與全流程服務,以分級化、模塊化提供可落地擴展方案。
結語:“攀登珠峰”VS“修公路”,要走適合自己的AI發展之路
回到沈向洋反復提到的智能演進曲線,今天看到的,不只是一個個炫目的模型和 Demo,而是新一輪技術范式剛剛起步的信號。算力、算法、數據在加速迭代,交互和載體在重塑人機邊界,AI 正從“問一句答一句”的工具,走向能與人類協同推理、共創知識的長期伙伴。
當被問及關于中美AI發展的差距時,沈向洋覺得,AI發展至少可以理解為兩個維度:一條是“攀登珠峰”,以巨額投入追求最強模型;另一條是“修公路”,讓更多人和更多場景用得上AI,讓模型在更大范圍內規模化應用,在每件事情上,都要走適合自己的發展之路。
未來,隨著技術迭代與場景深耕的雙向賦能,AI將更深刻地融入千行百業,開啟智能社會的全新階段。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.