![]()
智東西
作者 駿達 江宇
編輯 漠影
智東西1月10日報道,今天,清華大學基礎模型北京市重點實驗室發起的“AGI-Next”峰會上,多位國內頭部開源AI實驗室的技術掌舵人罕見同場亮相。智譜創始人兼首席科學家唐杰、月之暗面創始人兼CEO楊植麟、阿里千問大模型技術負責人林俊旸和騰訊總裁辦公室首席AI科學家姚順雨等人,就AGI路徑、Scaling極限、Agent落地與中國AI的長期機會等熱點話題,進行觀點的交流和碰撞。
![]()
這場會議長達三個半小時,充滿學術氛圍:沒有主持人串場,沒有冗長的嘉賓介紹,也沒什么場面話,這是唐杰在辦會時有意而為之的。幾位嘉賓的觀點都十分坦誠,聽完之后,我們總結出了以下8個核心觀點:
1、唐杰:Scaling(模型擴展)仍是有效路徑,但可能是“人類最輕松的偷懶方式”。真正值得探索的是讓模型具備自主Scaling能力。
2、唐杰:DeepSeek出來之后,Chat范式的競爭就基本結束了。
3、楊植麟:Scaling Law本質是把能源轉化為智能,核心在于高效逼近智能上限。
4、楊植麟:模型承載的是價值觀與品味,Scaling是技術、數據與審美的共進,探索前沿智能不會因潛在風險而停止。
5、林俊旸:Manus確實很成功,但套殼是不是未來,這本身也是個話題。
6、林俊旸:未來3-5年內中國團隊做到全球領先的概率,在大概20%,這已經是非常樂觀的估計。
7、姚順雨:垂直整合與模型應用分層兩種模式在分化,模型公司做應用不一定更好。
8、張鈸:當前大模型存在指稱、因果等五大根本缺失。他強調AGI應有“可執行、可檢驗”的定義,核心是具備多模態理解、在線學習、可驗證推理等五項能力。
一、智譜創始人唐杰:讓機器像人一樣思考,AGI仍然需要新的模型架構與學習范式
清華大學教授、智譜創始人唐杰圍繞“讓機器像人一樣思考”這一長期目標,系統梳理了他對AGI路徑的判斷。
![]()
1月8日智譜上市當天,唐杰曾在內部信中提到,“直到今天,包括智譜在內,沒有人能夠給出準確的AGI定義以及如何實現AGI的技術路徑,也許這正是探索AGI的魅力所在。”
基于這一判斷,唐杰在本次演講中系統性回溯了近年來基座模型智能化水平的演進,并結合中美開源模型的發展趨勢,對當前大模型所處階段及其面臨的關鍵分岔進行了分析。
![]()
▲基座模型在典型AI基準測試上的能力演進
他回顧了2025年,談及智譜已在語言、視覺、多模態智能體等方向開源GLM系列模型,助推中國模型首次集體霸榜開源榜單前五。
盡管如此,唐杰也坦言“我們的差距可能還在拉大”,美國閉源模型仍是不可忽視的對手。
唐杰稱,“我們是在開源上面玩了讓自己感到高興的,而差距并沒有像我們想象得那樣好像在縮小。有些地方,我們可能做的還不錯,但我們還要承認自己面臨的一些挑戰和差距。”
那下一步AGI該如何推進,在他看來,需要回到對人類認知學習過程的理解。他認為,面向未來,大模型仍缺失多項關鍵能力,而這些能力在人類身上遠遠超過大模型。
![]()
唐杰談及,“2025年可能是多模態的適應年。可能全球除了少量的幾個模型,一下子吸引了很多人,包括智譜在內的很多的多模態模型都沒有引起關注。”
他將原生多模態能力類比為人類的“感統”能力,認為這正是模型下一步需要補齊的能力。
其次,唐杰強調,大模型在記憶和持續學習能力上仍然存在明顯短板。如何構建從個體記憶到人類整體的“第四級記憶系統”,是未來需要為大模型補齊的基礎設施。
在更高層面,唐杰將反思與自我認知視為極具挑戰、但值得探索的方向。
他將這一判斷放入“人類認知框架”中進行解釋,“人類認知是雙系統,系統1和系統2。系統1完成了95%的任務……只有更復雜的推理問題……這時候就變成系統2了。”他認為,大模型同樣需要構建系統1、系統2以及自學習機制的協同。
![]()
系統一依賴大規模數據和參數的Scaling,系統二則依賴推理、指令微調與思維鏈,而自學習機制則對應人類在無意識狀態下的持續學習能力。
但唐杰也明確提到,單純依靠數據和參數規模的Scaling已逐漸顯露瓶頸,“我們能不能找到更好的知識壓縮的方法,把知識壓縮到更小的空間里面,這是一個新的問題。”
他認為,Scaling仍然重要,但必須尋找新的路徑,“Scaling是一個很好的辦法,但Scaling可能是最輕松的辦法,是我們人類偷懶的一個辦法。”真正值得探索的,是讓模型具備自主Scaling能力。
而面向真實世界,唐杰認為大模型還必須具備完成超長任務的能力。
最后,唐杰從計算機本體能力出發,給出了總結:“在我看來計算機有三個能力:第一,計算機的表示和計算;第二,編程;第三,本質上是搜索。”他認為,正是這三種能力的疊加,使計算機具備了走向“超級智能”的潛力。
在對2026年的判斷中,唐杰也給出了較為清晰的技術聚焦方向。他直言,“2026年對我來說更重要的是要專注和做一些比較新的東西。”
![]()
在他看來,Scaling仍將繼續,但重點正在發生變化,“已知的是我們不斷加數據、不斷探索上限。還有Scaling未知,就是我們不知道的新的范式是什么。”
圍繞這一未知范式,唐杰強調模型架構層面的創新將成為關鍵,解決超長上下文,還有更高效的知識壓縮問題,并會實現知識記憶和持續學習。
與此同時,多模態感統被他視為2026年的重點方向之一。只有具備這一能力,AI才能真正進入長任務、長時效的工作環境,AI才能實現具身,才能進入物理世界。
在應用層面,唐杰也對AI for Science寄予厚望,“我相信今年可能是AI for Science的一個爆發年,因為很多能力大大提升,我們可以做更多的事情。”
二、月之暗面楊植麟:Scaling不止堆算力,下一代模型技術、數據與“品味”會共同進化
月之暗面創始人兼CEO楊植麟認為,自2019年以來,大模型始終遵循同一條第一性原理——Scaling Law,本質是“把能源轉化成智能”。在數據與算力受限的背景下,如何用更少投入獲得更高智能,成為核心命題。
![]()
楊植麟強調,Transformer之所以成為主流架構,關鍵在于其更優的Scaling表現。
尤其在長上下文場景中,Transformer相較傳統架構展現出明顯優勢,而這正是Agent時代的基礎能力。復雜任務必須依賴超長Context,模型的Position Loss越低,Agent潛力就越大。
圍繞這一判斷,Kimi的預訓練策略聚焦兩條主線:Token效率與長上下文能力。
![]()
在token效率層面,團隊提出了改進的Muon優化器Moonlight Muon,實現約2倍Token效率提升,并通過QK-Clip解決Logits爆炸問題,支撐萬億參數模型穩定訓練。
在長上下文方向,Kimi-Linear與全新的線性注意力機制,在保證效果的同時大幅提升推理速度,為超長Context任務提供現實路徑。
楊植麟認為,更強的模型先驗可以顯著縮小搜索空間,使AGI“更早發生”。
他同時提出,模型并非普通工具,而是在塑造一種世界觀。他稱,智能是一個Non-Fungible Token(非同質化通證),它承載著品味、審美與價值觀。Scaling不只是堆算力,更是技術、數據與“品味”的綜合進化。這正是下一代模型K3要做的事情——新架構、更大規模合成數據、品味提升等等。
![]()
他借用Kimi與他討論時的話總結道:我們不應因風險而停滯,放棄探索,就等于放棄人類文明的上限。
三、阿里林俊旸:從語言模型到具身智能,千問為何走向Generalist Agent
“原來叫Towards a Generalist Model,后來我改成了Generalist Agent。”林俊旸在演講開場解釋了PPT標題的變化。
![]()
他認為,相比模型本身,Agent是一個更大的概念,像人一樣能夠自主使用工具,在環境中完成任務,這是他理解中AI應該走的方向。
林俊旸稱,今天的大模型訓練方式已不同于以往。“以前訓練模型就是配對輸入輸出、加上人工標注,這就是傳統的做法。”但在今天,“只要解決了推理,解決了評估,這個東西就可以擴展,很多事情都能做,我也可以發揮更多想象力。”
他坦言,“這也是我一個做語言模型的人,最近敢斗膽揚言‘我要做VLA和機器人’的一個小小原因。”
在講述通義千問技術團隊的下一步方向時,林俊旸概括了三項重點:
第一,是構建具備視覺輸出與推理能力的Omni模型,把能力真正收斂到多模態模型中,不只是能接收文本、圖像、語音,也要具備同時生成這些模態的能力。
第二,是從“訓練模型”轉向“訓練Agent”,特別是通過“多輪強化學習和環境反饋”,實現面向長時任務的推理能力(long-horizon reasoning)。
第三,是把語言模型進一步轉化為具備行動能力的Embodied模型。
![]()
他認為,從這個角度出發,模型才有可能真正走向Digital Agent,能夠進行GUI操作、調用API,形成完整的執行閉環,“如果再往物理世界走,能不能拿起話筒、斟茶倒水,這也是我們很想去做的事情。”
四、模型分化,范式未定:中國AI的領先之路與關鍵瓶頸
圓桌論壇中,唐杰、林俊旸、姚順雨以及加拿大皇家學院院士、香港科技大學榮休教授楊強四人展開觀點交流與碰撞,他們主要聊了四大問題:模型的分化、AI研究的范式轉變、Agent的未來和中國在全球AI競爭中的位置。
(1)模型正在明顯分化:做Coding、做Chat、做全模態,背后的邏輯是什么?
姚順宇稱,自己有兩大感受。一是To-C和To-B明顯發生分化。如今,行業里頂尖的To-C產品以ChatGPT為代表,Claude Code則在B端有優勢,但ChatGPT的變化對用戶來說沒有很可感,反倒是Coding革命重塑了計算機行業的行事邏輯。
在To-C領域,模型并不需要極高的智能上限,很多場景更像是“增強版搜索引擎”。真正的瓶頸不在模型本身,而在于如何為模型提供足夠的Context和環境信息。
在To-B場景中,邏輯完全不同。海外企業客戶對最強模型的付費意愿更高,在國內做To-B的難度有點大,騰訊的思路是先把自己服務好,讓模型在公司內部發揮價值。
姚順宇觀察到的另一大分化是垂直整合與模型、應用的分層。他稱自己的老東家OpenAI在Agent應用上,做得并不一定會比應用公司更好。這是由于模型能力與應用能力并不完全一致。
在To-C產品中,模型與產品強耦合、快速迭代,垂直整合是成立的;但在更復雜的To-B或Agent場景,模型變強只是起點,真正落地還需要大量工程與環境建設。
林俊旸從千問的角度談道,“分化并非選擇,而是自然發生”。OpenAI做的更像一個To-C平臺型產品,Anthropic與企業溝通更深,明顯偏B端。他還提到一個現象,中美在Coding Token的消耗量上存在巨大差距,這種差距往往被低估,這困難反映了兩個市場的區別。
![]()
楊強則從學術界和工業界的分化切入,他認為在行業進入穩態后,學術界可以開始解決工業界還沒來得及解決的問題,有必要做新的探索,拉齊差距。
主持人提到,智譜某種程度上走了Anthropic的道路,無論是Agent研究,還是Coding。不過,唐杰認為,最本質問題還是提高基礎模型的智能上限。
他舉了一個例子,在大模型剛剛興起時,國內企業爭相研發,但最終發布后,業內10來個大模型的用戶其實不多,如今才逐漸分化,原因是這些模型并沒有真正解決問題。
他認為,DeepSeek出來之后,Chat領域的競爭就基本結束了。智譜經過內部討論決定押注編程,傾注了所有的精力。
(2)AI領域下一個范式轉變是什么,從哪兒來?
姚順雨認為,ASI最重要的能力之一是自主學習。但目前的瓶頸不在方法論,而在于數據與任務設計。ChatGPT通過用戶數據擬合人類聊天風格,本質就是一種自主學習;Claude Code里95%的代碼就是由Claude Code自身撰寫的,這也是自主學習。目前外界對模型能力的感知不明顯,只是因為其受限于場景,并且處于漸變的發展過程中。
林俊旸認為,目前,強化學習的算力遠未充分Scale,Test-Time Scaling與AI Scientist方向都有巨大潛力。未來,模型的個性化、記憶的進步,都可能會給人們帶來能力出現巨大飛躍的“感受”。但是從業內視角來看,技術發展沒有很快,做的工作也較為基礎。
楊強提出,聯邦學習與去中心化協作,是解決隱私、資源不均和大模型協同的重要路徑。
![]()
唐杰則從一個更為基礎的角度分析這一問題——范式轉變究竟源自于什么地方?他認為,去年和前年,工業界快于學術界是一個事實,許多研究者根本沒有算力。但到現在,很多學校已經有了算力,學術界可以開始做大模型研究、探索模型架構,不再是由工業界主導的狀態。學術界有創新的基因,會孵化出種子了。
他補充道,創新的動因是現有范式收益效率的下降。繼續Scaling是“最笨的辦法”,典型的工程做法,而未來探索智能效率也是一大方向。唐杰比較樂觀,認為2026年肯定會有范式轉變的發生。
(3)2026年,Agent怎么做?
姚順雨觀察到,Agent賽道同樣出現了B端和C端產品的分化。To B方向已經進入持續上升通道,且短期內看不到放緩跡象。它并不依賴花哨的創新,而是通過不斷擴大預訓練規模、扎實做好后訓練,把真實世界任務吃透,模型就會自然變得更聰明,并直接轉化為更高的生產力和商業價值。
在To B場景下,模型智能、任務覆蓋和收益之間高度正相關,目標極其一致。相比之下,To C中模型能力與DAU等產品指標往往弱相關甚至負相關,反而更難聚焦。
當前To B的生產力型Agent仍處早期階段,下一步關鍵在于環境與部署,而非模型本身。即使模型停止進化,僅靠大規模落地部署,也可能帶來10–100倍效率提升,對GDP產生顯著影響。
林俊旸認為,Agent的發展本質上是一個產品哲學問題。他直言:“Manus確實很成功,套殼是不是未來,這本身也是個話題”。
他更認同“模型即產品”的方向。未來的Agent不應只是外部應用,而是模型本身直接承擔產品能力,研究人員也需要像產品經理一樣,把研究成果做成真實世界可用的系統。
隨著主動學習的發展,Agent將具備長時間托管式工作的能力,在執行通用任務的過程中自行進化、決定行動路徑,這對模型能力上限提出了極高要求,也意味著做基礎模型本身就是在做產品。
進一步來看,Agent的潛力還取決于其與環境的交互深度,目前主要停留在數字環境中,未來若能進入真實物理世界、結合機器人與實驗系統,才可能真正承擔長周期、高價值任務。
關于通用Agent的機會歸屬,林俊旸認為取決于是否能解決長尾問題:若創業者是“套殼高手”,在產品層面能做得比模型公司更好,那仍有機會;否則模型公司憑借算力、數據和強化學習,往往能更快覆蓋這些問題。
楊強認為,Agent的核心分化在于“目標”和“規劃”是否由AI自主完成。他指出,當前階段“目標也是人定義的,規劃也是由人來做的”,仍然非常初級。真正成熟的Agent,應當能夠通過觀察人類工作、充分利用數據,最終成為由大模型內生的原生系統。
唐杰則強調Agent能否成立取決于價值、成本和速度三點。首先,關鍵在于Agent本身有沒有解決實際問題,否則很容易被簡單的prompt或API替代。
其次是成本約束,如果成本特別大,也是一個問題。最后是時間窗口“如果能拉開半年的時間窗,迅速把應用做出來,才可能形成優勢。
在他看來,大模型競爭已進入拼速度、拼時間的階段,Agent等應用仍是方向,但成敗取決于執行效率。
(4)3-5年后,中國團隊成為全球最領先的AI團隊的概率有多大,文化、關鍵條件還差在哪兒?
姚順雨認為,中國在工程能力、產業化和人才密度上具備顯著優勢,一旦技術范式被驗證,往往能以更高效率追趕甚至局部超越,未來領先的概率很大。目前的關鍵瓶頸在于算力、光刻機與軟件生態,以及To B市場和國際商業環境。
同時,他強調中國真正需要突破的是能否引領“新范式”,這依賴更多敢于長期探索、容忍不確定性的研究文化,而非過度依賴榜單與短期確定性成果。
![]()
林俊旸相對謹慎,他認為中美在算力規模和研究資源投入上仍存在巨大差距,美國算力要多1-2個數量級。美國能將大量算力用于下一代前沿研究,而他稱國內的交付工作就已經占據了很多算力。
但他也認為“窮則生變”,軟硬件協同、模型與芯片共設計可能孕育新機會。他認為未來3-5年內中國團隊全球領先的概率在大概20%,并且這已經是非常樂觀的估計。
不過,他并不恐懼這種差距,而是建議業內保持冷靜的心態,并回歸初心,考慮模型能為人類社會帶來什么價值。他稱,就算自家模型不是最強的也能接受。
楊強從歷史視角出發,認為中國在互聯網與應用層曾實現快速追趕,AI作為通用技術同樣具備潛力,尤其在To C領域百花齊放,To B也將通過工程化與知識遷移逐步成熟。
唐杰則指出代際變化帶來的希望:90后、00后更具冒險精神,若營商環境與資源配置進一步改善、個人長期堅持,中國AI創新仍有現實機會。
五、清華大學張鈸院士:AGI要有“可檢驗”的定義,大模型有五個根本缺失
聽完前面幾位嘉賓的分享,已經91歲的中國人工智能研究先行者、清華大學教授張鈸院士臨場做了一份PPT,回應了“從語言模型到AGI”的幾個關鍵問題。
他認為,大模型雖然能生成流暢語言,但它基于的是近似的語義定義,本質上只是把詞語周圍出現頻率最高的詞,變成向量空間的幾何結構。
![]()
而這種建模方式不可避免地帶來五類缺失:指稱缺失、因果缺失、語用缺失、多義和動態語境缺失,以及閉環行為缺失。這些缺失直接影響語言模型做應用的能力。
同樣,面對“從語言模型走向Agent”的行業趨勢,張鈸院士還提出,應該拋棄模糊、不可執行的AGI定義,重新建立一種“可執行、可檢驗”的標準。
![]()
他認為,“大家都說AGI,因為AGI很有吸引力,這里有一個誤導,大家以為做AGI都要做通用,其實AGI確實強調通用,但是跟我們目前想做的事不是一回事,但現在大家都這么用,我們也只好這么用。”
例如,馬斯克說:“我們人類70%以上的任務,機器都會干,而且達到或者超過人類的水平”。這樣的說法,既無法執行,也無法驗證,容易造成誤解。
“什么叫做達到人類水平?時變率超過人類,算不算達到人類的水平,有的人說算,有的人說根本不算,如果魯棒性從其他方面來看差得遠。”他反問道。
他認為應該有一個“可執行、可檢驗”的AGI定義,核心是五個能力:時空一致的多模態理解與落地、可控的在線學習與適應、可驗證的推理與長期執行與規劃、可校準的反思與元認知,以及跨任務的強泛化。他說,“按照這個定義,應該是可以指導我們往前做的。”
同時,張鈸院士還提醒,真正需要治理的不是AI本身,而是“研究者和使用者”。他認為,“這里頭,涉及到我們人工智能時代的企業、企業家應該擔負什么責任。”
![]()
他稱,過去并不鼓勵學生創業,但現在認為“大模型改變了一切,最優秀的學生應該去搞企業”。
在他看來,AI時代的企業家不只是做產品服務,而是要把知識、倫理和技術變成可復用的工具,推動AI像水電一樣服務全社會。他覺得這是一份“光榮而神圣的職業”。
結語:關于AGI的方向、形態與邊界,仍在不斷厘清
從“Scaling還夠不夠用”,到“Agent是不是只是套殼”,再到“通用智能能不能被可檢驗地定義”,這場AGI-Next峰會展現了當前中國AI技術領軍者們對下一階段智能路徑的分歧與共識。
可以看到,在模型發展路線圖上,有人繼續押注更長上下文、更強推理、更穩訓練的工程演進,也有人開始強調新架構、新記憶范式和Embodied模型。
在產品形態上,有人堅持“模型即產品”,也有人探索更強執行力與主動性的具身體系。而在AGI定義本身上,更有學界前輩呼吁回到“可執行、可驗證”的概念,拒絕空泛與誤導。
誰能在范式變動中明確方向,在落地節奏中建立真實優勢,或將成為決定接下來幾年AI格局的關鍵變量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.