新任騰訊CEO/總裁辦公室首席AI科學家姚順雨1月10日首次公開露面,以嘉賓身份出席清華大學北京重點實驗室主辦的AGI-Next前沿峰會,姚順雨此前曾任OpenAI研究員。他表示, 在OpenAI之前,他在一個公司實習過,這是一個toB的公司,他覺得在toB公司工作過有很多收獲,最大的收獲是即使今天的模型不再變好,所有的模型訓練全部停止了。但是我們把這些模型部署到世界上各種各樣的公司,已經能帶來今天10倍或者100倍的收益,能應對GDP產生5%-10%的影響,但是今天它對GDP的影響還不到1%。
另外他覺得教育非常重要,他觀察現在人和人的差距非常大,更多時候不是說人類替代了人類工作,而是會使用這些工具的人在替代那些不會使用工具的人,就像當年電腦出來,如果轉身學習編程跟你還在持續計算尺、使用算法,差距是巨大的。今天中國能做到的最大的有意義的事情是更好的教育,教育大家怎么更好的使用像Claude或者ChatGPT這樣的產品,在國內我們可以用Kimi或者智譜這樣的國產模型。
深圳最新引入的天才少年頂尖科學家
姚順雨入職騰訊后首次公開發聲!
1月10日,在由清華大學基礎模型北京市重點實驗室、智譜AI發起的AGI-Next前沿峰會上,,匯聚了清華大學教授、智譜創始人唐杰,騰訊AI首席科學家姚順雨,月之暗面創始人楊植麟,阿里巴巴Qwen技術負責人林俊旸等AI領域專家,圍繞通用人工智能(AGI)的最新進展、技術范式革新及產業應用展開深入討論。
![]()
峰會聚焦于AGI的關鍵技術方向與產業趨勢。 與會者普遍認為,2025年大模型技術已從早期的參數規模競賽轉向更注重智能效率與實用性提升,例如人類終極測試(HLE)基準顯示模型在復雜推理和泛化能力上取得進展,但效率瓶頸日益凸顯,未來需通過持續學習、記憶技術和多模態融合等路徑突破。 具體技術方向包括:
- 多模態模型:唐杰指出,當前模型在統一感知視覺、聲音等多源信息方面仍存在短板,需借鑒人類感覺統合機制實現原生多模態能力。
- 自主學習與Agent技術:姚順雨認為2025年已出現自主學習信號,但需明確具體任務目標;林俊旸強調強化學習潛力未充分釋放,未來AI需提升主動性,但需同步解決安全風險。
- 效率優化:行業面臨數據規模膨脹與收益遞減問題,需轉向“智能效率”導向,通過算法創新降低對算力的過度依賴。
產業層面,AI正從聊天機器人向智能體演進。 在To B市場,頂級模型因錯誤率低而具備高溢價空間,企業付費意愿集中于頭部模型;To C端則更關注對用戶實時狀態、位置等“上下文”的捕捉能力。垂直整合路線成為主流,廠商通過模型與應用層緊密耦合提升體驗,同時學術界與工業界的創新差距縮小,為范式突破提供新動力。
AGI-Next前沿峰會發言要點總結
![]()
1月10日,清華大學基礎模型北京市重點實驗室發起的AGI-Next前沿峰會匯聚了AI圈“大半邊天”,智譜唐杰、Kimi楊植麟、阿里林俊旸旸、騰訊姚順雨等專家就AGI發展路徑展開深度討論。以下是核心發言要點精華總結:
一、主題演講核心觀點唐杰:讓機器像人一樣思考,從Chat走向做事
核心判斷:DeepSeek橫空出世后,Chat范式基本結束,下一步重點是讓AI完成具體任務(如Coding、Agent)。
發展路徑:參考人類認知雙系統——系統一(記憶與模式匹配)和系統二(復雜推理),需強化多模態感知、記憶持續學習、反思與自我認知能力。
未來方向:推進三類Scaling(數據規模、推理時長、環境交互),解決超長任務規劃,探索新范式(如高效知識壓縮)。
開源生態:中國開源模型已形成影響力,但需警惕與美國的差距可能擴大。
楊植麟:Scaling Law是基石,但需優化Token效率與長上下文
第一性原理:Scaling Law是將能源轉化為智能的核心,Transformer因Scaling優勢成為主流架構。
關鍵突破:推出Muon優化器(2倍Token效率提升)和kimi Linear架構(線性注意力機制),助力Agent處理超長任務。
Agent時代:強化先驗知識可降低搜索空間,實現復雜任務自動化(如數百步代碼生成)。
價值觀導向:做模型是“創造一種世界觀”,追求智能的多樣性與審美(Taste)。
范式轉變:模型需從對話轉向執行長周期任務的Agent,需具備多模態能力(文本、視覺、語音)。
實戰進展:千問模型在代碼生成(SWE-bench達70分)、圖像編輯、語音交互上迭代,強調實用性與生產力。
開源初心:服務開發者與真實需求,覆蓋119種語言及方言,解決長尾問題。
未來重點:全模態模型、強化學習與環境交互、安全可控的自主學習。
![]()
姚順雨:toB與toC分化,Agent價值在生產力革命
市場分化:toC場景對智能需求有限(如增強版搜索),toB場景中智能直接對應生產力提升(強模型溢價顯著)。
垂直整合:toC場景模型即產品成立,toB需分層(模型+應用),真實數據捕獲是關鍵。
自主學習:已初現信號(如Cursor實時學習),但需明確場景與獎勵函數,突破需想象突破性任務(如賺錢系統)。
教育優先:教會用戶使用工具比模型本身更重要,中國需提升工具普及率。
![]()
1. 路線分化
姚順雨:toB愿為最強模型付費,toC需個性化Context;垂直整合在toC成立,toB需模型與應用分層。
林俊旸旸:分化是自然的,AGI應服務真實需求,非盲目追求通用性。
楊強:學術界需跟進理論突破(如記憶與推理的平衡、睡眠式噪音清理)。
唐杰:分化源于價值與成本權衡,需快速迭代應用窗口。
姚順雨:定義模糊,當前多是場景特定(如代碼優化),需想象突破性任務(如賺錢系統)。
林俊旸旸:強化學習潛力未完全釋放,安全是最大挑戰。
唐杰:2026年必有范式革新,因Scaling效率遇瓶頸,需提升“智能效率”。
姚順雨:toB的Agent價值明確,模型越智能收益越高;環境部署與教育是瓶頸。
林俊旸旸:Agent需與環境深度交互(如科學實驗),長尾問題體現AGI魅力。
唐杰:Agent成敗取決于任務價值、成本與應用速度。
姚順雨:概率高,但需突破算力瓶頸、培育冒險文化,避免“刷榜思維”。
林俊旸旸:20%概率已樂觀,差距在算力投入與創新環境。
楊強:toC可能復制互聯網成功,toB需本土化解決方案(如聯邦學習)。
唐杰:需敢冒險的聰明人、更好營商環境、堅持長期主義。
現狀反思:大模型基于近似語義模型,存在指稱、真知、語用等五大缺失。
AGI目標:應定義為可檢驗的五大能力(時空一致多模態、可控在線學習、可驗證推理等)。
企業家責任:需擔當治理責任,推動技術造福人類,將AI變為如水電的通用工具。
總結共識:AI正從對話轉向做事,Agent與多模態是未來重點;中美差距存在但中國有機會;范式革新需兼顧Scaling效率與理論突破;安全與治理是關鍵挑戰。
姚順雨:我觀察現在人和人的差距非常大
以下是姚順雨在AGI-Next前沿峰會圓桌討論中的全部發言內容,按討論順序整理:
大家好,我現在是不是一個巨大的臉在會場?不好意思,今天沒法親自來北京,但是很高興參加這個活動。最近忙著做模型、做產品、做AI,是一個很正常的狀態。回國的感覺還是挺好的,吃的好很多。
Q1:路線分化
我覺得有兩個大的感受,一個感受是 toC和toB發生了明顯的分化,另外一個感受是 垂直整合這條路,以及模型和應用分層 這條路,也開始出現了分化。
我先說第一點,我覺得很明顯的是當大家想到AI就是兩個,ChatGPT,另外一個Claude code,是做toC和toB的。非常有意思的一點是我們今天用ChatGPT和去年相比的話,感受差別不是太大。但是,Coding夸張一點來講,已經在重塑整個計算機行業做事的方式,人已經不再寫代碼,而是用英語和電腦去交流。我覺得很核心的一點,對于toC來說,大部分人大部分時候不需要用到這么強的智能,可能今天用ChatGPT和去年相比,寫成交代數和伽羅瓦理論的能力變強的,但是大部分人大部分時候感受不到。大部分人尤其是在中國更多像是搜索引擎的加強版,很多時候也不知道該怎么去用,把它的智能給激發出來。
但對于toB來說,很明顯的一點是智能越高,代表生產力越高,值錢的也越來越多,這些東西都是相關的。對于toB來講,還有一個很明顯的點,大部分時候很多人就愿意用最強的模型,一個模型是200美元/月,第二強或者差一些的模型是50美元/月、20美元/月。很多美國的人愿意花溢價用最好的模型,可能他的年薪是20萬美元,每天要做10個任務,像一個非常強的模型可能10個任務中,八九個做對了,差的是做對五六個,問題是你不知道這五六個是哪五六個的情況下,需要花額外精力去監控這個事情。我覺得無論是人還是模型,在toB這個市場上發現了一個很有意思的現象,強的模型和稍微差點,或者弱的模型它的分化會越來越明顯。
第二點觀察,垂直整合這條路和模型應用分層這條路的區別,我覺得一個比較好的例子,比如ChatGPT Agent,相比于用Claude或者Gemini加上Manus這樣的應用層產品,過去大家會認為當你有垂直整合能力肯定會做的更好,但起碼今天來看并不一定。首先模型層和應用層需要的能力還是挺不一樣的,尤其是對于toB或者生產力這樣的場景來說,可能更大的預訓練還是一個非常關鍵的事情,這個事情對于產品公司確實很難做,但是想要把這么一個特別好的模型用好,或者這樣的模型有它的溢出能力,也需要在應用側或者環境這一側做很多相應的事情。我們會發現其實在toC的應用上垂直整合還是成立的,無論是ChatGPT還是豆包,模型和產品是非常強耦合去緊密迭代的,但是對于toB來說這個趨勢似乎是相反的,模型在變的越來越強、越來越好,但同樣會有很多應用層的東西應用好的模型在不同的生產力環節。
騰訊肯定還是toC基因更強的公司,我覺得我們會思考怎么樣能夠讓今天的大模型或者說AI的發展能夠給用戶提供更多價值,很核心的思考是我們發現很多時候我們的環境來講或者更強的模型,或者很強的模型,很多時候是額外的Context。我最近經常舉一個例子,比如我想問我今天該去吃什么?其實你今天問ChatGPT和你去年問或者明天問都會差很多。這個事情想要變好,不是說你需要更大的模型、更強的預訓練、更強的強化學習、更強的Agent環境或者更強的搜索引擎,這個問題可能需要更多額外的輸入,或者我們叫Context。
toB確實是很難的事情,生產力的革命,包括我們今天很多中國的公司做Coding Agent需要打很多海外市場。我們會思考怎么把自己先服務好,像創業公司做Coding這個事情和大公司做Coding這個事情,一個區別是作為大公司本身就已經有各種各樣的應用場景、各種各樣需要生產力變的更好的地方。如果我們的模型能夠在這個地方做的更好,不僅這個模型會有自己獨特的優勢,不僅我們公司本身能得到很好的發展,很重要的一點是對于真實世界場景的數據捕捉會是一個很有意思的事情。比如說Cloud,這些創業公司,他們想要去做更多的Coding Agent的數據廠商去標注這個數據,他們需要利用各種各樣的軟件工程師去想我要去標什么樣的數據。這個事情是數據公司一共就這么幾家,一共有招了這么多人,最終你會受限,但如果你是一個10萬人的公司可能會有一些有意思的嘗試,怎么把真實世界的數據利用好,而不是僅僅依賴于標注商或者協議。
Q2:自主學習
現在自主學習是一個非常熱門的詞,在硅谷大街小巷咖啡館里面,大家都在談論,形成了一個共識。根據我的觀察,每個人對這個東西的定義和看法都不一樣,我講兩點:
第一,這個事情不是方法論,而是數據或者任務。當我們在談論自主學習的時候,它到底在什么樣的場景下基于什么樣的獎勵函數去做。你在聊天的時候變的越來越個性化是一種自主學習,在寫代碼的時候越來越熟悉每個公司獨特的環境或者文檔是一種自主學習,你去探索新的科學,在這個過程中像一個博士一樣,從原來不了解有機化學是什么,到完成這個領域的專家,這也是一種自主學習。每一種自主學習的挑戰或者說方法論都不太一樣。
第二,ChatGPT在利用用戶的數據不斷彌合人聊天的風格是什么,這是不是一種自我學習?今天Claude已經寫了Claude這個項目95%的代碼,它在幫助它自己變的更好,這是不是一種自我學習?我們當時2022年、2023年的時候,我去硅谷宣傳這個工作,我當時寫了第一頁是說ASI最重要的點是自主學習。今天的AI系統本質上都有兩部分,首先它是一個模型,其次它有個代碼庫,你怎么去用這個模型,是用來做推理,還是做Agent,有相應的代碼庫,我們今天看Claude這個系統本質上有兩部分。一部分是是部署環境的一大堆相應的代碼,KeonGPU的環境是怎樣的。另一部分是怎么樣去使用它,有一大堆相應的代碼,無論是GPU的,或者說它的前端還是環境是什么樣的。我們做Switch方面大家意識不到,這些自主學習的例子可能還局限在每一個特定的場景下,沒有讓人感覺到非常大的威力。
這個事情已經在發生了,可能效率或者受限制的限制,有各種各樣的問題,可能這個事情我個人的看法它更像是一個漸變。很多人說2026年看到信號,我覺得2025年就看到信號了。Cursor每幾個小時都會用最新的用戶數據去進行學習,包括新的模型,也在使用這些真實環境下的數據去訓練,大家覺得這個東西可能還沒有特別石破天驚,是因為受限于他們沒有預訓練能力,他們模型效果確實還不如Opens,顯然這是一個信號。
最大的問題是想象力,我們很容易想象強化學習或者推理這個范式,如果實現大概是什么樣,我們可以想象O1,在數學題上本來是10分,現在變成了80分,通過這個強化學習有非常強的思維鏈做這個事情。如果2026年或者2027年我們有一個范式的發生,我宣布了一個新的模型或者新的系統實現了自我學習,我們應該用什么樣的任務,它應該是什么樣的效果,你會相信它實現了。它是一個賺錢的交易系統,它可以賺很多錢,它真的解決了人類之前沒法解決的科學問題還是別的。我覺得可能需要先想象到它長什么樣。
Q3:Agent之年
我覺得還是像剛剛說的toB和toC不太一樣,目前看起來,我覺得toB的情況現在已經達到了在不斷上升的曲線,目前看起來好像沒有變慢的趨勢。很有意思的一點是它基本上不做什么創新,就是覺得模型預訓練變大了,老老實實的把這些東西做好,只要預訓練不斷地變大,后訓練不斷地把這些真實世界的任務給做好,會越來越聰明,它就會帶來越來越大的價值。從某種程度來說,做toB,所有的目標這件事更一致,模型的智能越高,解決的任務越多,解決的任務越多,在toB下帶來的收益越大。
做toC的問題是說,我們都知道DAU或者說產品的指標和模型的智能,很多時候是不相關的,甚至是相反的關系,我覺得這是能夠聚焦的另一個很重要的原因,他只要真的把模型越做越好,他的收益越來越高,所有的事情都是非常好的。目前看起來,toB或者說生產力的Agent剛剛開始,現在除了模型之外,有兩個Next,環境問題或者Deployment問題。在OpenAI之前,我在一個公司實習過,這是一個toB的公司,我覺得在toB公司工作過有很多收獲,最大的收獲是即使今天的模型不再變好,所有的模型訓練全部停止了。但是我們把這些模型部署到世界上各種各樣的公司,已經能帶來今天10倍或者100倍的收益,能應對GDP產生5%-10%的影響,但是今天它對GDP的影響還不到1%。
另外我覺得教育非常重要,我觀察現在人和人的差距非常大,更多時候不是說人類替代了人類工作,而是會使用這些工具的人在替代那些不會使用工具的人,就像當年電腦出來,如果轉身學習編程跟你還在持續計算尺、使用算法,差距是巨大的。今天中國能做到的最大的有意義的事情是更好的教育,教育大家怎么更好的使用像Claude或者ChatGPT這樣的產品,當然Claude可能在中國用不了,但我們可以用Kimi或者智譜這樣的國產模型。
Q4:中國能否反超
我覺得概率還挺高的,我還是挺樂觀的。目前看起來,任何一個事情一旦被發現,在中國就能夠很快的復現,在很多局部做的更好,包括之前制造業、電動車這樣的例子已經不斷地發生。我覺得可能有幾個比較關鍵的點,一個可能是中國的光刻機到底能不能突破,如果最終算力變成了Bottleneck,我們能不能解決算力問題。目前看起來,我們有很好的電力優勢,有很好的基礎設施的優勢。主要的瓶頸,一個是產能,包括光刻機,以及軟件生態。如果這個問題解決,我覺得會是很大的幫助。
另一個問題,除了toC之外,能不能有更成熟或者更好的toB的市場,或者有沒有機會在國際的商業環境競爭。今天我們看到很多做生產力或者做toB的模型或者應用,還是會誕生在美國,因為支付意愿更強的,文化更好,今天在國內做這個事情很難,所以大家都會選擇出海或者國際化的事情,這兩個是比較大的客觀上的因素。
更重要的是主觀上的概念,最近我在跟很多人聊天,我們的感受是在中國有非常多非常強的人才,任何一個事情只要被證明能做出來,很多人都會非常積極地嘗試,并且想做的更好。我覺得中國想要突破新的范式或者做非常冒險事情的人可能還不夠多,這里面有經濟環境、商業環境包括文化的因素,如果增加一點,主觀上有沒有更多有創業精神或者冒險精神的人,真的想要去做前沿探索或者新的范式突破的事情。目前來看,一個范式一旦發生,我們可以用很少的卡、很高的效率去局部做的更好,我們到底能不能引領新的范式,這可能是今天中國唯一要解決的問題,因為其他所有做的事情,無論是商業,還是產業設計,還是做工程,我們某種程度上已經比美國做的更好。
每個地方的研究文化都很不一樣,美國實驗室的區別可能比中美實驗室的差別還要大,在中國也一樣。在中國大家還是更喜歡做更安全的事情,比如說今天預訓練這個事情已經被證明可以做出來了,其實這個事情也非常難做,有很多技術問題要解決,但只要這件事情一旦被證明能做出來,我們都很有信心幾個月或者一段時間內就把這個問題搞清楚。但如果今天讓一個人說探索一個長期記憶或者持續學習,這個事情大家不知道怎么做、不知道能不能做起來,這個事情還是比較困難的。可能不只是大家更喜歡做確定性的事情、不太愿意做創新性的事情,很重要的一點是文化的積累或者整體的認知,其實是需要時間沉淀的事情。OpenAI在2022年就開始做這個事情了,國內2023年開始做了,對這個東西的理解會有一些差異,或者說中國沒有這么大。
我覺得可能很多也就是時間問題,當你積累了文化或者底蘊更深的時候,潛移默化的程度可能會影響人的做事方式,但是它很微妙,很難通過榜單去體現。中國對于刷榜或者數字看的更重一些,包括DeepSeek做的比較好的一點,他們可能沒有那么關注榜單的數字,可能會更注重,第一,什么是正確的事情;第二,什么是你自己能體驗出好或者不好的。我覺得這還是挺有意思的,因為你看Claude模型可能在編程或者軟件工程的榜單上也不是最高的,但大家都知道這個東西是最好用的,我覺得這還是需要大家能夠走出這些榜單的束縛,能夠堅持自己覺得是不是正確的過程。
(深圳夢整合自AGI-Next前沿峰會)
來源:深圳夢(微信號ID:SZeverything)綜合
![]()
我們的使命是:星辰大海,只與夢想者同行!
擁有深圳夢,請關注(微信號ID:SZeverything)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.