![]()
劃重點:
1、在AGI的登月時刻到來之前,楊植麟不會認輸。7月11日晚,K2開源模型突然發(fā)布。隨著越來越多開發(fā)者在智能體、前端開發(fā)等領域體驗發(fā)布,K2的好評還在不斷增加。當我表達祝賀時,楊植麟告訴我:“得搞下一個大模型了。”
2、楊植麟幸運之處在于,為月之暗面搭建了一個價值觀接近、結構穩(wěn)定的200人左右的技術人才組織。這構成了公司核心價值,保證了其還能提供持續(xù)的創(chuàng)新能力。在楊植麟看來,組織是比戰(zhàn)略更底層的東西。
3、楊植麟跟我說,微信、小紅書等是他認為國內為數(shù)不多有“taste”的產(chǎn)品,楊植麟最推崇的則是蘋果和喬布斯。但蘋果的“taste”究竟從哪來?楊植麟開始思考Kimi的價值觀問題。“真正偉大的公司需要人文底蘊,而不僅是技術和產(chǎn)品。對審美的追求能讓我們做出更好、更有靈魂的產(chǎn)品。”
作者 范曉東
出品 努斯學社×劃重點KeyPoints
專題 中國AI 50人 第1期
AGI就和月球暗面一樣,很神秘,要看到它很難。但在AGI的登月時刻到來之前,楊植麟不會認輸。
2025年的中國大模型賽道,像被誰按了暫停鍵。DeepSeek-R1在春節(jié)后的一次“奇襲”,把調用成本打到骨折,把性能拉到天際,也把同行們的未來降到了冰點。此后半年,江湖只剩三種聲音:裁員、砍業(yè)務、暫無更多消息。
外界看來,月之暗面也要“熄火了”。楊植麟謝絕所有的公開活動,按下另一個暫停鍵:停掉所有投流,停掉K1系列的修修補補,把算力、人力、錢包全部押注到K2——全球首個萬億參數(shù)、320億激活的MoE怪物。
7月11日晚,K2開源模型突然發(fā)布,像一顆深水炸彈。
技術圈先是沉默,隨后炸裂。開源不到24 小時,Star 破 1.8 萬,MLX 社區(qū)放出 4bit 量化版;一位在東京的獨立開發(fā)者用K2-Base復現(xiàn)了Claude-3.5的代碼能力;LMSYS的匿名評測里,K2-Instruct沖到總榜第四,僅次于GPT-4o、Claude-3.5、Gemini-1.5-Pro,卻把DeepSeek-R1擠到第五。
近幾天,隨著越來越多開發(fā)者在智能體、前端開發(fā)等領域體驗發(fā)布,K2的好評還在不斷增加。Perplexity CEO Aravind便在多個場合表達對K2的贊美。?
當我向其表達祝賀時,楊植麟告訴我:“得搞下一個大模型了。”
大模型沒有“垃圾時間”
對于中國的大模型創(chuàng)業(yè)者而言,無疑經(jīng)歷了痛苦而難熬的半年。面對DeepSeek的橫空出世,字節(jié)阿里騰訊的資本碾壓,所有人都在懷疑,創(chuàng)業(yè)者還能怎么活?
大模型似乎進入了“垃圾時間”。但對于還揣著AGI理想的技術創(chuàng)業(yè)者而言,所謂的“垃圾時間”只是個偽命題。
楊植麟曾和我分享,AGI的第一性原理是智能,產(chǎn)品的第一性原理是好用。他判斷技術發(fā)展分為三個階段:
1、原理探索期:大眾對術第一性原理不清楚;
2、技術創(chuàng)新期:第一性原理有共識,但技術還在持續(xù)創(chuàng)新;
3、純產(chǎn)品應用:技術完全成熟,比拼產(chǎn)品構建網(wǎng)絡。
![]()
(月之暗面楊植麟、努斯學社范曉東)
盡管行業(yè)對AGI沒有統(tǒng)一的定義標準,但AGI仍將在相當長時間內處于技術創(chuàng)新期,這意味著,技術和智能水平的高低,是最重要的護城河。
DeepSeek爆火后,梁文鋒沒有熱衷于APP應用端的體驗優(yōu)化和用戶增長,或許基于同樣的判斷。
我們看看此次月之暗面K2大模型所實現(xiàn)新的技術突破:
1、萬億 MoE:1T 總參數(shù)、32B 激活,推理成本僅GPT-4 的 1/5;
2、MuonClip優(yōu)化器首次scale到驚人的萬億級別,取代AdamW,收斂更快、顯存減半,15.5T token 全程零崩潰;
QK-Clip:解決注意力 MaxLogit 爆炸,穩(wěn)定長上下文 128 K;
3、動態(tài)路由 + 更少注意力頭:專家利用率↑ ,長序列效率↑;
4、Agentic 數(shù)據(jù)工廠:自生成百萬級工具調用軌跡,模型原生支持17步工具鏈;
5、端到端 RL:用可驗證獎勵訓練不可驗證任務,代碼/數(shù)學/Agent 三項基準均超 GPT-4;
6、全開源商用:MIT 協(xié)議 + OpenAI 兼容 API,一天內社區(qū)即出 4-bit 量化。
![]()
(Kimi用MuonClip優(yōu)化器訓練萬億參數(shù)的損失曲線,AI研究員Azeem Azhar稱為機器學習歷史上最優(yōu)美的曲線之一)
無論是大廠還是創(chuàng)業(yè)公司,未來都還有機會。DeepSeek的奇跡本身就是最好的說明:大模型不存在忠誠度,用戶隨時會用腳投票,選擇更好用更智能的AI產(chǎn)品。
楊植麟幸運之處在于,為月之暗面搭建了一個價值觀接近、結構穩(wěn)定的200人左右的技術人才組織。這構成了公司核心價值,保證了其還能提供持續(xù)的創(chuàng)新能力。
在楊植麟看來,組織是比戰(zhàn)略更底層的東西。舊體系長不出新物種,AGI 公司必須“ 先造鐘,再報時”,這需要一張白紙式的組織。
楊植麟覺得,搖滾和創(chuàng)業(yè)很像,都代表反叛和打破常規(guī)的精神。“招聘時我有時會問對方最喜歡的專輯,答案能讓我快速判斷他/她是不是和Kimi有共同的審美和價值觀”。
楊植麟的暗面
I'm a million different people from one day to the next——楊植麟的朋友圈簽名,出自Bitter sweetSymphony里的一句歌詞。搖滾會如何塑造一個人?遵從自己的內心,反叛世俗的人生方式和評價標準;我是蕓蕓眾生里的普通一個,但也是自由而特別的那個。
產(chǎn)品上線僅4個月的月之暗面拿下阿里10億美金融資后,近百位年輕人擠在海淀知春路的一二百平米狹小空間辦公,我以前去拜訪時,在那些簡陋會議室的門上,發(fā)現(xiàn)了自己年輕時曾在地下室排練過的樂隊名字,Metallica、Queen、Nirvana、Guns N' Roses……
Bitter Sweet Symphony (Remastered 2016),The Verve
什么是月之暗面?地球上的我們永遠無法看到The Dark Side of the Moon。在Pink Floyd那張搖滾史偉大專輯里對此有不同表達——可以是人類首次登月背后的探索精神;可以是事物的本質規(guī)律,因為月亮本來就沒光;也可以是我們內心深處不為人知的隱秘世界。
身為這家30億美金估值AI初創(chuàng)公司的創(chuàng)始人,楊植麟是一位信仰AI的年輕科學家,也是一位搖滾迷。自由,叛逆,創(chuàng)新,資本,熱愛,失落,壓力,那些復雜而矛盾的力量在過去的2024-2025急速交織,推著他必須更加篤定,更快進化。
畢竟,通往AGI 的路很窄,容不下猶豫的人。
所有投資人、創(chuàng)業(yè)者都明白,想入局就意味著一場資金、智力、速度、身體乃至運氣的豪賭,想玩下去,就得堅守創(chuàng)新和長期主義。
大模型創(chuàng)業(yè)拼的是實打實的人才密度、組織能力;除此之外,楊植麟最在意的一個關鍵詞是“taste”。
楊植麟跟我說,微信、小紅書等是他認為國內為數(shù)不多有“taste”的產(chǎn)品,楊植麟最推崇的則是蘋果和喬布斯。但蘋果的“taste”究竟從哪來?
楊植麟開始思考Kimi的價值觀問題。“真正偉大的公司需要人文底蘊,而不僅是技術和產(chǎn)品。對審美的追求能讓我們做出更好、更有靈魂的產(chǎn)品。”
喬布斯曾用“Think Different”解釋蘋果的核心價值觀。“我們要贊美能Think Different的人。它觸及到了蘋果公司的靈魂,我們堅信有激情的人能讓這個世界變得更美好。” Think Different廣告中沒有展示任何蘋果產(chǎn)品,只是向甘地、畢加索、愛迪生、愛因斯坦、約翰·列儂、鮑勃·迪倫等具有革新精神的天才致敬。
生活不僅僅是工作、家庭、財產(chǎn)、娛樂,我們每個人都能感受到某種沖動。喬布斯說:許多人想找回生命的意義,有人去流浪,有人在宗教儀式里尋找答案,他們想尋找生活的真相。正是因為這種精神,有人寧愿當詩人也不愿意做銀行家。
喬布斯由嬉皮士出離,又因悟禪而回歸。
我分享楊植麟的觀點是:連接喬布斯的搖滾精神和禪之間的通道是空性。搖滾本質是對現(xiàn)代世俗生活價值的懷疑,相比于外部世界,更專注人本心的體驗。這種質疑推動我們思考生命意義,在《金剛經(jīng)》里,這是證悟空性的起點,也是慈悲心和大愛的起點。由此,喬布斯可“無所住而生其心”,無中生有,自由創(chuàng)新。
在這輪AI大模型創(chuàng)業(yè)浪潮中,技術之難、商業(yè)之難、競爭之難,使得行業(yè)和從業(yè)者背負太多沉重的色彩。我和楊植麟說,對價值觀有一個通俗的理解:許一個讓自己真正有使命感、了無私心的宏愿。
楊植麟給我分享了他的答案,出自《Make Something Wonderful》中的一句話——Make new things with a great deal of care and love.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.