Jay 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
“閉源人工智能在阻礙我們探索真正的科學(xué)。”
說(shuō)這句話的不是別人,是大名鼎鼎的Transformer發(fā)明者——Ashish Vaswani。
![]()
大佬之所以這么說(shuō),是因?yàn)樗X(jué)得OpenAI等閉源廠商被商業(yè)化沖昏了頭腦,沒(méi)心思做基礎(chǔ)研究。
在Scaling Law碰壁后,獨(dú)角獸們?cè)絹?lái)越搞不清技術(shù)方向。
迫于投資者壓力,不得不親自下場(chǎng)探索落地場(chǎng)景,更沒(méi)精力去搞科研了。
為了填補(bǔ)這塊空白,一路從Google到Adept再到Essential AI三次搬家的Vaswani,今年再度迎來(lái)巨大轉(zhuǎn)折點(diǎn)——
All in基礎(chǔ)研究,并且堅(jiān)持要走開(kāi)源路線。
![]()
萬(wàn)萬(wàn)沒(méi)想到,大佬三遷,只為打造西方世界的DeepSeek。
“我們很樂(lè)意成為西方世界的DeepSeek”
2017年,還在Google Brain工作的Vaswani與團(tuán)隊(duì)共同寫出了《Attention Is All You Need》,這篇論文在5年后開(kāi)啟了如今的GenAI大航海時(shí)代。
![]()
可惜的是,老東家不太給力,各種條條框框把人束縛得動(dòng)彈不得,這讓Vaswani心灰意冷。
2022年,他離家出走,與Niki Parmar(Transformer八子之一)和David Luan(當(dāng)時(shí)的Adept CEO)創(chuàng)辦了Adept AI。
可惜好景不長(zhǎng),據(jù)BloomBerg報(bào)道,Vaswani在Adept與某位聯(lián)合創(chuàng)始人爆發(fā)了一次嚴(yán)重沖突。
這次爭(zhēng)執(zhí)讓他意識(shí)到:
- 只有創(chuàng)立一個(gè)完全屬于自己的公司,才能有絕對(duì)的自由。
于是2022年底,他再次揮手告別,拉起新團(tuán)隊(duì)創(chuàng)立了Essential AI。
![]()
最開(kāi)始,Essential AI還走的是務(wù)實(shí)派路線——主要業(yè)務(wù)就是幫企業(yè)做財(cái)務(wù)分析自動(dòng)化。
結(jié)果,就在今年年初,Vaswani突然對(duì)董事會(huì)宣布:
放棄公司現(xiàn)有業(yè)務(wù),并將精力全部投入基礎(chǔ)研究。
What!?
這不是把商業(yè)模式直接推翻重來(lái)嗎?

要知道,對(duì)于一家原本服務(wù)于企業(yè)客戶的初創(chuàng)公司來(lái)說(shuō),這可是一個(gè)風(fēng)險(xiǎn)性極高的Bet。
出乎意料的是,董事會(huì)和資方居然都在一定程度上對(duì)Vaswani表示了支持。
參與Essential AI上一輪融資的AMD在采訪中表示:
這個(gè)路線確實(shí)有點(diǎn)不太尋常,但人工智能領(lǐng)域需要更開(kāi)放的替代方案。
看來(lái),三次遷居的努力沒(méi)有白費(fèi),Vaswani終于如愿以償,集結(jié)了一幫理念同頻的大佬。

為商業(yè)化四處奔波的這么多年,與資本和客戶打了無(wú)數(shù)次交道,Vaswani真的累了。
驀然回首,在他的精神世界中,其實(shí)一直有一塊能承載他一切美好期許的土地,這片伊甸園的名字叫做——開(kāi)源。
他在Essential官網(wǎng)上寫道:
在教育和醫(yī)療等領(lǐng)域,有真正的科學(xué)需要追求,我們不能讓封閉的人工智能阻礙人類探索這些新方向。
是不是聽(tīng)著很耳熟,沒(méi)錯(cuò),Vaswani在與Economics Time的采訪中直接承認(rèn)了:
“短期內(nèi),我們想要成為西方世界的DeepSeek。”
![]()
Vaswani認(rèn)為,要想推動(dòng)AI的邊界絕不能靠OpenAI、Anthropic等依靠閉源模式盈利的獨(dú)角獸。
在他的設(shè)想里,AI不該只服務(wù)于商業(yè),而是要真正進(jìn)入教育、醫(yī)療等關(guān)乎大眾的場(chǎng)景,讓普通人也能享受到技術(shù)紅利。
比如,一個(gè)偏遠(yuǎn)地區(qū)的孩子也能用開(kāi)源AI上到最好的課;一個(gè)小診所也能借助開(kāi)源工具做出最準(zhǔn)確的診斷。
更重要的是,Vaswani可不光是喊口號(hào),Essential在轉(zhuǎn)型后的確下了不少真功夫。
提出轉(zhuǎn)型后的不久,2025年4月,Essential AI團(tuán)隊(duì)發(fā)表了一篇題為《Rethinking Reflection in Pre-Training》的論文。
這篇論文提出了一個(gè)顛覆性觀點(diǎn):
大型語(yǔ)言模型的反思能力其實(shí)在預(yù)訓(xùn)練階段就開(kāi)始萌芽。
簡(jiǎn)單來(lái)說(shuō),相較于用RL在后訓(xùn)練打補(bǔ)丁,他們?cè)陬A(yù)訓(xùn)練中取得了突破,并且這個(gè)技術(shù)可能大幅降低訓(xùn)練成本。
要真能成,那對(duì)整個(gè)開(kāi)源社區(qū)絕對(duì)是大利好。
Vaswani看到了什么?
為什么Vaswani說(shuō)不能把希望寄托在獨(dú)角獸公司身上?
Vaswani擔(dān)心,這些模型性能最優(yōu)異的獨(dú)角獸正在阻礙人工智能進(jìn)步。

有幾家公司關(guān)閉了長(zhǎng)期的研發(fā)工作,以便將所有資源用于商業(yè)化,這種現(xiàn)象在市場(chǎng)環(huán)境惡化時(shí)更加明顯。
自Scaling Law迎來(lái)邊際收益遞減的拐點(diǎn)后,AI獨(dú)角獸的產(chǎn)品化傾向已是眾人皆知。
Anthropic做瀏覽器,OpenAI派出著名產(chǎn)品經(jīng)理Kevin Weil…….各大模型廠商紛紛下場(chǎng),親自探索商業(yè)模式。
這折射出來(lái)的一個(gè)問(wèn)題是創(chuàng)新者窘境。
Scaling Law興起后,暴力美學(xué)的砝碼使得AI研究的天平從學(xué)術(shù)機(jī)構(gòu)幾乎完全向企業(yè)實(shí)驗(yàn)室傾斜。
不過(guò),產(chǎn)業(yè)界雖壟斷了最稀缺的生產(chǎn)要素,他們真的可以All in創(chuàng)新嗎?
絕大多數(shù)時(shí)候不能。因?yàn)槟强赡軣魩讉€(gè)億,而且不一定能看到回報(bào)。
關(guān)鍵在于,無(wú)論公司成立的初衷是什么,創(chuàng)始人最終都得優(yōu)先對(duì)投資人負(fù)責(zé)。
因此,探索商業(yè)模式和利益最大化是閉源模型的最終歸宿,這從一開(kāi)始就注定了。
如今,這把熱烈的商業(yè)化之火同樣燒到了硅谷這批天之驕子身上。
今天等著小扎買買買,明天聽(tīng)說(shuō)OpenAI搞收購(gòu),下個(gè)月又去創(chuàng)業(yè)。
![]()
△由AI生成
這種節(jié)奏很適合追熱點(diǎn),但科研不一樣——要搞出突破性的成果,你得花幾年甚至十幾年死磕一個(gè)方向。
而頻繁的流動(dòng),讓團(tuán)隊(duì)很難靜下心來(lái)。
Vaswani嘆息道,這不是科學(xué)應(yīng)有的進(jìn)步方式。
那Vaswani想要怎么做?開(kāi)源陣營(yíng)能夠拯救AI嗎?
老生常談的話題——人多力量大,知識(shí)共享才是推動(dòng)AI技術(shù)發(fā)展的關(guān)鍵動(dòng)力。
閉源公司雖手握頂級(jí)資源和技術(shù)成果,但為了維護(hù)投資人的利益,不得不把這些秘密藏起來(lái),以阻礙競(jìng)爭(zhēng)對(duì)手。
但如果有成千上萬(wàn)的研究者和開(kāi)發(fā)者一起貢獻(xiàn)代碼,整個(gè)生態(tài)齊心協(xié)力,并行推進(jìn),也許能克服開(kāi)源陣營(yíng)資源匱乏的問(wèn)題。
當(dāng)然,開(kāi)源最重要的問(wèn)題在于資金來(lái)源,畢竟咱不能總靠“用愛(ài)發(fā)電”。
對(duì)此,Vaswani參考了互聯(lián)網(wǎng)產(chǎn)品的解法:
交叉補(bǔ)貼大法好
什么是交叉補(bǔ)貼呢?
這是互聯(lián)網(wǎng)時(shí)代很常見(jiàn)的一種商業(yè)模式,典型案例就是瀏覽器:Google搜索對(duì)用戶完全免費(fèi),取得市場(chǎng)份額后依靠廣告回血。
簡(jiǎn)單來(lái)說(shuō),就是一部分業(yè)務(wù)賺錢,用來(lái)補(bǔ)貼另一部分業(yè)務(wù)。
![]()
Vaswani對(duì)于Essential AI的計(jì)劃是這樣的:
先構(gòu)建一個(gè)開(kāi)源的垂直領(lǐng)域模型,這個(gè)基座本身不收錢。
但如果有客戶想用這個(gè)基座搭建自己的AI,可以向Essential AI購(gòu)買訓(xùn)練數(shù)據(jù)和相關(guān)產(chǎn)品。
通過(guò)這個(gè)途徑賺來(lái)的錢,正好能用來(lái)反哺開(kāi)源社區(qū)。
這樣,既能保證技術(shù)開(kāi)放,又能讓公司活下去。

此外,Vaswani還指出閉源不一定代表更高的投資回報(bào)率。
雖然閉源模型看起來(lái)更容易變現(xiàn),但實(shí)際上也面臨巨大的成本壓力。
實(shí)際上,如果按照之前科技互聯(lián)網(wǎng)的發(fā)展來(lái)看,開(kāi)源通常是更賺錢的一方,畢竟構(gòu)建起了一整個(gè)生態(tài)。
One More Thing
最后,關(guān)于Ashish Vaswani,或許還有一點(diǎn)點(diǎn)可以多說(shuō)的。
![]()
作為《Attention Is All You Need》論文的“一作”,他博士師承的兩位導(dǎo)師,都是華人。
在2011年的南加州大學(xué),有兩名活躍在自然語(yǔ)言處理(NLP)前沿的教授——蔣偉(David Chiang)與黃亮(Liang Huang)。
他倆都是Ashish Vaswani的導(dǎo)師。
![]()
△圖左為蔣偉教授,圖右為黃亮教授
蔣偉教授的學(xué)士和碩士均就讀于哈佛大學(xué),后到賓夕法尼亞大學(xué)攻讀博士,他提出的分層短語(yǔ)翻譯模型曾被Google Translate采用。
黃亮教授本科畢業(yè)于上海交通大學(xué)計(jì)算機(jī)系,同樣是在賓夕法尼亞大學(xué)進(jìn)修的PhD,主要研究方向是開(kāi)發(fā)高效算法來(lái)加速NLP任務(wù),Vaswani是他指導(dǎo)的第一名博士生。
怎么說(shuō)呢,雖然Transformer八子里沒(méi)有華人作者,但“功勞簿”里,也并非全然沒(méi)有華人貢獻(xiàn)。
這實(shí)際也是另一個(gè)維度的開(kāi)源之力。AI也好、深度學(xué)習(xí)也好,之所以可以站上浪潮之巔,根本上就在于始終有一個(gè)持續(xù)交流、開(kāi)放互助的生態(tài)環(huán)境。
開(kāi)源是一種選擇,更是一種精神和信仰。
參考鏈接
[1]https://www.bloomberg.com/news/features/2025-09-03/the-ai-pioneer-trying-to-save-artificial-intelligence-from-big-tech
[2]https://www.communicationstoday.co.in/ashish-vaswani-the-mind-behind-the-transformer-that-powers-genai
[3]https://economictimes.indiatimes.com/tech/artificial-intelligence/we-would-like-to-be-deepseek-in-the-west-says-essential-ai-cofounder/articleshow/121891250.cms
[4]https://www.forbesindia.com/article/ai-special-2025/ashish-vaswanis-essential-ai-wants-to-use-powerful-ai-to-solve-humanitys-biggest-challenges/96148/1
[5]https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/
[6]https://www.essential.ai/
[7]https://viterbischool.usc.edu/news/2023/03/attention-is-all-you-need-usc-alumni-paved-path-for-chatgpt/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.