
“從邊緣云到Agent沙箱,PPIO為什么敢押注每一個「不被看好」的方向?”
作者丨趙之齊
編輯丨包永剛
2018年,邊緣算力與CDN(內(nèi)容分發(fā)網(wǎng)絡(luò))市場已白熱化,價格卷到極致。就在這一年,PPIO成立了。他們毅然切入邊緣云領(lǐng)域,直面紅海的競爭。
當(dāng)時,創(chuàng)始人姚欣給天使投資人——百川智能創(chuàng)始人王小川、前微軟Azure中國總裁申元慶——講的創(chuàng)業(yè)邏輯是:
“當(dāng)年P(guān)PTV就是整合閑置的算力和資源,建起來的一套分布式平臺。我們二十年前就在做C端的算力整合,現(xiàn)在要去做B端,你想,是整合B端難還是C端難?”
在2005年便創(chuàng)立了PPTV、并在2014年將其出售給蘇寧的姚欣,與當(dāng)時PPTV的首席架構(gòu)師王聞宇轉(zhuǎn)戰(zhàn)B端算力領(lǐng)域,顯然是值得被信任的。于是,這個故事被投資者們接受了。
然而,這一路的起步并不如想象中容易。起初,PPIO在“先找供給”還是“先找需求”間久久徘徊,商業(yè)難以閉環(huán),直到疫情導(dǎo)致線上流量激增,才逐漸跑通了這一增長曲線。
2023年,當(dāng)疫情帶來的線上流量紅利逐漸消退,GPU市場也開始利潤暴漲,H100的高點價格甚至一度達到400萬元。GPU貿(mào)易賽道火熱之時,姚欣卻拒絕了這門“穩(wěn)賺不賠”的生意,在那個基礎(chǔ)大模型訓(xùn)練正盛的年代,提出了要“聚焦推理”。
![]()
PPIO聯(lián)合創(chuàng)始人兼CEO 姚欣
如今,短短幾年時間,PPIO的營收已經(jīng)實現(xiàn)指數(shù)級增長,2024年營收已達5.58億。而在今年7月的WAIC(世界人工智能大會),PPIO又成了國內(nèi)首個推出兼容E2B的Agent沙箱的公司——
Agent沙箱作為專為AI Agent場景設(shè)計的基礎(chǔ)設(shè)施,能為AI Agent提供隔離運行環(huán)境,讓Agent在安全、受限的條件下執(zhí)行代碼。由此,防止Agent訪問或篡改系統(tǒng)之外的資源,避免對系統(tǒng)造成損害。
在整個研發(fā)過程中,姚欣感慨,最難的便是“為看不見的需求做技術(shù)”。
而這,也是PPIO這兩年一直在做的事——比行業(yè)走快一步。
如今,PPIO正在沖刺港股IPO。從邊緣云到GPU推理平臺,再到Agent沙箱,PPIO成為了具備全棧技術(shù)能力的AI云服務(wù)商,這些跨度背后是如何考量?在國內(nèi)云大廠夾擊下,作為創(chuàng)業(yè)公司的他們?nèi)绾瓮粐?/strong>
以下,是雷峰網(wǎng)與姚欣的對話。
01
為看不見的需求做技術(shù)
雷峰網(wǎng):你們從2018年創(chuàng)立做云服務(wù),起初的算力做到現(xiàn)在的沙箱,跨度很大,這條路是怎么走下來的?
姚欣:我們2022年開始進入GPU領(lǐng)域,當(dāng)時AI大語言模型還沒開始,最開始做的是云游戲和云渲染的GPU,這天生就是一個分布式架構(gòu)。
2023年大語言模型起來后,整個市場開始起來。當(dāng)時國內(nèi)某頭部模型廠商發(fā)布了自己的開源模型,但缺少推理平臺,我們就幫著他們在2023年搭建了第一代推理平臺服務(wù),這是我們的第一個推理的Infra客戶。
2024年,PPIO就開始在重點聚焦出海,集成了大量開源的模型,把模型API推出一整套MaaS平臺。
今年年初,PPIO再往上走一層,Agent其實就類似于PaaS層,相當(dāng)于我們從底層技術(shù)棧一層層長上來。
雷峰網(wǎng):在這之中,挑戰(zhàn)主要是什么?
姚欣:最大的挑戰(zhàn)就是,我們是為看不見的需求在做技術(shù)。
做AI Infra或技術(shù)平臺現(xiàn)在看起來已經(jīng)普及了,但在2024年做MaaS、或者現(xiàn)在做AI PaaS Agent,用黃仁勛的話講,就是“Zero/Billion dollar company market”,一個零/億市場,現(xiàn)在是0,也許以后就是10億、20億、百億。要為一個今天還是0的市場,提前做技術(shù)儲備、研發(fā)、投入;但如果看到Manus起來后再開始做沙箱,其實就已經(jīng)晚了。
雷峰網(wǎng):在2022年決定切入做算力云的時候,內(nèi)部是怎么去討論這個市場的?
姚欣:當(dāng)時還沒看到GPT,我們更多是從公司要打造第二增長曲線的角度。
在此之前我們第一增長曲線是基于CPU做的邊緣云,那會兒主要是抓住了疫情期間在線流量激增帶來的業(yè)務(wù)需求。我們當(dāng)時為很多頭部互聯(lián)網(wǎng)公司提供音視頻處理、邊緣計算和傳輸服務(wù),都是基于傳統(tǒng)CPU和云架構(gòu)。2022年疫情逐漸結(jié)束了,流量慢慢回落,我們就意識到要開始找第二增長曲線了。
雷峰網(wǎng):但如何錨定現(xiàn)在這個方向的呢?
姚欣:我們作為云服務(wù)商,其實大的思路就是計算、存儲、傳輸。半年后,ChatGPT開始風(fēng)靡,國內(nèi)掀起大模型創(chuàng)業(yè)熱潮,看到大模型類企業(yè)快速融資、擴張的態(tài)勢,我們就明確將第二增長曲線定位為AI賽道做AI Infra,從GPU層逐步向上構(gòu)建到今天的PaaS。
雷峰網(wǎng):當(dāng)時很多人都想做算力貿(mào)易生意,你們是怎么決定要去做分布式算力的路線?
姚欣:我們選擇避過熱點,沒有參與任何倒算力囤卡,這跟整個公司的價值觀都有關(guān)系——我們價值觀第一條叫“價值創(chuàng)造”,一定要做有技術(shù)附加值的東西。
我們在GPU領(lǐng)域的商業(yè)模式是整合匯聚大量閑置的分布式算力,再把它變成某種云服務(wù)。我們技術(shù)附加值的體現(xiàn),主要就是把閑置算力token化。
雷峰網(wǎng):你們是怎么找到這些閑散資源的呢?這些資源的持有方會是誰?
姚欣:2022年看到的都是游戲顯卡,用4090、3090做渲染,甚至最開始Stable Diffusion就在4090上面跑的。后來看到上一代訓(xùn)練的GPU大量閑置,例如2024年大家都開始拿H100做訓(xùn)練,A100被替換,我們就拿閑置的A100來跑推理。
再往后又看到很多國產(chǎn)GPU用不起來,有的國產(chǎn)GPU智算中心利用率只有10%-20%,我們就又開始做國產(chǎn)GPU和模型推理加速框架的適配。今年我們平臺上就有很多頭部廠商的國產(chǎn)GPU。
雷峰網(wǎng):所以你們一方面是用那些已經(jīng)被時代選擇淘汰了的算力,另一方面是國產(chǎn)算力,而且對標推理市場,沒有去碰算力訓(xùn)練這一塊。
姚欣:對,因為訓(xùn)練和推理的任務(wù)指標不一樣。一個模型比別人先推出是很重要的,所以訓(xùn)練永遠用最先進的芯片;但推理不一樣,推理要求極致的成本性價比,結(jié)合我們獨特的分布式閑置資源整合的能力,降低創(chuàng)業(yè)者使用算力門檻。
02
不綁定+開源:AI開發(fā)者的“反鎖定”需求
雷峰網(wǎng):PPIO在WAIC上發(fā)布了沙箱,似乎是國內(nèi)首發(fā)的Agent沙箱。為什么會在這個時間點上去推呢?
姚欣:要加一個補充,這是我們“在中國”首發(fā)E2B兼容的Agent沙箱,在海外已經(jīng)提前發(fā)布了。
我們在2023年選擇出海,在海外優(yōu)先尋找一些戰(zhàn)略客戶或早期的新技術(shù),和他們一起快速打磨和迭代,推動底層AI Infra開發(fā)技術(shù)棧的創(chuàng)新。
雷峰網(wǎng):現(xiàn)在沙箱進展如何?
姚欣:目前我們在海外落地比國內(nèi)快一些,PPIO推沙箱對標海外E2B,他們在硅谷今年一年用量大概漲了400多倍,從4萬多到1600多萬。國內(nèi)過去的模型合作伙伴像是千問、Kimi、智譜等等,這幾家模型能力基本可以追平年初的Anthropic,所以我判斷未來幾個月中國版的Manus或Cursor可能會更快速增長。
雷峰網(wǎng):在你們推出沙箱后,大廠也在跟進了,會擔(dān)心和大廠之間的競爭嗎?你們和大廠的差異性在哪里?
姚欣:從我創(chuàng)辦第一天,投資人就開始問我們這個問題,但現(xiàn)在到了Agent或PaaS這一層,話題就開始有趣起來了。
之前做云計算,在IaaS層,說白了就是拼資源、拼規(guī)模,是一個Heavy Capex(資本性支出)的游戲。到PaaS層,雖然巨頭影響力還是巨大的,因為他們原來的客戶積累和生態(tài)依然是最強的,但到了Agent Infra這一層,云大廠的影響力和PC以及移動時代相比,是大幅削弱的。
雷峰網(wǎng):為什么有這個觀察?
姚欣:具體是以下這幾個原因。
第一,GPU的Infra架構(gòu)是在過去三年時間里突然冒出來的,不像CPU有將近20年發(fā)展,所以大廠很難有很明顯的先發(fā)優(yōu)勢或很強技術(shù)積累,今天大廠真正做沙箱這件事,跟PPIO可能也在差不多一個體量。
第二,這波AI成本太高,所以各家公司包括開發(fā)者,第一天設(shè)計自己的架構(gòu)時就是跨云、多云或者可以靈活調(diào)用的架構(gòu),追求一整套標準化的接口,不會跟某家廠商特別綁定。我們就把API能力做好,作為一個組件;與此同時,也擁抱開源。
這代AI開發(fā)者不像上個時代的移動互聯(lián)網(wǎng)開發(fā)者,選擇某個云后就在上面越存越多,慢慢配套一堆私有化的組件調(diào)用、或者專有組件調(diào)用,牢牢被它綁住了。我們在國內(nèi)和差不多四五十款主流的開源框架有對接合作,而且也沒有想把GPU和CPU綁在一起銷售,就是想基于開源和可遷移性去方便開發(fā)者。
雷峰網(wǎng):所以現(xiàn)在的沙箱主要目標市場就都是開發(fā)者嗎?
姚欣:其實不光是沙箱,包括提供的API、很多GPU的Serverless等等,我們過去兩年主要都是為了AI Startup和開發(fā)者兩個人群提供服務(wù)。
雷峰網(wǎng):這個群體的市場足夠大嗎?
姚欣:這些開發(fā)者和新應(yīng)用,在用量側(cè)其實比很多傳統(tǒng)互聯(lián)網(wǎng)巨頭高很多。前段時間Sam Altman也說了,Open AI的Top20消耗里,70%以上都是AI新應(yīng)用,我們想爭取這種全新增量用戶。
而且過去幾年有個特點,新的AI創(chuàng)業(yè)公司和應(yīng)用公司出來,他們做一件事的token消耗,可能比上個應(yīng)用直接提升10倍甚至100倍。比如Manus執(zhí)行一個任務(wù),調(diào)用的token可能是幾十萬次.
今年7月,Manus還發(fā)布了個Wide Research,一個任務(wù)同時開100個Agent在跑,這100個Agent同時得出一個結(jié)果、最后返回一個最佳解,這個消耗量就相當(dāng)于再增長100倍。
03
AI賭的是下一代
雷峰網(wǎng):你認為分布式算力廠商的優(yōu)勢在哪里?
姚欣:第一是節(jié)點數(shù)量要足夠多、任務(wù)需求也要多。我們的優(yōu)勢在于技術(shù)棧和傳統(tǒng)云公司完全不一樣:我們從第一天就是在分散、碎片、異構(gòu)的基礎(chǔ)設(shè)施上建立起來的云服務(wù),所以叫“分布式云”,但傳統(tǒng)大云廠的技術(shù)棧,是建立在集中式、大規(guī)模標準的數(shù)據(jù)中心上做的虛擬化加技術(shù)棧。
很多企業(yè)級算力也是用這種方式整合起來。有些互聯(lián)網(wǎng)企業(yè),比如做電商的,旺季在雙十一、618,但上半年利用率其實很低,周一到周五還會比周末低,他們就很需要在閑置時把這些資源用起來。
雷峰網(wǎng):目前PPIO有4000多個節(jié)點,這些節(jié)點是如何分布的?
姚欣:這些節(jié)點很多是零售型IDC,他們隨時可以把機器在閑置期內(nèi)托管到我們平臺上供調(diào)用,相當(dāng)于有這么多“滴滴司機”隨時待命,但不代表他們24小時都在服務(wù)。
真正要調(diào)用時,就要看客戶場景,有的應(yīng)用場景追求低延時,會就近調(diào)用;有些比較成本敏感,就可以比如給北京的用戶調(diào)新疆的資源——新疆電費是北京的1/3,甚至全球范圍內(nèi),東半球的白天是西半球的凌晨,可以跨更大的區(qū)域調(diào)度。
雷峰網(wǎng):最開始分布式算力云的客戶也是這些開發(fā)者相關(guān)嗎?
姚欣:不是,分布式CPU云是頭部的互聯(lián)網(wǎng)那個公司。但到了GPU云時代,主要是以AI創(chuàng)業(yè)者和開發(fā)者為主。
雷峰網(wǎng):為什么有這套策略的轉(zhuǎn)變?
姚欣:我們現(xiàn)在更想和客戶一起聯(lián)合打磨未來新產(chǎn)品,所以選擇開發(fā)者和AI創(chuàng)業(yè)公司, AI時代不一樣,AI是賭下一代,下一個字節(jié)、下一個抖音在哪里?現(xiàn)在還沒有出來。
雷峰網(wǎng):那未來對分布式算力的挑戰(zhàn)會在哪里?
姚欣:還是在需求側(cè),技術(shù)側(cè)和供給側(cè)不擔(dān)心,就看需求側(cè)什么時候能有大規(guī)模爆發(fā),尤其是重視時延敏感的需求。
04
創(chuàng)業(yè)成果是認知的變現(xiàn)
雷峰網(wǎng):聽起來是2020年疫情需求起來后,邊緣CPU才真正利用起來。但你們在2018年就已經(jīng)開始做這個業(yè)務(wù),最開始遇到了什么挑戰(zhàn)?
姚欣:最早的挑戰(zhàn)就是“雞生蛋”還是“蛋生雞”的問題,或者說,所有平臺生意的第一點都是:先抓供給還是先抓需求。
抓需求吧,大家說你技術(shù)不成熟、網(wǎng)絡(luò)覆蓋廣度不夠、沒有全國節(jié)點;但是到處找全國節(jié)點,大家就會問你需求呢?
當(dāng)年這個平臺能冷啟動,很大原因是2020年疫情爆發(fā),需求超出預(yù)期,我們才能有技術(shù)打磨、鎖定更多供應(yīng)商。到今天GPU這張網(wǎng)絡(luò)也是類似的,過去一年我們平臺token消耗增長了一百倍以上,推理時代這種極其陡峭的高增長曲線才能把GPU網(wǎng)絡(luò)拉起來,所以我們現(xiàn)在也在找下一個更高增長爆發(fā)的新需求。
雷峰網(wǎng):那當(dāng)時PPIO成立,在CDN紅海里做邊緣云,是怎么說服王小川、申元慶等人投資的?畢竟他們都是很懂云的人。
姚欣:2018年,第一波AI計算機視覺很熱,有大量算力需求、也有很多算力被閑置,尤其很多數(shù)字新基建IDC,建完沒用起來。我跟他們講的故事很簡單:我們二十年前就在做C端的算力整合(指PPTV),現(xiàn)在要去做B端的算力整合,你們想想是整合B端難還是C端難?
技術(shù)上肯定是C端更難更復(fù)雜,商業(yè)模式上B端也可能更成熟一些,后來這個故事大家就聽到了,覺得我們團隊是做PPTV分布式計算、分布式網(wǎng)絡(luò)出身,調(diào)度能力足夠強。
雷峰網(wǎng):現(xiàn)在回頭看,在PPIO創(chuàng)業(yè)的過程中,您覺得自己做得很對的一個判斷是什么?
姚欣:2023年我們就提出聚焦推理、聚焦開源、海外優(yōu)先,這個認知當(dāng)時比同行要早很多,當(dāng)時開源模型還沒幾個。現(xiàn)在能抓住這波DeepSeek機會、以及海外這么多知名開發(fā)者,和三年前這個判斷非常關(guān)鍵。我們在整個戰(zhàn)略趨勢和方向的判斷上,還是比當(dāng)年做PPTV強太多。
雷峰網(wǎng):回頭看,您感覺創(chuàng)業(yè)重要的能力是什么樣的?
姚欣:我覺得最重要的就是認知能力,如何不斷學(xué)習(xí)、快速適應(yīng),并不斷提升認知能力的上限。我們公司是動漫文化,我是海賊王路飛,海賊王里有惡魔果實,如果選一個果實,我最想吃的是學(xué)習(xí)果實,因為對于一個創(chuàng)始人來講,最重要的就是認知能力,包括我做投資人的三四年里來看,最后的成果都是認知變現(xiàn)。
這二十年間,技術(shù)的發(fā)展也經(jīng)歷過多個周期,我很清楚下一個周期要發(fā)生什么,加上我總是到處飛,去看最先進的模型和技術(shù)生態(tài)、跟全球最新銳的創(chuàng)業(yè)者在一起,我們對技術(shù)和商業(yè)的結(jié)合、對全棧的理解可能會比業(yè)內(nèi)其他競爭對手更快更強。
雷峰網(wǎng):那現(xiàn)在會有什么新的判斷嗎?
姚欣:Agent Infra會是下一代的AIOS。
作者長期關(guān)注半導(dǎo)體、算力上下游等方向,歡迎添加作者微信Ericazhao23交流。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.