《科創(chuàng)板日報》12月25日訊(編輯 宋子喬) 當(dāng)?shù)貢r間周三(12月24日),被視作英偉達(dá)“挑戰(zhàn)者”的Groq在官網(wǎng)宣布,與英偉達(dá)達(dá)成一項(xiàng) “非獨(dú)家授權(quán)協(xié)議”。Groq創(chuàng)始人兼CEO Jonathan Ross、總裁Sunny Madra等核心高管及團(tuán)隊(duì)將加入英偉達(dá)。
這不是一次對公司整體的收購。英偉達(dá)支付約200億美元現(xiàn)金,獲得了Groq的核心AI推理技術(shù)知識產(chǎn)權(quán)和相關(guān)資產(chǎn),而Groq的云服務(wù)業(yè)務(wù)(Groq Cloud)將繼續(xù)獨(dú)立運(yùn)營。
這被認(rèn)為是科技巨頭爭奪頂級AI人才與技術(shù)的典型方式,能以繞過復(fù)雜反壟斷審查的形式,快速獲取關(guān)鍵創(chuàng)新。對于Groq而言,這可能意味著其獨(dú)立的硬件挑戰(zhàn)者征程告一段落,但其核心技術(shù)將在英偉達(dá)的生態(tài)中獲得更廣闊的開發(fā)平臺。
Groq是專攻AI推理芯片的明星初創(chuàng)公司,成立于2016年,總部位于美國加利福尼亞,創(chuàng)始人Jonathan Ross曾是谷歌自研AI芯片TPU(張量處理單元)項(xiàng)目的核心研發(fā)成員,部分谷歌前TPU團(tuán)隊(duì)成員也跟隨他加入了Groq。
Jonathan Ross作為谷歌第一代張量處理單元(TPU)項(xiàng)目的核心研發(fā)人員,深度參與了專為AI優(yōu)化的芯片設(shè)計。這個項(xiàng)目后來被用于擊敗圍棋冠軍李世石的AlphaGo比賽,也是Google AI服務(wù)的關(guān)鍵硬件。2016年,他帶領(lǐng)谷歌TPU團(tuán)隊(duì)10名核心成員中的7位一同離職,創(chuàng)立了Groq。當(dāng)時他發(fā)現(xiàn),傳統(tǒng)計算架構(gòu)(如CPU/GPU)無法高效處理現(xiàn)代AI任務(wù),這一認(rèn)知促使他決定創(chuàng)辦一家突破傳統(tǒng)限制的公司。
![]()
Jonathan Ross
Groq的核心產(chǎn)品是LPU(語言處理單元),這類芯片主要用于加快大語言模型完成推理相關(guān)任務(wù)的速度,被外界視為英偉達(dá)GPU替代方案之一。
![]()
2024年2月,Groq推出了一款全新的AI芯片,聲稱實(shí)現(xiàn)了“地表最強(qiáng)推理”——在Groq上運(yùn)行大模型的推理速度較英偉達(dá)GPU提高10倍甚至更高。
2025年11月,美國白宮和美國能源部的最新聲明顯示,24家頂尖的人工智能企業(yè)已與美國政府簽署協(xié)議,加入“創(chuàng)世紀(jì)計劃”,英偉達(dá)和Groq都位列其中。
目前,Groq已與Meta合作為其Llama API提供推理加速;與IBM合作整合其AI推理平臺;與沙特阿美簽署巨額協(xié)議,計劃建設(shè)大型AI推理數(shù)據(jù)中心。
Groq LPU:推理速度驚人但成本高昂
驚人的推理速度、差異化的技術(shù)路線被視作Groq LPU安身立命的根本。在Llama、Mixtral等大模型上,其文本生成速度(每秒可達(dá)500個token)曾引發(fā)廣泛關(guān)注,被認(rèn)為遠(yuǎn)超同期GPU。
另外, Groq LPU的工作原理與英偉達(dá)的GPU不同,它采用了名為時序指令集計算機(jī)(Temporal Instruction Set Computer)架構(gòu),使用存儲器為靜態(tài)隨機(jī)存取存儲器(SRAM),其速度比GPU所用的高帶寬存儲器(HBM)快約20倍。
從芯片的規(guī)格中,SRAM容量是230MB,帶寬80TB/s,F(xiàn)P16的算力是188TFLOPs。這一區(qū)別造成了 LPU和GPU在生成速度的差別。據(jù)Groq表示,英偉達(dá)GPU生成每個tokens需要約10焦耳(J)到30焦耳,而 Groq 僅需1焦耳到3焦耳。
但Groq LPU并不是完美的,其面臨成本與通用性面臨挑戰(zhàn),為運(yùn)行大模型所需的龐大集群帶來了高昂的購置和運(yùn)維成本,且專用芯片難以靈活適應(yīng)快速迭代的AI算法。
前阿里巴巴集團(tuán)副總裁、Lepton AI創(chuàng)始人兼CEO 賈揚(yáng)清曾在社交平臺上表示,由于每一張Groq卡的內(nèi)存容量僅為230MB,因此在運(yùn)行Llama-2 70B模型時,需要305-572張Groq卡才足夠,而用H100則只需要8張卡。
賈揚(yáng)清認(rèn)為,如果按未來運(yùn)行三年的成本算,Groq的硬件采購成本是1144萬美元,運(yùn)營成本至少要76.2萬美元。從目前的價格來看,這意味著在同等吞吐量下,這幾乎是H100硬件成本的40倍、能耗成本的10倍。
不止是成本高昂。SRAM技術(shù)面積大、功耗比較高,早就以IP內(nèi)核形式集成到SoC(系統(tǒng)級芯片)里面,并非單獨(dú)用,遠(yuǎn)不如HBM的未來發(fā)展?jié)摿ΑI(yè)內(nèi)人士表示,綜合來看,不管是比單位容量價格、還是性能和功耗,英偉達(dá)GPU所使用的HBM技術(shù)都優(yōu)于SRAM。
估值飆升至69億美元 去年?duì)I收9000萬美元
目前,Groq已完成多輪融資,最新估值約69億美元。
2017年:種子輪1030萬美元。
2021年:C輪融資3億美元,估值超過10億美元,成為獨(dú)角獸。
2024年8月:完成由貝萊德(BlackRock)領(lǐng)投的6.4億美元D輪融資,估值達(dá)到28億美元。
2025年9月:完成新一輪7.5億美元戰(zhàn)略融資,估值躍升至約69億美元。
Groq背后既有頂級的跨國金融機(jī)構(gòu),也有領(lǐng)先的科技產(chǎn)業(yè)巨頭,還有活躍的風(fēng)險投資基金:
金融機(jī)構(gòu)作為基石:貝萊德、路博邁等全球頂級資產(chǎn)管理公司多次參與大額融資,還包括D1資本、Altimeter Capital、1789 Capital。
產(chǎn)業(yè)資本深度參與:三星、思科、德國電信資本合伙公司(DTCP)等產(chǎn)業(yè)巨頭的投資不僅是財務(wù)行為,更是戰(zhàn)略合作。例如,這可能涉及到芯片生產(chǎn)、數(shù)據(jù)中心部署或市場渠道的合作。
專業(yè)基金持續(xù)領(lǐng)投:Disruptive(長期領(lǐng)投方)、Infinitum,其中,以Disruptive為代表的風(fēng)險投資基金,在2025年的最新一輪7.5億美元融資中擔(dān)任領(lǐng)投方。
不過,近70億美元的估值與2024年9000萬美元的營收相比,溢價極高。
其2025年?duì)I收預(yù)期已大幅下調(diào)。2025年7月,Groq將其2025年的收入預(yù)期從20億美元大幅下調(diào)至5億美元。原因可能與部分大額訂單(如與沙特阿拉伯的協(xié)議)交付延遲,以及數(shù)據(jù)中心建設(shè)進(jìn)度有關(guān)。
Groq此前告知投資者,其2026年收入將增至近12億美元(約合人民幣86億元),到2027年將超過19億美元(約合人民幣136億元),主要來自向其他公司直接銷售硬件。
截至2025年中,Groq手頭現(xiàn)金流超過20億美元,該公司資金儲備依然充足,支撐其后續(xù)擴(kuò)張。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.