12月18日早間,商湯科技在港交所發(fā)布公告,根據(jù)一般授權(quán)配售新B類股份。此次配售不少于六家機(jī)構(gòu)積極認(rèn)購(gòu),充分反映市場(chǎng)對(duì)商湯科技長(zhǎng)期價(jià)值的堅(jiān)定信心。公告顯示,此輪配售款項(xiàng)較多比例用于持續(xù)擴(kuò)大AIDC“大裝置”的規(guī)模和提高國(guó)產(chǎn)化比例。
值得關(guān)注的是,在本周(12月15日)寒武紀(jì)宣布完成對(duì)商湯日日新Seko系列多模態(tài)模型的適配,且是“Day 0”級(jí)別的同步支持。在寒武紀(jì)的官方適配名單中,能做到Day 0響應(yīng)的,此前只有兩家:一家是主攻大語(yǔ)言模型的DeepSeek,另一家就是商湯“日日新”多模態(tài)大模型。
這一細(xì)節(jié)意味深長(zhǎng),亦是中國(guó)AI產(chǎn)業(yè)迎來(lái)了一個(gè)看似靜水流深、實(shí)則波瀾壯闊的節(jié)點(diǎn)。如果說(shuō)適配DeepSeek代表的是國(guó)產(chǎn)芯片在文本邏輯處理上的成熟,那么商湯“日日新”Seko模型系列的適配,則標(biāo)志著國(guó)產(chǎn)算力在高帶寬、高并發(fā)的多模態(tài)場(chǎng)景中實(shí)現(xiàn)了關(guān)鍵跨越。
從客觀技術(shù)條件來(lái)看,這首先是為了抵抗Scaling Law遭遇的供應(yīng)鏈約束、以及單純依賴堆疊算力的線性增長(zhǎng)路徑的失效。
從商業(yè)視角來(lái)看,這比“國(guó)產(chǎn)芯片+國(guó)產(chǎn)模型”的技術(shù)握手更加深遠(yuǎn),因?yàn)樗A(yù)示著AI產(chǎn)業(yè)的下半場(chǎng)不再是參數(shù)的規(guī)模競(jìng)逐,而是要回歸物理現(xiàn)實(shí)。與此同時(shí),原生AI企業(yè)正在成為國(guó)產(chǎn)芯片成熟化的“加速器”。
不難發(fā)現(xiàn),過(guò)去一年的時(shí)間里,中國(guó)AI行業(yè)的目光逐漸從云端收回,開始審視一個(gè)棘手的灰犀牛:AI進(jìn)化的重心,已經(jīng)悄然下沉到算力層的自主可控。
然而,AI的“國(guó)產(chǎn)化突圍”不是簡(jiǎn)單的硬件替代,而是一場(chǎng)意味著“重塑”的系統(tǒng)工程。因此,在“算力主權(quán)時(shí)代”的前夜,從業(yè)者面臨的并非坦途。
雖然國(guó)產(chǎn)芯片力量正如雨后春筍般涌現(xiàn),但中國(guó)芯的生機(jī)之下,卻也伴隨著不可避免的熵增:硬件架構(gòu)的不統(tǒng)一,形成了一座座孤島,導(dǎo)致訓(xùn)練與推理的遷移成本極高,形成了一座新的“巴別塔”。
面對(duì)這一現(xiàn)狀,商湯科技選擇了一條極具長(zhǎng)期主義色彩的路徑:全面擁抱國(guó)產(chǎn)化,做那個(gè)“修塔”的人。
![]()
大裝置,國(guó)產(chǎn)芯片的“練兵場(chǎng)”
中國(guó)AI的突圍,真的只能死磕納米級(jí)的芯片制程工藝嗎?
這是一塊長(zhǎng)期盤旋在行業(yè)上空的陰云。限制擺在眼前,我們似乎撞上了一堵墻,而商湯這些AI廠商則看到了墻上的另一扇門。
這家公司給出的答案是:當(dāng)下比和工藝同樣重要的,是生態(tài)的“可戰(zhàn)性”。
而商湯大裝置(SenseCore)在這一戰(zhàn)略中扮演的角色,已經(jīng)超越了傳統(tǒng)的算力中心,而是一個(gè)巨大的異構(gòu)調(diào)度與適配平臺(tái)。它更像是一個(gè)國(guó)產(chǎn)芯片的“練兵場(chǎng)”和“試飛中心”。
![]()
為什么說(shuō)它是練兵場(chǎng)?因?yàn)橹挥性谏虦@樣千億參數(shù)級(jí)、超大規(guī)模并發(fā)的真實(shí)業(yè)務(wù)場(chǎng)景中,國(guó)產(chǎn)芯片的潛能和優(yōu)化空間才能被極限激發(fā)出來(lái)。
在練兵的同時(shí),商湯大裝置又做出了像飛機(jī)一樣精密靈活的產(chǎn)品:在原本異構(gòu)的國(guó)產(chǎn)硬件之上,商湯抽象出了一層統(tǒng)一的軟件介質(zhì),實(shí)現(xiàn)了跨異構(gòu)加速卡的統(tǒng)一訓(xùn)練,為上層應(yīng)用留出了一個(gè)標(biāo)準(zhǔn)化的接口,開發(fā)者可以在不同品牌的芯片之間無(wú)縫切換,讓端側(cè)用戶能夠簡(jiǎn)單地獲取高性能、高性價(jià)比的國(guó)產(chǎn)算力。
看起來(lái)只是“算力服務(wù)化”,其實(shí)背后是由一個(gè)“多維共生”的算力生態(tài)支撐起來(lái)的。
商湯與寒武紀(jì)的合作,一開始就沒(méi)有只停留在硬件采購(gòu)的維度,而是進(jìn)入了深度耦合的深水區(qū)。商湯利用自身在大模型研發(fā)、基礎(chǔ)設(shè)施構(gòu)建上的經(jīng)驗(yàn),反哺芯片設(shè)計(jì),雙方共同構(gòu)建了“階梯式產(chǎn)品創(chuàng)新體系”,實(shí)現(xiàn)了真正意義上的軟硬協(xié)同。相比單一的芯片銷售,國(guó)產(chǎn)算力目前的一大優(yōu)勢(shì)恰恰在于提供完整的生態(tài)服務(wù)。
面對(duì)擁有全功能GPU屬性的摩爾線程,商湯的合作模式更像是一種互補(bǔ)的“技術(shù)共生”。摩爾線程提供AI計(jì)算能力,其在圖形渲染領(lǐng)域的積累,恰好滿足商湯在AIGC視頻生成中的復(fù)合算力需求。
面對(duì)剛剛登陸科創(chuàng)板的新興算力勢(shì)力沐曦,商湯也通過(guò)在具體業(yè)務(wù)場(chǎng)景中的適配廣度,驗(yàn)證了新架構(gòu)芯片在特定高難度任務(wù)上的潛力,雙方確立了“算力集群+行業(yè)拓展”的全方位合作。針對(duì)沐曦曦云C系列GPU的高性能與生態(tài)兼容性,雙方打通了從需求到供給的優(yōu)化閉環(huán):商湯的大裝置為沐曦提供了日日新大模型的豐富場(chǎng)景驗(yàn)證,而沐曦的高性價(jià)比算力則有效降低了商湯的建設(shè)成本。
值得注意的是,商湯在國(guó)內(nèi)市場(chǎng)首次完成了華為昇騰910C的超節(jié)點(diǎn)全面適配,不是簡(jiǎn)單的單卡跑通,而是基于384卡超大規(guī)模集群的系統(tǒng)級(jí)協(xié)同。在這樣的規(guī)模下,芯片間的通信延遲、帶寬瓶頸、穩(wěn)定性等方面的挑戰(zhàn),也會(huì)被指數(shù)級(jí)放大。這是國(guó)產(chǎn)GPU首次在千億參數(shù)級(jí)大模型的訓(xùn)練與推理中,通過(guò)了工業(yè)級(jí)標(biāo)準(zhǔn)的嚴(yán)苛考驗(yàn),成功通過(guò)了大模型時(shí)代的“高壓測(cè)試”。這一突破也意味著國(guó)產(chǎn)算力和國(guó)產(chǎn)架構(gòu)在以一體化的方式,從“可用”走向“好用”。
商湯用大裝置SenseCore和日日新大模型體系全面適配為國(guó)產(chǎn)芯片“練兵”的戰(zhàn)略,解決了AI國(guó)產(chǎn)化進(jìn)程中關(guān)鍵的應(yīng)用基礎(chǔ)設(shè)施難題。
至此,商湯的“大裝置-大模型-應(yīng)用”三位一體戰(zhàn)略,也越來(lái)越具有含金量。它在試圖論證一個(gè)核心邏輯:國(guó)產(chǎn)AI的野心,不應(yīng)止步于降低落地成本。在算力主權(quán)時(shí)代,系統(tǒng)級(jí)協(xié)同能力,有能力重塑生產(chǎn)力。
![]()
在創(chuàng)新中,驗(yàn)證效率最優(yōu)解
國(guó)產(chǎn)化大裝置適配與協(xié)同只是第一步,就像路修好了,還要想辦法讓車跑得更快。
對(duì)于中國(guó)的AI從業(yè)者而言,國(guó)產(chǎn)芯片在短期內(nèi)與頂尖水準(zhǔn)仍存在客觀差距,而國(guó)產(chǎn)硬件的優(yōu)勢(shì)則在于更好的生態(tài),與原生AI企業(yè)長(zhǎng)期磨合、聯(lián)手從工程化走向商業(yè)化的長(zhǎng)期定力。
這也是寒武紀(jì)與商湯“日日新”Seko系列多模態(tài)模型適配的戰(zhàn)略級(jí)價(jià)值。文本模型尚且處于國(guó)產(chǎn)算力的淺水區(qū),而在視頻生成與多模態(tài)交互上想要跑出極致性價(jià)比,則需要攻克更多挑戰(zhàn)——不僅算力消耗巨大,對(duì)帶寬和顯存的要求更是苛刻。
這不只是技術(shù)問(wèn)題,也是商業(yè)化的“勝負(fù)手”。
商湯展示出來(lái)的工程化能力,暗示了未來(lái)五到十年內(nèi)的趨勢(shì):在計(jì)算方式和架構(gòu)創(chuàng)新的加持下,國(guó)產(chǎn)算力集群完全有能力實(shí)現(xiàn)效率上的反超,為商業(yè)化落地找到極具競(jìng)爭(zhēng)力的成本優(yōu)勢(shì)。
更具前瞻性的一個(gè)案例是,商湯與記憶張量合作,攻克了“GPGPU架構(gòu)適配難度遠(yuǎn)高于NPU”的行業(yè)難題,雙方實(shí)現(xiàn)了PD(Prefill-Decoding)分離技術(shù)的首次大規(guī)模商用落地,通過(guò)將預(yù)填充與解碼過(guò)程在物理上分離并異構(gòu)部署,如同將一條擁堵的混合車道拆解為兩個(gè)高速并行的專用車道。結(jié)果是驚人的:國(guó)產(chǎn)GPU的推理性價(jià)比提升了150%。
離“未來(lái)”最近的領(lǐng)域,則是視頻生成。這既是當(dāng)下AI競(jìng)爭(zhēng)的新高地,也是一個(gè)公認(rèn)的“算力黑洞”。商湯開源了LightX2V推理框架,這是行業(yè)首個(gè)能實(shí)現(xiàn)實(shí)時(shí)視頻生成的框架,目前下載量已突破350萬(wàn)次。
LightX2V的戰(zhàn)略意義在于它的國(guó)產(chǎn)化適配插件模式,體現(xiàn)出了可觀的兼容性——不僅支持昇騰910B、海光DCU等主流國(guó)產(chǎn)芯片,還在設(shè)計(jì)之初就引入了低比特量化、稀疏注意力等硬件友好機(jī)制,在幾乎不損失畫質(zhì)的前提下,將推理性能提升了3倍以上。
這種設(shè)計(jì)極大地釋放了國(guó)產(chǎn)算力的優(yōu)勢(shì),打破了過(guò)去“國(guó)產(chǎn)算力只能做好文本推理,做不了復(fù)雜視頻生成”的刻板認(rèn)知。國(guó)產(chǎn)芯片同樣可以承載高帶寬、高算力的多模態(tài)任務(wù)。
如果說(shuō)推理框架是工具,那么模型能力就是試金石。
在長(zhǎng)視頻生成中,保持人物、場(chǎng)景的一致性是最大的挑戰(zhàn)之一。商湯的Seko系列模型作為行業(yè)首個(gè)多劇集生成智能體,在視頻一致性上的突破,依托的正是商湯自研技術(shù)底座與國(guó)產(chǎn)算力的長(zhǎng)期磨合。
而這一能力的呈現(xiàn),與商湯三位一體的戰(zhàn)略密不可分。商湯“全面國(guó)產(chǎn)化”的定力,為國(guó)產(chǎn)大模型的規(guī)模化落地,尤其是處理高維、動(dòng)態(tài)、復(fù)雜數(shù)據(jù)等高價(jià)值密度賽道的任務(wù),提供了更多可行性。
此外,這家公司目前正在通過(guò)開源生態(tài),將復(fù)雜的硬件適配工作封裝在底層。上層應(yīng)用開發(fā)者不需要關(guān)心芯片差異,只需要關(guān)注應(yīng)用的效率和效果。
![]()
最后一公里,走向“交付級(jí)”
所有的技術(shù)決策,最終都要回歸到商業(yè)的“最后一公里”。
如何徹底驗(yàn)證國(guó)產(chǎn)化的“三位一體”具有優(yōu)越性,而不是退而求其次的無(wú)奈之舉?終局,還是應(yīng)用落地。
因此,商湯戰(zhàn)略觸角中很重要的一環(huán)就是“應(yīng)用”。它們并沒(méi)有止步于云端大裝置,而是延伸到了端側(cè)世界。目前,商湯的產(chǎn)品矩陣涵蓋了從大裝置到日日新多模態(tài)模型、再到端側(cè)應(yīng)用的全棧生態(tài)。
以小浣熊這款A(yù)I辦公應(yīng)用為例,不僅完成了國(guó)產(chǎn)芯片適配,其端側(cè)模型精度能夠?qū)?biāo)云端。“國(guó)產(chǎn)算力難以在終端普及”的魔咒被打破。AI數(shù)字人生成平臺(tái)如影,也在國(guó)產(chǎn)算力底座上實(shí)現(xiàn)了高效運(yùn)行,為視頻內(nèi)容創(chuàng)作提供了自主可控的生產(chǎn)力工具。
![]()
商湯智能辦公助手—辦公小浣熊Raccoon
未來(lái),高性能AI會(huì)像普惠的水電煤一樣,走入尋常百姓家。
特別是在城市管理、金融、醫(yī)療等對(duì)數(shù)據(jù)主權(quán)極其敏感的業(yè)務(wù)上,無(wú)論是企業(yè)還是個(gè)人客戶,幾乎都面臨著高性能、便捷性、自主可控的不可能三角。公有云更便捷,但數(shù)據(jù)安全得不到保障;私有部署更安全,但國(guó)產(chǎn)硬件適配難度大、性能不穩(wěn)定。商湯提供的全棧國(guó)產(chǎn)化私有化部署方案,精準(zhǔn)地?fù)糁辛诉@一痛點(diǎn)。
目前,商湯已經(jīng)在這些領(lǐng)域?qū)崿F(xiàn)了對(duì)國(guó)產(chǎn)芯片的全面適配與正式交付。這也意味著,基于國(guó)產(chǎn)算力和國(guó)產(chǎn)大模型的解決方案,已經(jīng)從技術(shù)驗(yàn)證走向了真正的商業(yè)化。
商湯正在走出一條屬于中國(guó)科技企業(yè)的長(zhǎng)期主義之路。將“算力國(guó)產(chǎn)化”的宏大敘事轉(zhuǎn)化為每個(gè)人都看得見(jiàn)、用得起的生產(chǎn)力工具,需要用實(shí)打?qū)嵉膽?yīng)用層交付量來(lái)書寫信心。這不僅是中國(guó)AI產(chǎn)業(yè)走向獨(dú)立自主的一張技術(shù)信任票,也是商湯“三位一體”模式的最后一公里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.