聚焦
印度要不要自己的大模型?Sarvam AI 給出的答案是“要”,但當它真的發布了 Sarvam-M 之后,質疑聲也接踵而至。
240億參數、支持10種印度本土語言、權重開放、面向全社會……這些聽起來本應代表技術突破的關鍵詞,卻在發布兩天后僅收獲了334次下載。相比韓國大學生開發的模型兩天20萬次的下載量,這一成績令不少業內人士“感到尷尬”。
這一對比迅速引爆社交網絡,印度AI圈隨即陷入一場圍繞“本土大模型是否必要”的熱烈爭論。而這場爭議背后,實則是印度AI生態發展階段、使用習慣、數據基礎與算力條件之間的多重現實碰撞。
![]()
01
Sarvam-M發布了什么?
![]()
從國家使命走向冷啟動,Sarvam-M到底發布了什么?
Sarvam AI 是印度國家AI戰略 IndiaAI Mission 早期扶持的代表企業之一,由前 UIDAI 技術負責人 Vivek Raghavan 和 AI4Bharat 聯合創始人 Pratyush Kumar 于2023年成立,目標明確——打造“主權AI棧”。
![]()
Sarvam-M 是他們最新發布的開源大語言模型,具備以下特點:
構建基礎為 Mistral Small(法國開源模型);
參數規模為 240億,支持 印地語、孟加拉語、古吉拉特語、卡納達語、馬拉雅拉姆語等 10種本地語言;
強調為印度語境優化,支持多場景、多領域適配;
模型權重開放,并在 Hugging Face 上提供使用。
這被視作印度AI自主化進程的重要一步。Sarvam 聯合創始人 Raghavan 表示:“Sarvam-M 是印度邁向主權AI的重要基石。”
但理想與現實之間存在明顯落差。上線兩日僅 334 次下載,最新數據也不過 1200 次,引發外部投資人、開發者和評論者的普遍質疑。
![]()
02
核心爭議是什么?
1
批評的核心在于價值定位
這場質疑最具代表性的聲音來自 Menlo Ventures 投資人 Deedy Das。他的觀點可總結為三點:
產品缺乏明確需求:“沒有人在等一個稍微好點的 24B 印度語言模型。”
投入與產出不匹配:“Sarvam 已經獲得 4100 萬美元融資,成果卻過于保守。”
替代性強,競爭力弱:“Google 和 TWO.ai 的產品性能更強,價格更低。”
更具爭議的是,Das 將 Sarvam-M 與一款由兩位韓國大學生開發的模型對比,后者在 Hugging Face 上兩天獲得近 20 萬次下載,而 Sarvam-M 的冷啟動成績則被形容為“embarrassing”。
![]()
2
印度AI有自己的節奏
面對質疑,印度AI開發者群體迅速展開回應。
Lightspeed 合伙人 Hemant Mohapatra 強調,Sarvam 的用戶規模在上月增長了10倍,并覆蓋了4%的成年人口,體現出其在印度本土的落地能力。
AI4Bharat 社區開發者表示,Sarvam-M 的真正意義在于構建范式,而非短期指標。它不僅公開了模型,還分享了微調流程,為印度AI從業者提供可復制的路徑。
Sarvam 內部員工指出,部分評論者并未親自測試模型,就開始下結論。有人稱這是“一種對印度AI生態缺乏理解的表現”。
更有開發者強調,模型的使用場景包括 小商戶語音問答、農業助手、法律文書輔助等,服務的是 Bharat(印度非英語、農村與中小城鎮人口),不是精英市場。
![]()
![]()
03
主權模型是否值得構建?
![]()
回到根本問題:為什么要構建印度自己的基礎大模型?它值得嗎?
這一問題不能簡單用“下載量”回答,而需從三大結構性現實出發理解:
01
算力門檻高,訓練成本極大
Sarvam-M 雖由 Mistral Small 微調而來,但 Sarvam 的中期目標是訓練 70B 參數模型,預計投入約 4000–5000 萬美元。這對印度本土算力環境而言,是一項挑戰。
在 DeepSeek 成功用 H800 GPU 低成本訓練模型之后,印度是否也能復制“國產AI硬件+本地訓練”的路徑,尚未可知。
02
多語言語料難收集,模型適配復雜
印度有超過 20 種主要語言,90%以上人口的數字行為以本土語言為主。大模型若不能精準服務本地語言習慣,將難以落地。
Sarvam 的一個核心任務,就是完成大規模 Indic 語言數據的清洗與組織,這部分工作對外界而言是“不可見的壁壘”。
![]()
![]()
X上的用戶評論
03
產品場景分發鏈條尚未完善
很多開發者指出,Sarvam-M 面向的是那些 尚未形成明確AI使用習慣的用戶群體。基礎設施、終端使用體驗、語言理解模型、語音識別系統缺一不可,這要求產品能力與生態組織能力并重。
這使得 Sarvam 既要當“基礎設施建設者”,又要當“應用產品開發者”。
不是熱度問題,而是生態構建問題
這場關于 Sarvam 的爭議,最終折射出一個行業普遍性問題:
一個開源大模型的價值,應如何衡量?
如果從“社交媒體熱度”出發,Sarvam-M 顯然不夠熱度;但如果從“基礎工程搭建”的視角觀察,它代表了本土AI生態一次踏實的起步。
正如谷歌研究員 Raj Dabre 所言:“Sarvam-M發布前,大家抱怨沒有印度大模型;發布后,又說它不夠好。這暴露的是我們對‘自主AI’的認知缺失。”
![]()
在冷啟動之后,真正的問題才剛剛開始
Sarvam-M 并不是一款完美的產品,但它開啟的是印度AI從“用戶國”邁向“建設國”的技術自主路徑。
這不僅是對產品功能的考驗,更是對戰略方向、產業組織能力與基礎生態的系統性檢驗。
Sarvam 的爭議并不奇怪,它面臨的是任何試圖自建AI基礎設施國家都會遇到的問題——從0到1的成本高、回報慢、不確定性極強。
這也是為什么我們不應以一時的熱度去評判它,而應關注其長期的價值沉淀:是否能支撐起真正意義上的“印度AI技術棧”。
畢竟,屬于印度的AI,不一定要從硅谷出發。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.