聚焦
印度要不要自己的大模型?Sarvam AI 給出的答案是“要”,但當它真的發布了 Sarvam-M 之后,質疑聲也接踵而至。
“令人尷尬!”當看到Sarvam AI發布的印度首個“主權級”大模型Sarvam-M在Hugging Face上兩天僅獲334次下載時,風投機構Menlo Ventures的投資人Deedy Das毫不留情地評價道。
更扎心的是對比,兩名韓國大學生開發的Dia模型下載量已突破20萬次。就連印度政府支持的BharatGen推出的Param-1模型,一周內也僅收獲12次下載。
這一對比迅速引爆社交網絡,印度AI圈隨即陷入一場圍繞“本土大模型是否必要”的熱烈爭論。而這場爭議背后,實則是印度AI生態發展階段、使用習慣、數據基礎與算力條件之間的多重現實碰撞。
![]()
01
Sarvam-M發布了什么?
![]()
從國家使命走向冷啟動,Sarvam-M到底發布了什么?
Sarvam AI 是印度國家AI戰略 IndiaAI Mission 早期扶持的代表企業之一,由前 UIDAI 技術負責人 Vivek Raghavan 和 AI4Bharat 聯合創始人 Pratyush Kumar 于2023年成立,目標明確——打造“主權AI棧”。
![]()
如此慘淡的成績,與Sarvam AI身上的光環形成刺眼反差。
作為印度政府“IndiaAI Mission”首批重點扶持公司,創始人Kumar曾多次強調:“印度必須擁有自主訓練和部署的基礎模型,而非僅僅微調西方模型。”
他的愿景宏大而清晰:構建從數據生成到模型部署的完整印度AI技術棧,打造真正屬于本土的AI主權。
然而諷刺的是,此番引發爭議的Sarvam-M,卻是基于法國Mistral公司的小型模型改進而來。雖然官方報告稱其在印地語、孟加拉語等10種本地語言上超越Llama-4 Scout,甚至接近更大規模的Llama-3.3和Gemma,但英文能力卻有小幅下滑。
![]()
02
核心爭議是什么?
1
批評的核心在于價值定位
這場質疑最具代表性的聲音來自 Menlo Ventures 投資人Deedy Das。他的觀點可總結為三點:
產品缺乏明確需求:“沒有人在等一個稍微好點的 24B 印度語言模型。”
投入與產出不匹配:“Sarvam 已經獲得 4100 萬美元融資,成果卻過于保守。”
替代性強,競爭力弱:“Google 和 TWO.ai 的產品性能更強,價格更低。”
更具爭議的是,Das 將 Sarvam-M 與一款由兩位韓國大學生開發的模型對比,后者在 Hugging Face 上兩天獲得近20 萬次下載,而 Sarvam-M 的冷啟動成績則被形容為“embarrassing”。
![]()
2
印度AI有自己的節奏
面對質疑,印度AI開發者群體迅速展開回應。
Lightspeed 合伙人 Hemant Mohapatra強調,Sarvam 的用戶規模在上月增長了10倍,并覆蓋了4%的成年人口,體現出其在印度本土的落地能力。
AI4Bharat 社區開發者表示,Sarvam-M 的真正意義在于構建范式,而非短期指標。它不僅公開了模型,還分享了微調流程,為印度AI從業者提供可復制的路徑。
Sarvam 內部員工指出,部分評論者并未親自測試模型,就開始下結論。有人稱這是“一種對印度AI生態缺乏理解的表現”。
更有開發者強調,模型的使用場景包括小商戶語音問答、農業助手、法律文書輔助等,服務的是 Bharat(印度非英語、農村與中小城鎮人口),不是精英市場。
![]()
![]()
03
主權模型是否值得構建?
![]()
回到根本問題:為什么要構建印度自己的基礎大模型?它值得嗎?
這一問題不能簡單用“下載量”回答,而需從三大結構性現實出發理解:
01
算力門檻高,訓練成本極大
Sarvam-M 雖由 Mistral Small 微調而來,但 Sarvam 的中期目標是訓練 70B 參數模型,預計投入約4000–5000 萬美元。這對印度本土算力環境而言,是一項挑戰。
在 DeepSeek 成功用 H800 GPU 低成本訓練模型之后,印度是否也能復制“國產AI硬件+本地訓練”的路徑,尚未可知。
02
多語言語料難收集,模型適配復雜
印度有超過 20 種主要語言,90%以上人口的數字行為以本土語言為主。大模型若不能精準服務本地語言習慣,將難以落地。
Sarvam 的一個核心任務,就是完成大規模Indic 語言數據的清洗與組織,這部分工作對外界而言是“不可見的壁壘”。
![]()
![]()
X上的用戶評論
03
產品場景分發鏈條尚未完善
很多開發者指出,Sarvam-M 面向的是那些尚未形成明確AI使用習慣的用戶群體。基礎設施、終端使用體驗、語言理解模型、語音識別系統缺一不可,這要求產品能力與生態組織能力并重。
這使得 Sarvam 既要當“基礎設施建設者”,又要當“應用產品開發者”。
不是熱度問題,而是生態構建問題
這場關于 Sarvam 的爭議,最終折射出一個行業普遍性問題:
一個開源大模型的價值,應如何衡量?
如果從“社交媒體熱度”出發,Sarvam-M 顯然不夠熱度;但如果從“基礎工程搭建”的視角觀察,它代表了本土AI生態一次踏實的起步。
正如谷歌研究員 Raj Dabre 所言:“Sarvam-M發布前,大家抱怨沒有印度大模型;發布后,又說它不夠好。這暴露的是我們對‘自主AI’的認知缺失。”
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.