網易首頁 > 網易號 > 正文申請入駐

印度大模型，炸了！！！

2025-05-30 19:15:53　來源: AI變革

黑龍江舉報

分享至

聚焦

印度要不要自己的大模型？Sarvam AI 給出的答案是“要”，但當它真的發布了 Sarvam-M 之后，質疑聲也接踵而至。

“令人尷尬！”當看到Sarvam AI發布的印度首個“主權級”大模型Sarvam-M在Hugging Face上兩天僅獲334次下載時，風投機構Menlo Ventures的投資人Deedy Das毫不留情地評價道。

更扎心的是對比，兩名韓國大學生開發的Dia模型下載量已突破20萬次。就連印度政府支持的BharatGen推出的Param-1模型，一周內也僅收獲12次下載。

這一對比迅速引爆社交網絡，印度AI圈隨即陷入一場圍繞“本土大模型是否必要”的熱烈爭論。而這場爭議背后，實則是印度AI生態發展階段、使用習慣、數據基礎與算力條件之間的多重現實碰撞。

Sarvam-M發布了什么？

從國家使命走向冷啟動，Sarvam-M到底發布了什么？

Sarvam AI 是印度國家AI戰略 IndiaAI Mission 早期扶持的代表企業之一，由前 UIDAI 技術負責人 Vivek Raghavan 和 AI4Bharat 聯合創始人 Pratyush Kumar 于2023年成立，目標明確——打造“主權AI棧”。

如此慘淡的成績，與Sarvam AI身上的光環形成刺眼反差。

作為印度政府“IndiaAI Mission”首批重點扶持公司，創始人Kumar曾多次強調：“印度必須擁有自主訓練和部署的基礎模型，而非僅僅微調西方模型。”

他的愿景宏大而清晰：構建從數據生成到模型部署的完整印度AI技術棧，打造真正屬于本土的AI主權。

然而諷刺的是，此番引發爭議的Sarvam-M，卻是基于法國Mistral公司的小型模型改進而來。雖然官方報告稱其在印地語、孟加拉語等10種本地語言上超越Llama-4 Scout，甚至接近更大規模的Llama-3.3和Gemma，但英文能力卻有小幅下滑。

核心爭議是什么？

批評的核心在于價值定位

這場質疑最具代表性的聲音來自 Menlo Ventures 投資人Deedy Das。他的觀點可總結為三點：

產品缺乏明確需求：“沒有人在等一個稍微好點的 24B 印度語言模型。”
投入與產出不匹配：“Sarvam 已經獲得 4100 萬美元融資，成果卻過于保守。”
替代性強，競爭力弱：“Google 和 TWO.ai 的產品性能更強，價格更低。”

更具爭議的是，Das 將 Sarvam-M 與一款由兩位韓國大學生開發的模型對比，后者在 Hugging Face 上兩天獲得近20 萬次下載，而 Sarvam-M 的冷啟動成績則被形容為“embarrassing”。

印度AI有自己的節奏

面對質疑，印度AI開發者群體迅速展開回應。

Lightspeed 合伙人 Hemant Mohapatra強調，Sarvam 的用戶規模在上月增長了10倍，并覆蓋了4%的成年人口，體現出其在印度本土的落地能力。
AI4Bharat 社區開發者表示，Sarvam-M 的真正意義在于構建范式，而非短期指標。它不僅公開了模型，還分享了微調流程，為印度AI從業者提供可復制的路徑。
Sarvam 內部員工指出，部分評論者并未親自測試模型，就開始下結論。有人稱這是“一種對印度AI生態缺乏理解的表現”。

更有開發者強調，模型的使用場景包括小商戶語音問答、農業助手、法律文書輔助等，服務的是 Bharat（印度非英語、農村與中小城鎮人口），不是精英市場。

主權模型是否值得構建？

回到根本問題：為什么要構建印度自己的基礎大模型？它值得嗎？

這一問題不能簡單用“下載量”回答，而需從三大結構性現實出發理解：

算力門檻高，訓練成本極大

Sarvam-M 雖由 Mistral Small 微調而來，但 Sarvam 的中期目標是訓練 70B 參數模型，預計投入約4000–5000 萬美元。這對印度本土算力環境而言，是一項挑戰。

在 DeepSeek 成功用 H800 GPU 低成本訓練模型之后，印度是否也能復制“國產AI硬件+本地訓練”的路徑，尚未可知。

多語言語料難收集，模型適配復雜

印度有超過 20 種主要語言，90%以上人口的數字行為以本土語言為主。大模型若不能精準服務本地語言習慣，將難以落地。

Sarvam 的一個核心任務，就是完成大規模Indic 語言數據的清洗與組織，這部分工作對外界而言是“不可見的壁壘”。

X上的用戶評論

產品場景分發鏈條尚未完善

很多開發者指出，Sarvam-M 面向的是那些尚未形成明確AI使用習慣的用戶群體。基礎設施、終端使用體驗、語言理解模型、語音識別系統缺一不可，這要求產品能力與生態組織能力并重。

這使得 Sarvam 既要當“基礎設施建設者”，又要當“應用產品開發者”。

不是熱度問題，而是生態構建問題

這場關于 Sarvam 的爭議，最終折射出一個行業普遍性問題：

一個開源大模型的價值，應如何衡量？

如果從“社交媒體熱度”出發，Sarvam-M 顯然不夠熱度；但如果從“基礎工程搭建”的視角觀察，它代表了本土AI生態一次踏實的起步。

正如谷歌研究員 Raj Dabre 所言：“Sarvam-M發布前，大家抱怨沒有印度大模型；發布后，又說它不夠好。這暴露的是我們對‘自主AI’的認知缺失。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.