網易首頁 > 網易號 > 正文申請入駐

Sarvam AI的冷啟動與熱爭議：一場關于印度本土大模型的現實檢驗

2025-05-27 14:49:04　來源: AI變革

黑龍江舉報

分享至

聚焦

印度要不要自己的大模型？Sarvam AI 給出的答案是“要”，但當它真的發布了 Sarvam-M 之后，質疑聲也接踵而至。

240億參數、支持10種印度本土語言、權重開放、面向全社會……這些聽起來本應代表技術突破的關鍵詞，卻在發布兩天后僅收獲了334次下載。相比韓國大學生開發的模型兩天20萬次的下載量，這一成績令不少業內人士“感到尷尬”。

這一對比迅速引爆社交網絡，印度AI圈隨即陷入一場圍繞“本土大模型是否必要”的熱烈爭論。而這場爭議背后，實則是印度AI生態發展階段、使用習慣、數據基礎與算力條件之間的多重現實碰撞。

Sarvam-M發布了什么？

從國家使命走向冷啟動，Sarvam-M到底發布了什么？

Sarvam AI 是印度國家AI戰略 IndiaAI Mission 早期扶持的代表企業之一，由前 UIDAI 技術負責人 Vivek Raghavan 和 AI4Bharat 聯合創始人 Pratyush Kumar 于2023年成立，目標明確——打造“主權AI棧”。

Sarvam-M 是他們最新發布的開源大語言模型，具備以下特點：

構建基礎為 Mistral Small（法國開源模型）；
參數規模為 240億，支持印地語、孟加拉語、古吉拉特語、卡納達語、馬拉雅拉姆語等 10種本地語言；
強調為印度語境優化，支持多場景、多領域適配；
模型權重開放，并在 Hugging Face 上提供使用。

這被視作印度AI自主化進程的重要一步。Sarvam 聯合創始人 Raghavan 表示：“Sarvam-M 是印度邁向主權AI的重要基石。”

但理想與現實之間存在明顯落差。上線兩日僅 334 次下載，最新數據也不過 1200 次，引發外部投資人、開發者和評論者的普遍質疑。

核心爭議是什么？

批評的核心在于價值定位

這場質疑最具代表性的聲音來自 Menlo Ventures 投資人 Deedy Das。他的觀點可總結為三點：

產品缺乏明確需求：“沒有人在等一個稍微好點的 24B 印度語言模型。”
投入與產出不匹配：“Sarvam 已經獲得 4100 萬美元融資，成果卻過于保守。”
替代性強，競爭力弱：“Google 和 TWO.ai 的產品性能更強，價格更低。”

更具爭議的是，Das 將 Sarvam-M 與一款由兩位韓國大學生開發的模型對比，后者在 Hugging Face 上兩天獲得近 20 萬次下載，而 Sarvam-M 的冷啟動成績則被形容為“embarrassing”。

印度AI有自己的節奏

面對質疑，印度AI開發者群體迅速展開回應。

Lightspeed 合伙人 Hemant Mohapatra 強調，Sarvam 的用戶規模在上月增長了10倍，并覆蓋了4%的成年人口，體現出其在印度本土的落地能力。
AI4Bharat 社區開發者表示，Sarvam-M 的真正意義在于構建范式，而非短期指標。它不僅公開了模型，還分享了微調流程，為印度AI從業者提供可復制的路徑。
Sarvam 內部員工指出，部分評論者并未親自測試模型，就開始下結論。有人稱這是“一種對印度AI生態缺乏理解的表現”。

更有開發者強調，模型的使用場景包括 小商戶語音問答、農業助手、法律文書輔助等，服務的是 Bharat（印度非英語、農村與中小城鎮人口），不是精英市場。

主權模型是否值得構建？

回到根本問題：為什么要構建印度自己的基礎大模型？它值得嗎？

這一問題不能簡單用“下載量”回答，而需從三大結構性現實出發理解：

算力門檻高，訓練成本極大

Sarvam-M 雖由 Mistral Small 微調而來，但 Sarvam 的中期目標是訓練 70B 參數模型，預計投入約 4000–5000 萬美元。這對印度本土算力環境而言，是一項挑戰。

在 DeepSeek 成功用 H800 GPU 低成本訓練模型之后，印度是否也能復制“國產AI硬件+本地訓練”的路徑，尚未可知。

多語言語料難收集，模型適配復雜

印度有超過 20 種主要語言，90%以上人口的數字行為以本土語言為主。大模型若不能精準服務本地語言習慣，將難以落地。

Sarvam 的一個核心任務，就是完成大規模 Indic 語言數據的清洗與組織，這部分工作對外界而言是“不可見的壁壘”。

X上的用戶評論

產品場景分發鏈條尚未完善

很多開發者指出，Sarvam-M 面向的是那些 尚未形成明確AI使用習慣的用戶群體。基礎設施、終端使用體驗、語言理解模型、語音識別系統缺一不可，這要求產品能力與生態組織能力并重。

這使得 Sarvam 既要當“基礎設施建設者”，又要當“應用產品開發者”。

不是熱度問題，而是生態構建問題

這場關于 Sarvam 的爭議，最終折射出一個行業普遍性問題：

一個開源大模型的價值，應如何衡量？

如果從“社交媒體熱度”出發，Sarvam-M 顯然不夠熱度；但如果從“基礎工程搭建”的視角觀察，它代表了本土AI生態一次踏實的起步。

正如谷歌研究員 Raj Dabre 所言：“Sarvam-M發布前，大家抱怨沒有印度大模型；發布后，又說它不夠好。這暴露的是我們對‘自主AI’的認知缺失。”

在冷啟動之后，真正的問題才剛剛開始

Sarvam-M 并不是一款完美的產品，但它開啟的是印度AI從“用戶國”邁向“建設國”的技術自主路徑。

這不僅是對產品功能的考驗，更是對戰略方向、產業組織能力與基礎生態的系統性檢驗。

Sarvam 的爭議并不奇怪，它面臨的是任何試圖自建AI基礎設施國家都會遇到的問題——從0到1的成本高、回報慢、不確定性極強。

這也是為什么我們不應以一時的熱度去評判它，而應關注其長期的價值沉淀：是否能支撐起真正意義上的“印度AI技術棧”。

畢竟，屬于印度的AI，不一定要從硅谷出發。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.