網易首頁 > 網易號 > 正文申請入駐

在印度爭奪人工智能獨立性的內部動態

2025-07-09 14:30:23　來源: 山自

北京舉報

分享至

結構上的挑戰和該國的多種語言使得開發基礎人工智能模型變得頗為困難。但政府迫切希望不落人后。

今年早些時候，在印度班加羅爾，阿迪西亞·科拉維（Adithya Kolavi）看到DeepSeek在全球范圍內推出了其顛覆性的語言模型，感到既興奮又認可。中國的技術在基準上可以與西方最好的技術媲美，但它是在更短的時間內用更少的資金建成的。

“我心想:‘這就是我們如何以更低成本實現顛覆的方式，’”印度人工智能初創公司CognitiveLab的20歲創始人科拉維說道。“如果DeepSeek能做到，我們為何不能呢？”

但對于索克特 AI 實驗室的創始人、印度最早致力于開發基礎模型的項目之一的架構師阿比謝克·烏珀瓦爾來說，這一時刻既令人欣喜，又有些苦澀。

烏珀沃爾的模型名為Pragna-1B，在資金微薄的情況下苦苦掙扎，而同時他看到全球的同行們籌集到了數百萬美元的資金。這個多語言模型擁有相對有限的12.5億參數，其設計初衷是降低“語言稅”——即由于印度與美、中不同，需要支持多種語言而產生的額外成本。他的團隊曾對該模型進行過訓練，但資源有限意味著無法擴大規模。因此，他表示，該項目最終成為了一個概念驗證而非實際產品。

“如果兩年前我們得到了資助，很有可能就是我們開發DeepSeek剛剛發布的產品，”他說。

科拉維的熱情與上沃爾的沮喪反映了印度人工智能構建者中各種情緒的交織。盡管印度是全球科技中心之一，但在本土人工智能領域的發展上，卻遠遠落后于美國和中國等先進國家。這一差距的拉大，在很大程度上歸因于印度在研發、機構和創新方面長期投資不足。此外，由于大部分人口沒有使用同一種母語，訓練語言模型的工作在印度比在其他地方復雜得多。

從歷史上看，印度被稱為軟件行業的全球后臺，印度的科技生態系統是本著服務至上的理念發展起來的。像Infosys和TCS這樣的巨頭們成功的基礎是高效的軟件交付，但發明既沒有被優先考慮也沒有得到獎勵。同時，印度在2024年的研發支出僅徘徊在GDP的0.65%（254億美元），遠遠落后于中國的2.68%（4762億美元）和美國的3.5%（9623億美元）。從算法到芯片，發明和商業化深科技的肌肉從未建立。

在國防研究與發展組織（DRDO）和印度空間研究組織（ISRO）等政府機構中，確實存在一些孤立的世界級研究，但它們的突破很少擴展到民用或商業用途。印度缺乏像美國DARPA那樣將冒險研究與商業路徑連接起來的橋梁。同時，印度的許多頂尖人才移居國外，被更了解深層技術的生態系統所吸引，而關鍵是，這些生態系統也為深層技術提供資金。
因此，當開源基礎模型DeepSeek-R1突然展現出超越許多全球同行的表現時，這觸動了人們的神經。這家中國初創企業的這一舉動促使印度政策制定者直面該國在人工智能基礎設施方面的落后程度，以及其亟需做出回應的緊迫性。

印度回應

2025年1月，在DeepSeek-R1發射10天后，電子與信息技術部（MeitY）開始征集印度自主基礎模型的提案，這些模型是大型人工智能模型，可以適應各種任務。其公開招標邀請私營部門的云和數據中心公司為政府主導的AI研究預留GPU計算能力。

包括 Jio、Yotta、E2E Networks、塔塔、AWS 合作伙伴以及 CDAC 在內的供應商做出了回應。通過這一安排，MeitY 突然能夠以補貼價格獲得近 19,000 個 GPU，這些 GPU 來自私有基礎設施，并被專門分配給基礎 AI 項目。這促使眾多公司紛紛提交提案，希望構建自己的模型。

兩周內，他們已經收到了67份提案。這個數字在3月中旬增加了兩倍。

今年4月，政府宣布計劃在2025年底之前開發6個大型模型，以及針對農業、教育和氣候行動等部門的18個額外的AI應用。最值得注意的是，它聘請了 Sarvam AI 來構建一個針對印度語言和需求的700億個參數的模型。

對于一個長期受限于有限研究基礎設施的國家來說，事情以創紀錄的速度發展，標志著雄心、才智和政治意愿罕見地融合在一起。

“印度可以在人工智能方面做Mangalyaan，”IIIT-Delhi的Gautam Shroff說，他指的是該國的成本效益，以及成功的火星軌道器任務。

Jaspreet Bindra是專注于教授人工智能素養的組織AI&Beyond的聯合創始人，他敏銳地捕捉到了其中的緊迫性：“DeepSeek很可能是印度發生的最棒的事情。它給了我們當頭一棒，促使我們停止空談，開始付諸行動。”

語言問題

為印度構建基礎性AI模型所面臨的最為根本的挑戰之一，是這個國家極其豐富的語言多樣性。印度有22種官方語言，數百種方言，以及數以百萬計的多語言人口，這使得現有的大多數LLMs都難以應對印度所面臨的問題。

雖然大量高質量的網絡數據可用英語提供，但印度語言在在線內容中所占比例不到1%。缺乏像比丘里語和卡納達語這樣的語言的數字化、標記和清理數據，使得培訓理解印度人實際說話或搜索方式的LLMs變得困難。

全局標記器將文本分解為模型可以處理的單元，但在許多印度文字上表現不佳，誤解了字符或完全跳過一些。因此，即使將印度語言包含在多語言模型中，它們也常常被理解不良且生成不準確。

與OpenAI和DeepSeek通過使用結構化英語數據實現規模不同的是，印度團隊通常從包含數十種印度語言的碎片化和低質量數據集開始。這使得訓練基礎模型的早期步驟更加復雜。

盡管如此，一群規模雖小但意志堅定的印度建筑從業者正開始塑造該國的AI未來。

例如，Sarvam AI 創造了 OpenHathi-Hi-v0.1，一個開源的印地語語言模型展示了印度 AI 領域解決該國巨大語言多樣性的不斷增長的能力。該模型基于Meta的Llama 2架構，在400億個印地語和相關的印度語言內容上進行訓練，使其成為迄今為止最大的開源印地語模型之一。

Pragna-1B，來自Upperwal的多語言模型，進一步證明了印度可以解決自己的語言復雜性問題。訓練了3000億個標記只需250,000美元，它引入了一種稱為“平衡標記化”的技術，以解決印度人工智能的獨特挑戰，使一個12.5億個參數的模型能夠像一個大得多的模型一樣運行。
問題在于，印度語言使用復雜的文字和凝集語法，通過使用前綴和后綴將許多較小的意義單位串聯在一起來形成單詞。與用空格分隔單詞并遵循相對簡單的結構的英語不同，印度語言如印地語、泰米爾語和卡納達語通常缺乏清晰的詞界，并將大量信息包裝在單詞中。標準的標記器難以處理這些輸入。它們最終將印度單詞分解為過多的標記，這使得輸入變得過多，使模型更難有效理解意義或準確回應。

然而，借助這項新技術，“一個擁有10億參數的模型相當于一個擁有70億參數的模型，比如Llama 2”，尤伯瓦爾表示。這一性能提升在印地語和古吉拉特語方面尤為顯著，在這些語言上，由于多語言訓練數據的有限性，全球模型的表現往往不盡如人意。這提醒我們，借助巧妙的工程技術，小團隊依然能夠突破界限。
Upperwal最終重新利用其核心科技，為22種印度語言開發了語音API，這是一個更直接的解決方案，更適合經常被排除在英語優先的AI體驗之外的農村用戶。

“如果通往AGI的道路是一百步的過程，那么訓練語言模型只是第一步，”他說。

而在光譜的另一端，是那些有著更大膽目標的初創企業。Krutrim-2，例如，是一個 120億個參數的多語言語言模型優化為英語和22種印度語言。

Krutrim-2正試圖解決印度的語言多樣性、低質量數據和成本限制等具體問題。該團隊構建了一個自定義的Indic標記器，優化了培訓基礎設施，并從一開始就設計了多模態和語音優先用例的模型，這在一個文本界面可能成為問題的國家中至關重要。

克魯特里姆的賭注在于，其方法不僅將促成印度在人工智能領域的自主地位，還將提供一個適用于全球南方地區的AI模式。

除了公共資金和計算基礎設施，印度還需要人才、研究深度和長遠資本的制度支持，以產生具有全球競爭力的科學。

盡管風險投資仍不愿押注研究，但新的實驗正在涌現。帕拉斯·喬普拉（Paras Chopra）是一位企業家，他曾創建并出售軟件即服務公司Wingify，現在他正在個人資助Lossfunk，這是一個貝爾實驗室風格的AI駐留項目，旨在吸引熱愛開源科學的獨立研究人員。

Chopra說:“我們在學術界或行業中沒有榜樣。所以我們正在創造一個空間，讓頂尖研究人員可以互相學習，并擁有創業風格的股權上行空間。”

政府支持的押注于主權人工智能

印度人工智能雄心的最明確標志是政府選擇了 Sarvam AI來開發一個專注于印度語言和語音流利的模型。

這個想法是，它不僅能夠幫助印度企業在全球人工智能競賽中競爭，還能惠及更廣泛的民眾。“如果它成為印度生態系統的組成部分，就可以通過對話界面來教育數億人，”賓德拉說道。

薩瓦姆獲得了4,096個英偉達H100 GPU的訪問權限，以便在六個月內訓練一個擁有700億參數的印度語言模型。（該公司此前曾發布過一個在10種印度語言上訓練的擁有20億參數的模型，稱為薩瓦姆-1。）

薩瓦姆的項目以及其他項目都屬于一項名為“印度AI使命”的更大戰略的一部分，這是一項耗資12.5億美元的國家級計劃，于2024年3月啟動，旨在構建印度的核心AI基礎設施，并使先進工具更加普及。在MeitY的領導下，該任務的重點是支持人工智能初創企業，尤其是那些正在開發印度語言基礎模型并應用人工智能于醫療保健、教育及農業等關鍵領域的企業。

根據其計算計劃，政府正在向一組精選的印度初創公司部署超過18,000個GPU，其中包括近13,000個高端H100芯片，目前包括Sarvam、Upperwal的Soket Labs、 Gnani AI ，以及 Gan AI 。

該任務還包括計劃啟動一個全國性的多語言數據集存儲庫，在較小城市設立人工智能實驗室，并為尖端技術研發提供資金。其更廣泛的目標是，為印度開發者提供構建具有全球競爭力的人工智能所需的基礎設施，并確保相關成果植根于印度以及全球南方地區的語言和文化現實。
據印度AI首席執行官、MeitY官員阿比謝克·辛格稱，印度在深度科技領域的整體推進預計在接下來的五年里將籌集約120億美元的研究和開發投資。

這包括通過“印度AI使命”計劃提供的約1.62億美元，其中約3200萬美元被專門用于直接初創企業資金。國家量子使命還將貢獻7.3億美元，以支持印度在量子研究領域的雄心。除此之外，2025-26年的國家預算文件宣布了一項12億美元的深度科技基金母基金，旨在促進私營部門的早期創新。

剩下的近99億美元預計將來自私人和國際來源，包括企業研發、風險投資公司、高凈值個人、慈善家以及微軟等全球技術領導者。

目前， IndiaAI 已經收到了500多份來自初創公司的申請，這些申請在健康、治理和農業等領域提出了用例。

“我們已經宣布支持Sarvam，另外10到12家初創公司將只為基礎模式提供資金，”辛格說。選擇標準包括獲取培訓數據、人才深度、行業契合度和可擴展性。

開門還是關門？

然而，印度AI項目并非沒有爭議。Sarvam是作為一個封閉模式構建的，而不是開源的，盡管它有公共技術根源。這引發了關于私營企業和公共產品之間適當平衡的辯論。

“真正的主權應植根于開放性和透明度，”人工智能政策專家阿姆蘭·莫漢蒂說道。他提到了DeepSeek-R1，盡管其參數規模達到了2360億，但仍被公開提供以供商業使用。

它的發布使世界各地的開發者可以在低成本的GPU上對其進行微調，創建更快的變體，并將其功能擴展到非英語應用程序。

“推出一個具有高效推理能力的開放權重模型，可以推動AI的民主化，”埃默里大學信息系統與運營管理助理教授韓城·曹表示，“這使得原本不具備龐大基礎設施的開發人員也能夠使用AI。”

然而，印度AI對公共資助的模型是否應該開源持中立立場。

“我們不想左右商業模式，”辛格說，“印度一直支持開放標準和開源，但這取決于團隊。無論路線如何，我們的目標都是強大的印度模式。”

此外還有其他的挑戰。5月下旬，Sarvam AI發布了Sarvam-M，這是一款針對10種印度語言進行了微調的240億參數多語言大型語言模型，其構建基礎是法國公司Mistral AI開發的高效模型Mistral?Small。Sarvam的聯合創始人維韋克·拉加萬稱該模型是“我們在為印度構建主權人工智能的道路上的一塊重要墊腳石”。但該模型的下載量并不理想，頭兩天內僅有300次下載。風險投資人迪迪·達斯稱此次發布“令人尷尬”。
而問題不僅限于初期冷淡的接受度。印度的許多開發者仍難以獲得GPU，而針對印度語言的AI應用的整體生態系統也仍處于萌芽階段。

計算問題

計算資源短缺正逐漸成為生成式人工智能領域最顯著的瓶頸之一，這不僅限于印度，全球皆是如此。對于那些仍嚴重依賴進口GPU且缺乏國內制造能力的國家而言，構建和運行大型模型的成本往往高得令人望而卻步。

印度的大多數芯片仍然依賴進口，而不是在國內生產，大型模型的訓練仍然昂貴。這就是為什么初創公司和研究人員都專注于軟件層面的效率，這些效率包括更小的模型、更好的推理和微調框架，以優化在更少GPU上的性能。

“基礎設施的缺失并不意味著創新的缺失，”曹說。“支持優化科學是在約束條件下工作的明智方式。”

然而，印度AI的辛格認為，由于新的政府項目和公私合作伙伴關系，基礎設施挑戰的趨勢正在逆轉。“我相信在未來三個月內，我們將不再面臨去年看到的那種計算瓶頸，”他說。

印度也有成本優勢。
根據古普塔的說法，在印度建立超大規模數據中心的成本約為500萬美元，大致為美國、歐洲或新加坡等市場成本的一半左右。這要歸功于廉價的土地、較低的建造和勞動力成本，以及大量熟練的工程師。

就目前而言，印度在人工智能領域的抱負似乎與其說是為了超越OpenAI或DeepSeek，不如說是為了實現戰略上的自主。無論其采用的方式是小規模的自主模型、開放的生態系統還是公私合作的混合型模式，這個國家都在押注于自己能夠規劃出一條獨特的道路。

盡管一些專家認為，政府（對DeepSeek）的行動或反應是表演性的，符合其民族主義議程，但許多初創公司創始人感到振奮。他們認為，政府和私營部門之間日益加強的合作是克服印度在技術創新方面長期存在的結構性挑戰的真正機會。

在去年的班加羅爾Meta峰會上，印孚瑟斯董事長南丹·尼勒卡尼呼吁印度不要盲目追求一個“亦步亦趨”的人工智能夢想。

“讓硅谷的大佬來做吧，”他在談到構建 LLMs 時說道。“我們將用它來創建合成數據，快速構建小型語言模型，并使用適當的數據訓練它們。”

他認為印度應該優先考慮實力而非場面，這一觀點受到了不同意見的接受。但它反映了一種更廣泛的共識，即印度是否應該完全換一種游戲。

"試圖主導堆棧的每一層都是不現實的，即使對中國來說也是如此，"ShobhankitaReddy，印度公共政策非營利組織Takshashila Institution的研究員說。“主導一個層面，比如應用程序、服務或人才，這樣你仍然不可或缺。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.