<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      在印度爭奪人工智能獨立性的內部動態

      0
      分享至

      結構上的挑戰和該國的多種語言使得開發基礎人工智能模型變得頗為困難。但政府迫切希望不落人后。



      今年早些時候,在印度班加羅爾,阿迪西亞·科拉維(Adithya Kolavi)看到DeepSeek在全球范圍內推出了其顛覆性的語言模型,感到既興奮又認可。中國的技術在基準上可以與西方最好的技術媲美,但它是在更短的時間內用更少的資金建成的。

      “我心想:‘這就是我們如何以更低成本實現顛覆的方式,’”印度人工智能初創公司CognitiveLab的20歲創始人科拉維說道。“如果DeepSeek能做到,我們為何不能呢?”

      但對于索克特 AI 實驗室的創始人、印度最早致力于開發基礎模型的項目之一的架構師阿比謝克·烏珀瓦爾來說,這一時刻既令人欣喜,又有些苦澀。

      烏珀沃爾的模型名為Pragna-1B,在資金微薄的情況下苦苦掙扎,而同時他看到全球的同行們籌集到了數百萬美元的資金。這個多語言模型擁有相對有限的12.5億參數,其設計初衷是降低“語言稅”——即由于印度與美、中不同,需要支持多種語言而產生的額外成本。他的團隊曾對該模型進行過訓練,但資源有限意味著無法擴大規模。因此,他表示,該項目最終成為了一個概念驗證而非實際產品。

      “如果兩年前我們得到了資助,很有可能就是我們開發DeepSeek剛剛發布的產品,”他說。

      科拉維的熱情與上沃爾的沮喪反映了印度人工智能構建者中各種情緒的交織。盡管印度是全球科技中心之一,但在本土人工智能領域的發展上,卻遠遠落后于美國和中國等先進國家。這一差距的拉大,在很大程度上歸因于印度在研發、機構和創新方面長期投資不足。此外,由于大部分人口沒有使用同一種母語,訓練語言模型的工作在印度比在其他地方復雜得多。

      從歷史上看,印度被稱為軟件行業的全球后臺,印度的科技生態系統是本著服務至上的理念發展起來的。像Infosys和TCS這樣的巨頭們 成功 的 基礎是高效的軟件交付,但發明既沒有被優先考慮也沒有得到獎勵。同時,印度在2024年的研發支出僅徘徊在GDP的0.65%(254億美元),遠遠落后于中國的2.68%(4762億美元)和美國的3.5%(9623億美元)。從算法到芯片,發明和商業化深科技的肌肉從未建立。

      在國防研究與發展組織(DRDO)和印度空間研究組織(ISRO)等政府機構中,確實存在一些孤立的世界級研究,但它們的突破很少擴展到民用或商業用途。印度缺乏像美國DARPA那樣將冒險研究與商業路徑連接起來的橋梁。同時,印度的許多頂尖人才移居國外,被更了解深層技術的生態系統所吸引,而關鍵是,這些生態系統也為深層技術提供資金。
      因此,當開源基礎模型DeepSeek-R1突然展現出超越許多全球同行的表現時,這觸動了人們的神經。這家中國初創企業的這一舉動促使印度政策制定者直面該國在人工智能基礎設施方面的落后程度,以及其亟需做出回應的緊迫性。

      印度回應

      2025年1月,在DeepSeek-R1發射10天后,電子與信息技術部(MeitY)開始征集印度自主基礎模型的提案,這些模型是大型人工智能模型,可以適應各種任務。其公開招標邀請私營部門的云和數據中心公司為政府主導的AI研究預留GPU計算能力。

      包括 Jio、Yotta、E2E Networks、塔塔、AWS 合作伙伴以及 CDAC 在內的供應商做出了回應。通過這一安排,MeitY 突然能夠以補貼價格獲得近 19,000 個 GPU,這些 GPU 來自私有基礎設施,并被專門分配給基礎 AI 項目。這促使眾多公司紛紛提交提案,希望構建自己的模型。

      兩周內, 他們已經收到了67份提案 。這個數字在3月中旬增加了兩倍。

      今年4月,政府宣布計劃在2025年底之前開發6個大型模型,以及針對農業、教育和氣候行動等部門的18個額外的AI應用。最值得注意的是,它 聘請了 Sarvam AI 來構建一個針對印度語言和需求的700億個參數的模型。

      對于一個長期受限于有限研究基礎設施的國家來說,事情以創紀錄的速度發展,標志著雄心、才智和政治意愿罕見地融合在一起。

      “印度可以在人工智能方面做Mangalyaan,”IIIT-Delhi的Gautam Shroff說,他指的是 該國的成本效益 ,以及成功的火星軌道器任務。

      Jaspreet Bindra是專注于教授人工智能素養的組織AI&Beyond的聯合創始人,他敏銳地捕捉到了其中的緊迫性:“DeepSeek很可能是印度發生的最棒的事情。它給了我們當頭一棒,促使我們停止空談,開始付諸行動。”

      語言問題

      為印度構建基礎性AI模型所面臨的最為根本的挑戰之一,是這個國家極其豐富的語言多樣性。印度有22種官方語言,數百種方言,以及數以百萬計的多語言人口,這使得現有的大多數LLMs都難以應對印度所面臨的問題。

      雖然大量高質量的網絡數據可用英語提供,但印度語言在在線內容中所占比例不到1%。缺乏像比丘里語和卡納達語這樣的語言的數字化、標記和清理數據,使得培訓理解印度人實際說話或搜索方式的LLMs變得困難。

      全局標記器將文本分解為模型可以處理的單元,但在許多印度文字上表現不佳,誤解了字符或完全跳過一些。因此,即使將印度語言包含在多語言模型中,它們也常常被理解不良且生成不準確。

      與OpenAI和DeepSeek通過使用結構化英語數據實現規模不同的是,印度團隊通常從包含數十種印度語言的碎片化和低質量數據集開始。這使得訓練基礎模型的早期步驟更加復雜。

      盡管如此,一群規模雖小但意志堅定的印度建筑從業者正開始塑造該國的AI未來。

      例如,Sarvam AI 創造了 OpenHathi-Hi-v0.1,一個開源的印地語語言模型 展示 了 印度 AI 領域解決該國巨大語言多樣性的不斷增長的能力。該模型基于Meta的Llama 2架構,在400億個印地語和相關的印度語言內容上進行訓練,使其成為迄今為止最大的開源印地語模型之一。

      Pragna-1B,來自Upperwal的多語言模型,進一步證明了印度可以 解決 自己的語言復雜性問題。訓練了3000億個標記只需250,000美元,它引入了一種稱為“平衡標記化”的技術,以解決印度人工智能的獨特挑戰,使一個12.5億個參數的模型能夠像一個大得多的模型一樣運行。
      問題在于,印度語言使用復雜的文字和凝集語法,通過使用前綴和后綴將許多較小的意義單位串聯在一起來形成單詞。與用空格分隔單詞并遵循相對簡單的結構的英語不同,印度語言如印地語、泰米爾語和卡納達語通常缺乏清晰的詞界,并將大量信息包裝在單詞中。標準的標記器難以處理這些輸入。它們最終將印度單詞分解為過多的標記,這使得輸入變得過多,使模型更難有效理解意義或準確回應。

      然而,借助這項新技術,“一個擁有10億參數的模型相當于一個擁有70億參數的模型,比如Llama 2”,尤伯瓦爾表示。這一性能提升在印地語和古吉拉特語方面尤為顯著,在這些語言上,由于多語言訓練數據的有限性,全球模型的表現往往不盡如人意。這提醒我們,借助巧妙的工程技術,小團隊依然能夠突破界限。
      Upperwal最終重新利用其核心科技,為22種印度語言開發了語音API,這是一個更直接的解決方案,更適合經常被排除在英語優先的AI體驗之外的農村用戶。

      “如果通往AGI的道路是一百步的過程,那么訓練語言模型只是第一步,”他說。

      而在光譜的另一端,是那些有著更大膽目標的初創企業。Krutrim-2,例如,是一個 120億個參數的多語言語言模型 優化為英語和22種印度語言。

      Krutrim-2正試圖解決印度的語言多樣性、低質量數據和成本限制等具體問題。該團隊構建了一個自定義的Indic標記器,優化了培訓基礎設施,并從一開始就設計了多模態和語音優先用例的模型,這在一個文本界面可能成為問題的國家中至關重要。

      克魯特里姆的賭注在于,其方法不僅將促成印度在人工智能領域的自主地位,還將提供一個適用于全球南方地區的AI模式。

      除了公共資金和計算基礎設施,印度還需要人才、研究深度和長遠資本的制度支持,以產生具有全球競爭力的科學。

      盡管風險投資仍不愿押注研究,但新的實驗正在涌現。帕拉斯·喬普拉(Paras Chopra)是一位企業家,他曾創建并 出售 軟件即服務公司Wingify,現在他正在個人資助Lossfunk,這是一個貝爾實驗室風格的AI駐留項目,旨在 吸引 熱愛開源科學的獨立研究人員。

      Chopra說:“我們在學術界或行業中沒有榜樣。所以我們正在創造一個空間,讓頂尖研究人員可以互相學習,并擁有創業風格的股權上行空間。”

      政府支持的押注于主權人工智能

      印度人工智能雄心的最明確標志是 政府選擇了 Sarvam AI來開發一個專注于印度語言和語音流利的模型。

      這個想法是,它不僅能夠幫助印度企業在全球人工智能競賽中競爭,還能惠及更廣泛的民眾。“如果它成為印度生態系統的組成部分,就可以通過對話界面來教育數億人,”賓德拉說道。

      薩瓦姆獲得了4,096個英偉達H100 GPU的訪問權限,以便在六個月內訓練一個擁有700億參數的印度語言模型。(該公司此前曾發布過一個在10種印度語言上訓練的擁有20億參數的模型,稱為薩瓦姆-1。)

      薩瓦姆的項目以及其他項目都屬于一項名為“印度AI使命”的更大戰略的一部分,這是一項耗資12.5億美元的國家級計劃,于2024年3月啟動,旨在構建印度的核心AI基礎設施,并使先進工具更加普及。在MeitY的領導下,該任務的重點是支持人工智能初創企業,尤其是那些正在開發印度語言基礎模型并應用人工智能于醫療保健、教育及農業等關鍵領域的企業。

      根據其計算計劃,政府正在向一組精選的印度初創公司部署超過18,000個GPU,其中包括近13,000個高端H100芯片,目前包括Sarvam、Upperwal的Soket Labs、 Gnani AI ,以及 Gan AI 。

      該任務還包括計劃啟動一個全國性的多語言數據集存儲庫,在較小城市設立人工智能實驗室,并為尖端技術研發提供資金。其更廣泛的目標是,為印度開發者提供構建具有全球競爭力的人工智能所需的基礎設施,并確保相關成果植根于印度以及全球南方地區的語言和文化現實。
      據印度AI首席執行官、MeitY官員阿比謝克·辛格稱,印度在深度科技領域的整體推進預計在接下來的五年里將籌集約120億美元的研究和開發投資。

      這包括通過“印度AI使命”計劃提供的約1.62億美元,其中約3200萬美元被專門用于直接初創企業資金。國家量子使命還將貢獻7.3億美元,以支持印度在量子研究領域的雄心。除此之外,2025-26年的國家預算文件宣布了一項12億美元的深度科技基金母基金,旨在促進私營部門的早期創新。

      剩下的近99億美元預計將來自私人和國際來源,包括企業研發、風險投資公司、高凈值個人、慈善家以及微軟等全球技術領導者。

      目前, IndiaAI 已經收到了500多份來自初創公司的申請,這些申請在健康、治理和農業等領域提出了用例。

      “我們已經宣布支持Sarvam,另外10到12家初創公司將只為基礎模式提供資金,”辛格說。選擇標準包括獲取培訓數據、人才深度、行業契合度和可擴展性。

      開門還是關門?

      然而,印度AI項目并非沒有爭議。Sarvam是作為一個封閉模式構建的,而不是開源的,盡管它有公共技術根源。這引發了關于私營企業和公共產品之間適當平衡的辯論。

      “真正的主權應植根于開放性和透明度,”人工智能政策專家阿姆蘭·莫漢蒂說道。他提到了DeepSeek-R1,盡管其參數規模達到了2360億,但仍被公開提供以供商業使用。

      它的發布使世界各地的開發者可以在低成本的GPU上對其進行微調,創建更快的變體,并將其功能擴展到非英語應用程序。

      “推出一個具有高效推理能力的開放權重模型,可以推動AI的民主化,”埃默里大學信息系統與運營管理助理教授韓城·曹表示,“這使得原本不具備龐大基礎設施的開發人員也能夠使用AI。”

      然而,印度AI對公共資助的模型是否應該開源持中立立場。

      “我們不想左右商業模式,”辛格說,“印度一直支持開放標準和開源,但這取決于團隊。無論路線如何,我們的目標都是強大的印度模式。”

      此外還有其他的挑戰。5月下旬,Sarvam AI發布了Sarvam-M,這是一款針對10種印度語言進行了微調的240億參數多語言大型語言模型,其構建基礎是法國公司Mistral AI開發的高效模型Mistral?Small。Sarvam的聯合創始人維韋克·拉加萬稱該模型是“我們在為印度構建主權人工智能的道路上的一塊重要墊腳石”。但該模型的下載量并不理想,頭兩天內僅有300次下載。風險投資人迪迪·達斯稱此次發布“令人尷尬”。
      而問題不僅限于初期冷淡的接受度。印度的許多開發者仍難以獲得GPU,而針對印度語言的AI應用的整體生態系統也仍處于萌芽階段。

      計算問題

      計算資源短缺正逐漸成為生成式人工智能領域最顯著的瓶頸之一,這不僅限于印度,全球皆是如此。對于那些仍嚴重依賴進口GPU且缺乏國內制造能力的國家而言,構建和運行大型模型的成本往往高得令人望而卻步。

      印度的大多數芯片仍然依賴進口,而不是在國內生產,大型模型的訓練仍然昂貴。這就是為什么初創公司和研究人員都專注于軟件層面的效率,這些效率包括更小的模型、更好的推理和微調框架,以優化在更少GPU上的性能。

      “基礎設施的缺失并不意味著創新的缺失,”曹說。“支持優化科學是在約束條件下工作的明智方式。”

      然而,印度AI的辛格認為,由于新的政府項目和公私合作伙伴關系,基礎設施挑戰的趨勢正在逆轉。“我相信在未來三個月內,我們將不再面臨去年看到的那種計算瓶頸,”他說。

      印度也有成本優勢。
      根據古普塔的說法,在印度建立超大規模數據中心的成本約為500萬美元,大致為美國、歐洲或新加坡等市場成本的一半左右。這要歸功于廉價的土地、較低的建造和勞動力成本,以及大量熟練的工程師。

      就目前而言,印度在人工智能領域的抱負似乎與其說是為了超越OpenAI或DeepSeek,不如說是為了實現戰略上的自主。無論其采用的方式是小規模的自主模型、開放的生態系統還是公私合作的混合型模式,這個國家都在押注于自己能夠規劃出一條獨特的道路。

      盡管一些專家認為,政府(對DeepSeek)的行動或反應是表演性的,符合其民族主義議程,但許多初創公司創始人感到振奮。他們認為,政府和私營部門之間日益加強的合作是克服印度在技術創新方面長期存在的結構性挑戰的真正機會。

      在去年的班加羅爾Meta峰會上,印孚瑟斯董事長南丹·尼勒卡尼呼吁印度不要盲目追求一個“亦步亦趨”的人工智能夢想。

      “讓硅谷的大佬來做吧,”他在談到構建 LLMs 時說道。“我們將用它來創建合成數據,快速構建小型語言模型,并使用適當的數據訓練它們。”

      他認為印度應該優先考慮實力而非場面,這一觀點受到了不同意見的接受。但它反映了一種更廣泛的共識,即印度是否應該完全換一種游戲。

      "試圖主導堆棧的每一層都是不現實的,即使對中國來說也是如此,"ShobhankitaReddy,印度公共政策非營利組織Takshashila Institution的研究員說。“主導一個層面,比如應用程序、服務或人才,這樣你仍然不可或缺。”

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      數百名醫生強調:只要做過腸鏡檢查,患者一定多加關注這4點

      數百名醫生強調:只要做過腸鏡檢查,患者一定多加關注這4點

      健康科普365
      2026-04-27 13:15:12
      打起來了?深夜,伊朗首都發生爆炸,美失聲,以色列:不是我干的

      打起來了?深夜,伊朗首都發生爆炸,美失聲,以色列:不是我干的

      咣當地球
      2026-04-27 21:41:02
      2-0衛冕奪冠!中國女網17歲新星沖擊TOP100:追趕鄭欽文王欣瑜?

      2-0衛冕奪冠!中國女網17歲新星沖擊TOP100:追趕鄭欽文王欣瑜?

      李喜林籃球絕殺
      2026-04-27 16:33:19
      中國汽車市場份額:法系0.2%,韓系1%,美系6.9%,日系13%

      中國汽車市場份額:法系0.2%,韓系1%,美系6.9%,日系13%

      狐貍先森講升學規劃
      2026-04-21 09:30:03
      豪門闊太只拍一部戲就隱退,獲演員丈夫寵愛30年

      豪門闊太只拍一部戲就隱退,獲演員丈夫寵愛30年

      眼底星碎
      2026-04-25 11:35:30
      男人有錢就找一個自己喜歡,漂亮的女人,有錢女人就會死心塌地

      男人有錢就找一個自己喜歡,漂亮的女人,有錢女人就會死心塌地

      加油丁小文
      2026-04-08 07:00:08
      2026大眾正式低頭:家用全系告別頓挫雙離合,全面換8AT

      2026大眾正式低頭:家用全系告別頓挫雙離合,全面換8AT

      侃故事的阿慶
      2026-04-26 09:52:39
      “早晚刷牙”是錯的?醫生叮囑:過了老年,最好改掉這幾個壞習慣

      “早晚刷牙”是錯的?醫生叮囑:過了老年,最好改掉這幾個壞習慣

      路醫生健康科普
      2026-04-26 22:55:03
      烏克蘭民眾戰爭倦怠情緒日益加深

      烏克蘭民眾戰爭倦怠情緒日益加深

      參考消息
      2026-04-27 10:09:05
      002779、603360,被證監會立案!

      002779、603360,被證監會立案!

      證券時報e公司
      2026-04-27 22:46:03
      俄軍被迫從馬里的要塞撤出!烏克蘭反攻延伸至非洲

      俄軍被迫從馬里的要塞撤出!烏克蘭反攻延伸至非洲

      項鵬飛
      2026-04-27 18:51:13
      不出大陸所料:特朗普發話,要讓臺灣變一文不值?鄭麗文看破算計

      不出大陸所料:特朗普發話,要讓臺灣變一文不值?鄭麗文看破算計

      夕落秋山
      2026-04-27 12:42:43
      俄發言人質問歐洲:看不到烏克蘭在殺兒童嗎?賊喊捉賊

      俄發言人質問歐洲:看不到烏克蘭在殺兒童嗎?賊喊捉賊

      律法刑道
      2026-04-26 11:30:29
      李奇微晚年曾說過,戰斗力一流的國家只有三個,其他的都不值一提

      李奇微晚年曾說過,戰斗力一流的國家只有三個,其他的都不值一提

      老范談史
      2026-04-23 17:35:54
      新能源車在高速上電量耗盡,司機竟試圖接路邊監控電源給車充電!交警及時發現:極易引發漏電;司機被罰款200元、記3分

      新能源車在高速上電量耗盡,司機竟試圖接路邊監控電源給車充電!交警及時發現:極易引發漏電;司機被罰款200元、記3分

      大象新聞
      2026-04-27 11:13:03
      追覓CEO俞浩連發三條微博炮轟小紅書:價值觀和盈利模式“都有毒”

      追覓CEO俞浩連發三條微博炮轟小紅書:價值觀和盈利模式“都有毒”

      紅星新聞
      2026-04-27 17:55:36
      1-1!穆帥爭二利好:葡體爆冷+差前二3分,本菲卡后3場全勝進歐冠

      1-1!穆帥爭二利好:葡體爆冷+差前二3分,本菲卡后3場全勝進歐冠

      體育知多少
      2026-04-27 06:04:21
      “見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網笑柄

      “見過最廉價的兜底”,一份山姆燒雞,讓低認知母子淪為全網笑柄

      妍妍教育日記
      2026-04-15 09:30:09
      我48歲剛再婚就發現懷孕,兩天后丈夫質問:孩子到底怎么回事

      我48歲剛再婚就發現懷孕,兩天后丈夫質問:孩子到底怎么回事

      千秋文化
      2026-04-27 20:03:20
      一夜之間!日本美夢徹底破碎,伊朗突然下死命令,中方也不再客氣

      一夜之間!日本美夢徹底破碎,伊朗突然下死命令,中方也不再客氣

      天氣觀察站
      2026-04-27 17:25:53
      2026-04-27 23:04:49
      山自 incentive-icons
      山自
      寫點有趣的。關注自動駕駛和AI商業變革。
      125文章數 0關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實測出來了

      頭條要聞

      水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

      頭條要聞

      水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

      體育要聞

      最抽象的天才,正在改變瓜迪奧拉

      娛樂要聞

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

      財經要聞

      Meta 140億收購Manus遭中國發改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態度原創

      藝術
      數碼
      旅游
      公開課
      軍事航空

      藝術要聞

      你絕對想不到,攝影能讓她成為女神!

      數碼要聞

      因競爭力下滑,消息稱三星電子將停止在中國銷售家電及電視產品

      旅游要聞

      聽過花開的聲音嗎?4月28日到5月10日去新天地!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗外長折返伊斯蘭堡內情披露

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 最新国产在线拍揄自揄视频| 裸体丰满白嫩大尺度尤物| 777久久精品一区二区三区无码 | 色偷偷无码| 推油少妇久久99久久99久久| 人妻少妇精品中文字幕| 亚洲男人在线| 北海市| 精品国产一区二区三区香蕉蜜臂| 超碰草| 亚洲人成无码区在线观看| 亚洲日韩AV在线| 国产精品亚洲аv无码播放| 欧美一区二区日韩国产| 久久久无码精品午夜| 男人av无码天堂| 欧美精品videosex极品| 国产爽片一区二区三区| 大地资源网第二页免费观看| 欧美性xxxx狂欢老少配 | 国产精品久久久久久久久人妻| 波多野结衣绝顶大高潮| 精品视频99| 国模偷拍视频一区二区| 亚洲国语无码| 人妻在线日韩免费视频| 国产AV一区二区三区| 9191久久| 国内综合精品午夜久久资源| 久久久亚洲欧洲日产国码aⅴ| 国产精品办公室沙发| 日韩精品一区二区三区激情视频 | 国产网红美女av在线| 亚洲AV网站| 亚洲丶国产丶欧美一区二区三区| 无码国产精品一区二区免费式影视| 亚洲国产在一区二区三区| 国产又大又黑又粗免费视频| 国产成人专区| 色婷婷五月综合亚洲小说| 福利姬白浆AV导航|