想像一下,在東非烏干達的一片玉米田里,一位農民正因作物歉收而愁眉不展。他打開手機,在WhatsApp上收到了一條由烏干達農業部發送的種植建議——而這條信息正是由我國大語言模型Qwen(通義千問)生成。這個看似超現實的場景,正在成為這個東非國家土地上的常態。在擁有4800萬人口的烏干達,雖然英語是官方語言,但僅有約30%的受教育人口能熟練使用,其余絕大多數人使用著40多種本土方言。
![]()
被矽谷遺忘的“低資源語言”
一家來自烏干達的非政府機構Sunbird AI自2024年起開始測試幾個開源大語言模型,包括Google的Gemma、Meta的Llama和阿里巴巴的Qwen(通義千問),Sunbird AI執行總裁Ernest Mwebaze發現,盡管美國大模型在英語方面表現優越,但在面對非洲本土那些(Low-resource languages)時,其優勢便蕩然無存。
由于小語種語料庫匱乏、商業回報率低,西方科技巨頭往往不愿投入資源。相比之下,阿里的Qwen系列支持多達119種語言,覆蓋了印尼的爪哇語(Javanese)、菲律賓的宿霧語(Cebuano)、海地克里奧爾語(Haitian Creole)、斯瓦希里語(Swahili)等大量被主流模型邊緣化的地方語系。Sunbird AI基于Qwen打造的Sunflower模型,則將適用于當地的語言從6種一舉擴展到了31種。
![]()
成本是使用中國模型的另一個決定性因素。
根據最新市場定價,DeepSeek V3系列模型調用API的成本極低:每百萬輸入Token(即用于處理輸入指令Token)約0.28美元,輸出token約0.42美元。相比之下,與之同級別的GPT-4o百萬輸入token成本則高達2.5美元左右,輸出則高達10美元,相當于DeepSeek V3的十到二十倍。對于缺乏龐大資金支持的AI企業或組織而言,投入高昂成本使用西方模型根本是不現實的選擇。Mwebaze表示,中國的開源模型讓他們向烏干達民眾提供免費的AI服務,并在各個領域進行靈活部署。目前,Sunbird AI已與烏干達政府合作,協助各政府部門推動數碼減貧、進行人口普查,以及為使用不同語言的人口提供農業資訊、教育材料等,努力讓那70%曾被數碼經濟排除在外的人群重新參與進來。
在肯尼亞,一家從事AI研發、為非洲各國政府和企業提供AI政策建議和解決方案的Qhala同樣在使用我國的大語言模型。Qhala的AI工程師Wenslous Egesa表示,盡管Open AI的頂級模型非常強大,但對一些企業來說,在選擇模型時最重要的還是成本考量,尤其是當企業只是需要使用模型來“快速瀏覽和檢查內部文件”,使用頂級模型就顯得沒有必要了。
![]()
2025年7月的世界人工智能大會(WAIC)期間,我國提出最新版倡議性文件《人工智能全球治理行動計劃》,試圖為這個全球議題提出“中國方案”,當中就包括幫助全球南方國家真正接觸和應用人工智能”、支持這些國家發展AI技術和服務。
盡管西方輿論對中國模型的數據私隱與合規性充滿疑慮,但對于全球南方國家而言,實用主義勝過了一切。全球開源社區風向標Hugging Face的最新報告顯示,中國模型已占據Hugging Face月度模型下載總量的41%,首次超越美國模型。在2025年推出的新模型中,超過63%的熱門微調模型是基于中國開源底座(如DeepSeek-R1或Qwen系列)開發的。全球最大AI模型API聚合平臺OpenRouter3月發布的數據則顯示,自2026年2月起,中國AI模型在該平臺的Token消耗量首次超過美國競爭對手,在3月16至22日這一周內,全球前10大熱門模型共消耗8.7兆token,當中中國模型占比達到約61%(約5.3兆Token)。
不僅在非洲,在東南亞,馬來西亞研究機構利用DeepSeek微調出了全球首個符合伊斯蘭教法的AI模型“NurAI”。該模型不僅支持馬來語、印尼語,更確保輸出內容符合穆斯林市場的宗教與文化標準。在日本,當地企業開發的前10大模型中,有6個是基于DeepSeek和Qwen構建的。從印尼的數字身份系統到肯尼亞的斯瓦希里語醫療問答,中國技術正在滲透進這些國家的社會底層架構。正如Mwebaze所言:“如果一位農民無法獲取資訊,而這個模型能提供她能理解的準確信息,我們就會認為這是非常好的......如果你來自一個根本沒有模型可用的地方,你首要的任務就是讓技術先運作起來。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.