
整理 | Echo Tang
出品丨AI 科技大本營(ID:rgznai100)
“開源是數字世界的路和橋,AI 則像是水和電。”
在 GOSIM HANGZHOU 2025 的現場,CSDN 創始人&董事長、GOSIM 發起人、奇點智能研究院理事長蔣濤作開場致辭,直言如今正是屬于開發者和開源的最好時代,并為所有開發者帶來了兩份重要報告的發布:
一、由奇點智能研究院出品、聯合國咨商開源創新專委會編制的《2025 全球開源發展報告(預覽版)》,全面衡量全球開源生態的發展格局。數據顯示,美國仍是開源生態的核心力量,中國則保持高速增長,目前擁有約 400 萬活躍開源開發者,總開發者數量達 1200 萬,穩居全球第二。在技術演進方向上,AI 大模型、云原生基礎設施、前端與交互技術,以及編程語言與開發工具鏈,正成為推動全球技術變革的四大核心驅動力。在高影響力開發者這一關鍵指標上,美國仍以絕對優勢位居第一。但中國表現亮眼:從 2016 年的 3 位高影響力開發者,躍升至 2025 年的 94 位,實現近 30 倍的增長,數量躋身全球第二梯隊,展現出中國在核心技術貢獻和國際開源話語權方面的快速崛起。
二、《大模型技術體系開源影響力榜單》。從數據、模型、系統和評測四個方面展開評估。模型榜單前十名主要由中美機構占據,其中 Meta、阿里巴巴和谷歌位列前三,DeepSeek 也表現出強勁影響力。在數據集方面,Ai2、上海人工智能實驗室和谷歌位居前列;系統層面,智源在算子庫、編譯器和生態建設上貢獻突出,Meta 和谷歌保持領先;評測環節,上海人工智能實驗室、Hugging Face 和北京智源人工智能研究院排名前三。綜合榜單則由 Meta、谷歌和北京智源人工智能研究院(BAAI)領跑。報告指出,大模型競爭的關鍵已不止于單一模型,而在于完整生態的打造。
蔣濤強調,希望未來有更多國家參與并受益于大模型開源生態,推動全球開源世界的持續繁榮。
![]()
蔣濤,CSDN 創始人&董事長、GOSIM 發起人、奇點智能研究院理事長
以下為演講實錄:
從 1991 年入行至今,我覺得現在是我們開發者以及開源最好的時代。CSDN 發展也非常快,我們現在有 5100 萬的注冊用戶,覆蓋了 95% 的中國開發者。同時我們也非常希望將中國的開源技術和全球的開源更好地連接起來,推動中國開源技術更好地融入全球生態,這也是我聯合 Michael Yuan(Second State 創始人)共同發起 的初衷。
我認為,開源是數字世界的路和橋,而 AI 是數字世界的水和電。我們由衷地希望以全球開源協作的方式來打造一個更好的數字世界。
今天,我將為大家帶來兩項重磅報告的發布,分別是《2025 全球開源發展報告(預覽版)》和 《大模型技術體系開源影響力榜單(OSIR-LMTS)》。
![]()
《2025 全球開源發展報告(預覽版)》:全面衡量全球開源生態的發展格局
首先是全球開源發展報告,由奇點智能研究院出品、聯合國咨商開源創新專委會編制。在我們開源界,Linux 之父 Linus Torvalds 有一句經典名言一直被奉為圭臬:“Talk is cheap, show me the code”。這份報告中的排行榜最大的特點就是采用公開、開放的數據,首次基于聯合國 ESG 可持續發展目標框架,構建全球開源發展的評估體系,并依托 OpenDigger 開源項目和 OpenRank 影響力指標體系,從活躍度、貢獻量、貢獻質量及協作影響力等多個維度,全面衡量全球開源生態的發展格局。
![]()
大家可以看到我們的 Metrics(指標體系)有非常多的指標。其中最主要還是來自于代碼倉上 Commit 的數量、PR 的數量等,但最重要的還是參考 PageRank(網頁排名)提出的一套“OpenRank”北極星指標體系,能夠基于整個開源社區的開發者活躍行為來衡量評價對象(包括項目、企業、開發者等)的影響力或貢獻度。
首先,從全球開源活躍地圖來看,截至 2025 年 7 月,全球開發者總量突破 1.5 億,過去十年在 GitHub 活躍的開源開發者數量達到了 2280 萬。在這之中,美國位居第一,且其開發者數量在過去有非常大的增長。而中國發展也很快,我們活躍的開源開發者超過了 400 萬(含 GitHub、GitCode 等平臺),總量則在 1200 萬以上,規模位居全球第二。
當前,全球開源生態呈現出持續擴張與區域格局多樣化演變趨勢。印度和中國的增長速度顯著,十年間印度達到 6 倍增長,中國達到 3 倍增長,巴西作為拉美地區代表,增幅超過 5 倍。在 OpenRank 貢獻度格局中,美國 2021 年達到最高點后逐年下降,中國貢獻度十年間大幅上升,其余國家則穩步增長。而在影響力格局中,美國始終保持領先,德國穩居歐洲第一,中國、印度快速上升,巴西與日本作為區域代表體現出全球區域共同發展態勢。
![]()
OpenRank 貢獻度格局 TOP 10 十年演進趨勢
![]()
OpenRank 影響力格局 TOP 10 十年演進趨勢
技術維度,GitHub 上的開源項目數已經超過了 4 億個代碼倉。我們能夠看到,2016 年全球活躍倉數為 193 萬,到 2025 年已經接近 600 萬,十年間實現了三倍多的增長,其中,AI 大模型、云基礎設施、前端與交互技術和編程語言與開發工具共同構成了引領技術變革的核心引擎。
人才維度,開源最重要的還是人才,我們也從數據中能夠觀察到——誰是開源界最有影響力的人物?他們的代碼被更多人去引用和使用。可以看到,美國依然持續領跑全球開源高影響力開發者,從 2016 年的 136 人增至 2025 年的 310 人,十年翻倍有余。中國則實現了跨越式的躍升,從 2016 年僅有 3 人飆升至現在的 94 人,增長超 30 倍,躋身 TOP3。而歐洲增長格局多年來則相對穩定,德國以 121 人位居全球第二。
![]()
全球開源人才地圖 TOP10 國家
總的來說,全球開源生態持續繁榮,美國還是領先全局,綜合實力最強,中國和印度在加速發展,貢獻度、影響力增速顯著,歐洲(以德法為代表)有非常深厚的基礎,而拉美、東南亞也開始在開源里有貢獻,就像十年前的中國一樣。
更進一步地分析全球各國行政區域劃分開發者 OpenRank 排行榜 TOP100,美國占有最多的活躍區域(25 個),德國(9 個)和法國(8 個)排在第二三名,中國(7 個)和印度(6 個)緊跟其后。TOP15 中,坐擁硅谷的加利福尼亞州位居第一,中國北京、上海分別位居 TOP11 和 TOP13。
再看企業方面,分析全球企業 OpenRank 排行榜 TOP100 也可以看到,中國企業在開源領域有著非常快速的進展,以 16 家僅次于美國(65 家),TOP15 中,華為位居全球第二,阿里巴巴位居 TOP8。
![]()
最后,一起來看全球技術領域影響力排行榜,在過去一年里,AI 大模型可以說是一騎絕塵,已經遠超于其后的云基礎設施、前端與交互式、編程語言、數據庫等。
![]()
而在全球開源項目影響力排名中,OpenHarmony 以絕對優勢位居第一,TOP100 中,中國有 9 個開源項目上榜,這也體現了中國開源從使用走向了貢獻。
![]()
整體而言,全球的開源生態都在呈現快速和多元的發展,不僅僅只有美國。歐洲也保持著非常強勁的影響力。
![]()
所有這些數據都在 OpenDigger(https://open-digger.cn/)的網站上,我們都把相應的算法、數據公開,歡迎大家一起參與共創。
![]()
《大模型技術體系開源影響力榜單》:數據揭示大模型技術生態演進
接著我們再看第二個榜單,圍繞大模型展開。當前,大模型正以前所未有的速度重塑技術格局,而開源是其核心驅動力。我們這次發布的《大模型技術體系開源影響力榜單 (OSIR-LMTS)》,旨在客觀評估大模型技術棧的綜合開源影響力。這份榜單不僅是對現有技術的梳理,也是對未來趨勢的預判,體現了我們對技術社區和產業發展的深刻洞察。
榜單主要由四個部分組成,分別是數據、模型、系統和評測。其他三個都很容易理解,而系統實際上是反映了生態,包括算子庫、并行訓練及推理框架等。整個 AI 開源不僅只是大模型,它需要的更多是系統性的生態服務,所以我們在這里特別增加了一個系統的榜單。這份榜單中所有的數據均來自公開可查的渠道,總共選取了全球范圍內頭部的 25 家公司作為代表,引用了總計 1529 個數據集、4410 個模型、719 個算子、58 個評測平臺、 13541 個鏈接,時間覆蓋 2025 年 1 至 8 月。這不僅是一份榜單,更是對大模型技術體系的整體性和多樣性的集中呈現。希望通過這份榜單,向大家展示全球領先企業在開源領域的深耕與貢獻,共同推動產業的繁榮發展。
![]()
首先是模型的排行榜單 TOP10,以中美機構為主。我們可以看到 Meta、阿里巴巴和 Google 分別位列前三,同樣起于杭州的 DeepSeek 也表現出非常強勁的影響力,整體呈現相對多元化的格局。
![]()
在模型下載量方面,向量模型(Vector models)占據了主導地位,下載比例最高(41.7%),其次是語言模型(Language models,31%)和多模態模型(Multimodal models,18.3%)。
具體來看,在向量模型中,UKP Lab 的模型下載量最高。而在語言模型領域,開源大模型生態的蓬勃發展和激烈競爭體現得淋漓盡致,Meta、阿里巴巴和 DeepSeek 在大模型下載量上占據了主導地位,但從下載趨勢上,我們可以看到阿里巴巴和 Meta 的數據有一個反轉,藍色的是阿里,橘色的是 Meta。阿里在今年 6 月發布了千問系列迎來了飛速增長,在隨后的幾個月時間里高歌猛進遠超了 Meta。而在這之中,作為超大參數模型,DeepSeek一直保持比較穩定的數據。阿里巴巴和 DeepSeek 的總部都在杭州,也有不少同學參加這次 GOSIM 大會,大家可以盡情交流。
![]()
在多模態模型方面,我們可以看到,OpenAI 的 CLIP 模型曾占據領先地位,但在7 月下載量出現大幅下滑。而阿里巴巴的 Qwen-2.5-VL 系列模型則展現出穩健的增長態勢,8 月的阿里巴巴的多模態模型下載量甚至超過了 Google。
![]()
從全球模型下載總量來看,Meta 因為 Llama 發布的時間早,所以它還是有非常大的影響力。而 UKP Lab、阿里巴巴以及北京智源人工智能研究院(BAAI)也表現不俗,開源大模型生態正在從過去單一模態向多元化發展。
接下來我們看一下數據榜單,數據對于模型的發展非常重要。大模型之所以有今天的發展,也是因為有互聯網公開的數據集。我們可以看到在這個榜單上,排在前三的是:第一個是 Ai2,它來自于美國西雅圖的艾倫人工智能研究所;第二是上海人工智能實驗室;還有谷歌。
![]()
智源、Meta、阿里巴巴等所有做模型有影響力的機構,都在數據的開放上也有很大的貢獻。不同的機構在數據集上有不同側重,Ai2 是比較全面的,NVIDIA 的數據集超過 80% 集中在具身智能領域,這與他們的硬件生態緊密相關,在今年的 GTC 上,黃仁勛宣布了眾多加速人形機器人開發的技術,高呼“通用機器人時代已經到來”,也充分說明了這是 NVIDIA 下一個階段重要的布局。而我們國內的智源(BAAI)是比較綜合性的,在語言、具身智能和多模態上都有大量優秀的數據開放。
![]()
綜合數據集的下載趨勢我們能夠發現,語言數據集在 1 月到 4 月間一直是下載的主力,純視覺數據集的下載比例呈現快速下降趨勢,具身數據集則增勢顯著,這充分表明,大模型數據生態正在從傳統的單一模態向更具挑戰性和應用前景的具身和多模態方向發展。
![]()
接下來我們再看系統,系統這個領域比較特別。剛才講到它對于 AI 大模型的生態貢獻特別重要。大家知道 CUDA 是在系統中最領先,但在開源領域,我們國內的智源在這里做了非常多的貢獻,Meta 和谷歌緊隨其后分列二三,國內百度、阿里、華為、上海人工智能實驗室也均名列 TOP10。
![]()
具體來看,在算子庫和并行訓練及推理框架方面,Meta 和谷歌優勢顯著。而在通信庫和開源 AI 編譯器方面,智源(BAAI)則表現突出。
![]()
最后是評測榜單,我們可以看到上海人工智能實驗室、Hugging Face、智源(BAAI)、智譜等均在其列,起于中國的 AI 學術機構,對于評測都投入了相當大的力量。
![]()
評測已成為推動大模型發展的關鍵環節。今年以來,開源評測數據集的數量一直在持續增長,其中上海人工智能實驗室在開源評測數據集和工具數量上處于領先地位,Hugging Face 在參與評測的模型數量上遙遙領先,智源則在評測榜單多樣性上表現突出。
![]()
看完模型、數據、系統和評測四大分榜單后,最后揭曉大模型開源影響力綜合榜單。Meta 憑借其 Llama 系列模型和 PyTorch 開源生態,在模型和系統維度表現出色,位居榜首。谷歌在數據、模型和系統等多個維度展現出均衡的實力,排名第二。智源(BAAI)表現出全面的影響力,尤其在多芯片支持的系統維度優勢顯著。
![]()
榜單所依據的“大模型技術體系開源影響力評估框架”也已在 GitHub、GitCode 開源,歡迎更多開發者及組織一起共建。
GitHub 地址: https://github.com/brucecui0120/OSIR-LMTS
GitCode 地址:https://gitcode.com/brucec/OSIR-LMTS
當然,模型是一個方面,更重要的是整個生態。由螞蟻集團出品、CSDN 參與共創的《大模型開源開發生態全景圖》其中也用數據和 OpenRank 進行了測量,主要是測量貢獻度和貢獻的資源。
![]()
2025 大模型開源開發生態全景圖(地址:https://antoss-landscape.my.canva.site/)
我們可以看到美國、中國在整個大模型的生態上處于前兩位(貢獻比例分別為 37.41%、18.72%)。我們也希望這個生態會更加豐富、繁榮,也有更多的國家、組織、開發者能夠從大模型生態里獲益。
謝謝大家。
注:親愛的讀者朋友,如果您對此演講非常感興趣,希望收獲完整 PPT 文件,可以訪問 GOSIM HANGZHOU 2025 官網一鍵下載。文件夾為「全體大會 Keynote.zip」,地址:https://hangzhou2025.gosim.org/zh/speaker-slides/
10 月 16-17 日,由 CSDN、奇點智能研究院聯合主辦的2025 全球機器學習技術大會將在北京威斯汀大酒店(亮馬橋)舉行。領銜嘉賓 Lukasz Kaiser 是著名的“Transformer 八子”中唯一一位加入 OpenAI、并且操刀 GPT-5、GPT-4、o1、o3、ChatGPT 等一系列前沿模型的核心人物。
還有前 OpenAI、前 DeepMind、Google、阿里、騰訊、百度、小紅書…..50+ 專家, 近 1000 位聽眾,覆蓋 LLM 多模態、智能體、開源模型及框架、具身智能、AI 編程、AI Infra 等 12 大主題,歡迎感興趣的朋友掃描下方二維碼報名,期待一起相聚共話開源與 AGI 新時代下的新思考、新實踐。
日程詳情可戳:《》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.