2025年已然過半,回望這風起云涌的半年,AI領域無疑仍是全球科技浪潮中最洶涌的波濤。如果說年初DeepSeek在全球范圍內的驚艷亮相,僅僅是拉開了序幕,那么隨之而來的Manus開啟通用AI Agent元年、百度、minimax、kimi等國內大模型廠商集體開源、騰訊元寶與字節豆包等AI應用強勢闖入全球榜單前十,則共同奏響了一曲雄渾的AI科技爆發交響曲。
一個不爭的事實,正清晰地浮現在我們眼前:長期以來由美國主導的AI技術霸權格局,正在被打破,一個多極化的AI新世界正加速到來。而在這場深刻的變革中,中國科技力量正以一種集體爆發的姿態,從追趕者、模仿者,逐漸轉變為創新者和引領者。
![]()
01
DeepSeek等模型,縮短中美AI技術代際差
曾幾何時,提及頂尖大模型,人們言必稱GPT、Claude。然而,2025年,以DeepSeek、MiniMax、通義千問等為代表的中國自研大模型,正以無可辯駁的實力,向世界證明,中美之間的技術代際差正在被顯著縮小。
年初,DeepSeek發布R1后迅速出圈,成為全球首個可運行百萬級Token推理任務的開源模型。無論在代碼生成、數學推理還是Agent構建上,DeepSeek R1都與GPT-4 Turbo能力相當,一舉打破“只有OpenAI能做最強模型”的行業迷信。
國內其他巨頭,如字節的豆包和阿里的通義千問也不甘示弱。6月份發布的豆包大模型 1.6,在復雜推理、競賽級數學、多輪對話和指令遵循等測試集中的表現躋身全球前列。在實際應用中,豆包能夠為用戶提供精準且豐富的信息,無論是學術問題的解答,還是創意寫作的輔助,都展現出了極高的專業水準。
阿里云的通義千問也憑借其強大的語言理解和生成能力,在眾多應用場景中大放異彩。比如,在智能客服領域,通義千問能夠快速理解客戶的問題,并給出準確且貼心的回答,極大地提高了客戶服務的效率和質量。
這些優秀的國產大模型,與 DeepSeek 一起,共同縮小了中美之間在 AI 技術上的代際差距,使得中國在全球 AI 競爭中占據了重要的一席之地。同時,它們還具備高效率推理、低成本部署的強大“工程落地能力”,從而更有效推動了AI從實驗室到生產線的落地應用。
02
國產開源大模型,大爆發
如果說模型能力的提升是“內力”,那么開源戰略就是一套“外功”。它以一種開放、自信的姿態,向全世界宣告了中國AI的雄心。2025年,除了年初的DeepSeek,其它一些大廠也開始扎堆響應,形成了蔚為壯觀的“開源運動”。
MiniMax-M1:全球首個開源大規模混合架構的推理模型,支持業內最高的 100 萬上下文輸入和最長 8 萬 Token 的推理輸出。采用閃電注意力機制為主的混合架構,計算效率高,還提出了更快的強化學習算法 CISPO。在軟件工程、長上下文與工具使用等復雜場景中優勢顯著,在 SWE - bench 驗證基準等測試中表現出色。
![]()
文心一言4.5:6月30日,百度正式開源文心大模型4.5系列模型,涵蓋47B、3B激活參數的混合專家(MoE)模型,與0.3B參數的稠密型模型等10款模型,并實現預訓練權重和推理代碼的完全開源。目前,文心大模型4.5開源系列已可在飛槳星河社區、HuggingFace等平臺下載部署使用,同時開源模型API服務也可在百度智能云千帆大模型平臺使用。
![]()
Kimi K2:這是Kimi最新開源的大模型,是萬億參數的 MoE 架構模型,支持 128K 上下文,SWE-bench Verified 得分 60.4%,刷新開源模型紀錄;具備較強的語言理解和生成能力,可應用于多種自然語言處理場景。
這些頭部玩家,相繼宣布將其核心模型開源。這絕非巧合,更多處于以下兩點考量:
1、開源是打破技術壁壘、對抗技術封鎖的最有力武器
當美國試圖通過硬件限制來遏制中國AI發展時,中國企業選擇將軟件和算法向全世界開放。通過開源,中國AI技術得以鏈接全球數以百萬計的開發者,迅速擴大影響力,形成一個龐大且充滿活力的生態系統。
2、開源能夠加速技術迭代和應用落地
鼓勵全球的開發者共同參與,不僅能幫助模型更快地發現和修復問題,促進技術迭代,還能催生出無數創新的應用場景。這是一種集眾智、匯眾力的發展模式,能夠讓技術成果以最快的速度轉化為生產力。
這場集體開源浪潮,是中國AI力量從“技術自信”走向“生態自信”的關鍵一步。它所構建的,不僅僅是模型本身,更是一個開放、協作、共贏的全球開發者社區,這是任何技術封鎖都無法阻斷的。
03
多模態大模型,引領全球
如果說文本模型是AI的大腦,那么多模態能力就是AI的眼睛、耳朵和嘴巴。在2025年,中國AI在多模態領域同樣取得了舉世矚目的成就,甚至在多個細分賽道實現了全球領先。
1、多模態模型:
1)音樂推理的開創者:
昆侖萬維發布的Mureka 01,是全球首個音樂推理大模型。它獨創性地將CoT(思維鏈)技術引入音樂生成,讓AI在創作音樂前,能像人類作曲家一樣先進行構思和規劃。這一創新,直接將AI音樂創作提升到了新的高度。
![]()
2)視頻與語音的王者:
MiniMax的Hailuo 02視頻模型,在Artificial Analysis Video Arena上早期版本便已位列全球第二,其正式版更是憑借卓越的性價比傲視群雄。官方數據顯示,同樣花費1萬元,Hailuo 02能生成的1080p視頻時長,是OpenAI Sora的16倍以上,是谷歌Veo3的8.5倍。其語音模型Speech-02-HD,更是在Artificial Analysis Speech Arena榜單上力壓OpenAI,排名全球第一。
![]()
3)通義千問Qwen3的全能進化:
阿里巴巴最新的Qwen3系列,是其多模態能力的集大成者。它不僅在傳統的文本能力上持續精進,更在視覺理解方面表現卓越,能夠精準識別和理解圖像、圖表中的復雜信息,在MMBench等多個權威視覺語言評測中名列前茅。Qwen3的發布,意味著中國的旗艦級大模型,已經向真正意義上的全模態邁出了關鍵一步。
4)實時交互的革新者:
智譜AI的GLM-Realtime,是行業首個端到端實時多模態模型。它賦予了AI近乎實時的視頻理解與語音交互能力,能看、能聽、能說、能記憶,甚至還能清唱。當它與智能眼鏡結合,AI便成了你身邊一位“看得見世界”且學識淵博的朋友,這為具身智能的發展打開了全新的想象空間。
2、驚艷全球的AI視頻產品:
在模型能力之上,中國AI視頻產品也實現了現象級的爆發。快手的可靈、字節的即夢AI,憑借其電影級的生成質感、對物理世界精準理解的頻生成能力,在發布之初便火爆全球社交媒體,讓無數海外用戶和從業者驚呼“Incredible”。
可靈:快手推出的可靈視頻生成模型,在發布之初便被譽為Sora的最強挑戰者。它具備生成長達2分鐘、1080p分辨率的視頻能力,這在當時是開源和API可用模型中的最高水準。更令人驚嘆的是,可靈對真實物理世界的模擬達到了驚人的程度,能夠生成符合運動規律的大幅度動作,并保持角色在時空中的一致性,這解決了許多視頻生成模型“人物瞬移”、“肢體錯亂”的頑疾。
即夢AI:字節跳動旗下的即夢AI,則在視頻的“電影感”和“藝術性”實現了很大突破。它不僅能生成高質量的寫實或奇幻風格視頻,更展現出對光影、構圖和鏡頭語言的深刻理解。尤其值得一提的是,即夢AI對中國文化元素的理解和呈現能力非常出色,能夠生成富有東方美學的場景和人物,這讓它在全球化的AI視頻產品中形成了獨特的文化辨識度。
從音樂、語音到視頻,從底層模型到上層應用,中國AI在多模態領域的全面開花,標志著其創新能力已經深入到AI技術的核心地帶。
04
AI辦公,企業全面提效利器
技術最終的價值,在于應用。當強大的AI模型能力被注入辦公軟件,一場波瀾壯闊的效率革命也開始在中國數以億計的職場人中展開。
1、訊飛智文
依托科大訊飛深厚的AI技術積累,在 AI辦公領域,訊飛智文展現出了強大的實力。它憑借其先進的自然語言處理技術,為用戶提供了智能化的寫作和文檔處理解決方案。在撰寫商務報告時,訊飛智文能夠根據用戶提供的關鍵信息和要求,快速生成報告大綱,并自動填充相關的數據和案例,極大地提高了寫作效率。
訊飛智文還是PPT生成神器。用戶不僅可以輸入文字指令,還能直接扔進一篇文檔、一段錄音甚至一段視頻,智文能夠智能提煉核心內容,快速生成結構完整、圖文并茂的PPT。
2、WPS AI
WPS AI四大AI辦公助手優先考慮用戶的掌控感和信任感,提供新一代的“單人和AI協作工作流程”。
以WPS AI寫作助手的“AI伴寫”為例,它基于AI Agent(AI智能體)驅動。用戶無需撰寫提示詞,AI伴寫根據用戶輸入的內容,自動理解用戶前文的意圖、行文邏輯,實時地提供后文續寫建議。
AI閱讀助手調優了問答模型,升級對文檔的解析、總結、問答效果,例如讓AI閱讀一篇PDF格式的學術文章,可在窗口中給出關鍵詞、摘要和正文內容的總結,以及研究結論、研究方法等。AI數據助手可在表格中完成海量數據的AI計算、分析和歸類,用戶以自然語言提出需求,AI可轉換寫出相應代碼,并在表格中執行。AI設計助手可快速完成排版、設計風格和圖片處理等方面的工作,例如PPT風格克隆,一鍵完成文檔排版,讓每一篇文檔都清晰規范。
針對企業場景,WPS AI企業版推出AI Hub(智能基座)、AI Docs(智能文檔庫)和Copilot Pro(企業智慧助理),讓企業實現大模型的開箱即用。
3、釘釘文檔
釘釘全新發布「AI 表格」面向 AI 時代打造新應用的入口。在釘釘 AI 表格里,AI 已成為原生能力,每一個單元格都是 AI 的入口,也是一個智能工作流。
![]()
所有企業、用戶都可以基于釘釘 AI 表格構建自己的業務系統,批量處理任務,讓業務數據真正流動并產生價值。
同時,釘釘 AI 表格創新推出“表格即文檔”功能,首次將文檔融入數據表。這意味著,表格每一行記錄都是一個獨立的文檔,用戶可以像平時寫文檔一樣自由輸入,查看信息也一目了然,進一步拓展了 AI 表格的應用場景。
4、百度文庫
2023年,百度文庫依托文心大模型進行了全面的“AI重構”,進化為“一站式AI內容獲取和創作平臺”,將應用場景拓展到了學習辦公、家庭教育、兼職賺錢領域,推出智能PPT、智能文檔、行業研究報告、AI全網搜索、智能有聲畫本、智能小說、智能漫畫、智能海報、拍圖生文等上百項AI能力。
目前,百度文庫突破4000萬付費用戶,在文庫重構后,截止2024年12月,文庫的AI MAU已經達到9400萬,文庫AI DAU年同比增長了230%,付費率提升了60%。可以說是大模型To C最先實現商業化的應用。智能PPT市場份額已超八成。根據“AI產品榜”,百度文庫AI功能蟬聯4月、5月、6月國內總榜第一名,達成「三連冠」。證明其飛速迭代創新的AI功能,已深受用戶喜愛和好評。
![]()
百度世界2024上,百度文庫與百度網盤聯合發布AI創作新物種“自由畫布”,是行業首創的內容操作系統,打通了公域與授權的個人內容,通過“一拖一圈”的極簡操作,實現對多格式、全模態文件的混合理解、生成、創作,并支持對富媒體文檔的一鍵分享和存儲,為用戶提供“創作、編輯、存儲、管理、查找、觀看、使用、分享”的一站式服務,覆蓋從內容生產的起點,到內容消費的終點的全流程。

百度文庫作為智能生產力的代表,是行業真正、唯一能做到:智能生產力一站式、All in One的平臺。
回看2025年上半場,中國AI產業的集體爆發,并非偶然。它是在技術封鎖的壓力下,迸發出的強大創新活力;是在激烈的市場競爭中,磨礪出的敏銳產品嗅覺;是在龐大的人口和市場基礎上,生長出的旺盛應用生態。雖然現在談論美國“AI霸權”終結,或許為時尚早,但“霸權正在崩塌”卻是一個清晰可見的趨勢。世界AI的牌桌上,已經迎來了實力強勁的中國玩家。他們不僅堅定地坐上桌上,而且已經深度影響牌局的走向。向他們致敬!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.