全國兩會期間,全國人大代表、科大訊飛董事長劉慶峰再次圍繞人工智能的“自主可控”提出建議。從2023年算起,這已經是他連續第四年在兩會提出,要把中國的大模型能力真正建立在國產算力和自主生態之上。
![]()
(劉慶峰)
在今天這個時間點,關注這個議題的人似乎并不多。去年年初,DeepSeek-R1橫空出世,沒有人再懷疑中國大模型的算法能力。上個月,根據OpenRouter的統計,全球用戶輸入中國大模型的Token量占比超六成,居全球首位。而在算力領域,盡管芯片制程、軟件生態與國外龍頭仍有差距,但國內企業正憑借制程混搭、集群架構等技術奮起直追,不少相關企業在最近密集上市,突顯了市場信心。
今年年初,國內模型公司爭相發紅包、送奶茶吸引用戶,“小龍蝦”OpenClaw爆火出圈。聚光燈兜兜轉轉,再次聚焦在AI應用上。誰能發現場景、誰能快速落地乃至變現,構成了目前國內AI產業最熱鬧的敘事。
但恰恰是在這個時候,“自主可控”反而不應被視作可有可無的標簽,而是必須回答的底層問題。
大模型已經不只是一個互聯網產品,不只是聊天機器人和辦公助手。它越來越像電力和交通,正在成為經濟的新基礎設施,逐漸融入金融、教育、醫療、政務、能源、工業等重要場景。而基礎設施的重要原則,是關鍵時刻不能斷、長期演進可掌握、產業收益可沉淀。
![]()
(安徽金寨古碑鎮中心衛生院,“智醫助理”是醫生的AI同事)
因此,在國際局勢變化的今天,依托國產算力訓練大模型、建立從軟件到硬件的AI生態,依然是中國AI產業繞不過去的一場硬仗。
是誰在訓練AI?
今年2月,科大訊飛正式發布基于全國產算力訓練的星火X2大模型,實現了對前代星火模型的升級迭代,整體能力對標國際頂尖模型水平,在數學、推理、語言理解、智能體等能力上媲美國際最優,還具備130+多語言能力。
在高性能模型頻出的今天,這條新聞顯得“平平無奇”。然而,其中提到的“基于全國產算力訓練”,正是AI邁向自主可控的關鍵一步。實際上,訊飛星火是少數幾個完全依托國產算力訓練的模型,也是其中唯一一個向大眾免費開放使用的。
對于AI大模型來說,計算機運行產生的算力主要用作推理和訓練兩種用途。簡單說,推理是讓大模型能夠運行起來,根據輸入內容回答問題、生成文本、識別圖像。訓練則是讓模型真正“長腦子”的過程:通過海量數據和反復計算,把參數一點點調整出來,最終形成模型能力的底座。
如果把大模型比作一名醫生,推理如同日常坐診,訓練則是從醫學院到住院醫師的完整培養過程。醫生會看病當然重要,但更關鍵的是,這個醫生是誰培養出來的、接受了什么知識體系、是否能持續進修升級。對國家和產業來說,真正決定話語權的,恰恰是后者。
過去幾年,中國國產AI芯片更多活躍在推理側。推理對時延、成本和能效更敏感,但對單次極限吞吐、超大規模分布式通信的要求,相比訓練要低得多。為了在政務、金融、安防、工業等場景里實現大模型的落地部署,推理算力首先實現了快速發展。
但訓練不一樣,它是AI算力金字塔的頂端,要求的不只是單卡算力,還包括高帶寬顯存、穩定的互聯通信、萬卡級集群調度能力、軟件框架兼容度,以及長達數周甚至數月不中斷運行的工程能力。這些技術被英偉達等少數企業所掌握。
更貴、更難的路
真正決定一個國家AI上限的,不光有沒有能部署的模型,也不僅是有沒有能夠運行這些模型的設備,更在于能否在自己的基礎設施上,把下一代模型持續訓練出來。只有能夠用國產算力做訓練,才意味著掌握了AI的演化能力。
劉慶峰在一次采訪中透露,基于國產算力訓練的模型大概要落后頂尖模型半年到一年。由于尚未形成規模效應,國產算力的價格也往往更高。如果像訊飛這樣自研算力平臺,還意味著不菲的研發投入。
目前國內的高性能模型大多都是使用國外算力設備訓練的。若要重新適配國產芯片,相當于給車更換發動機。不僅要作出其它結構的調整,還可能面臨性能無法發揮或下降的風險。
國外的訓練方案更成熟、性能更強、生態更完整,這到目前為止都是事實。那么為什么還要用相對落后、成本相對更高的國產算力訓練大模型?
這個問題如果只放在一家公司里來看,確實不好回答。但如果放到國家和產業演進的尺度上,就不難理解。
航空發動機、高鐵、北斗導航、工業母機、光刻工藝,這些重大工程在早期幾乎都面臨同樣的質疑:貴、慢、不成熟、商業上不劃算。可它們之所以仍值得做,不是因為一開始就比國際最優更便宜,而是因為它們決定了一個國家在關鍵節點上有沒有自主運轉能力,決定了長期產業紅利是否留在本土。
發展經濟學中有一個被稱為“依附理論”的經典視角。后發國家如果長期嵌入由中心國家定義的技術體系,就容易陷入高端能力外部化、利潤與標準外流、本土創新受制于人的狀態。
這個框架未必能完整解釋今天的科技競爭,但它對AI產業有很強的現實提醒意義——如果一個國家的大模型訓練長期依賴外部算力、外部基礎軟件和外部開發生態,那么它在產業鏈中獲得的,很可能只是應用層的局部繁榮。
如果底層模型能力和訓練平臺都依賴外部,國內企業即使做出大量應用,也可能在利潤、議價權和迭代節奏上受制于上游算力平臺。相反,誰掌握訓練平臺、基礎模型和算力底座,誰才更可能在產業鏈中占據高附加值環節。
從風險的角度來說,一旦出口管制升級、云服務受限、關鍵軟件棧斷供,整個生態會在最底層出現脆弱性。那時受影響的不是某個模型版本延遲上線,而是教育、醫療、政務、工業、金融等一系列正在被AI重塑的行業能力,都會暴露在不可控風險之下。
底層投入也是對技術未來的投入。雖然目前Transformer架構仍是大模型的主流,但技術正在不停發展,量子、生物計算等領域已經為AI算法提供了新的思路。如果無法穩定開展本土訓練,那么它就很難主導下一代模型的能力邊界,只能在別人定義的技術路徑上做應用適配。
國產算力訓練迎來戰略機遇
這場討論之所以在今年格外重要,是因為國產算力訓練也正在迎來戰略機遇期。
根據國投證券發布的研報,今年海外云廠商資本開支已進入新一輪上行周期,其算力迭代節奏同步拉動了全球設備需求,我國算力資本市場利好。美國對華芯片管制不斷升級,從硬件延伸至軟件、人才乃至云服務,形成全鏈條封鎖,反而倒逼國內形成以“自主可控”為核心的政策與產業共識。
在這些需求的牽引下,今年不僅算力供給側在技術與生態上實現了諸多突破,越來越多從訓練到算法都是純國產的模型也開始涌現出來,如訊飛的星火X2,智譜聯合華為開源的新一代圖像生成模型GLM-Image,摩爾線程與北京智源人工智能研究院完成的具身大腦模型RoboBrain 2.5等。
僅僅依靠外部制裁的“倒逼”,并不足以催生一個成功的自主產業。歷史上,許多抱有雄心壯志的國家在技術封鎖下并未能建立起強大的自主體系,如20世紀的阿根廷與巴西。國家與企業的長期戰略意志、規劃與信心,是必不可少的。
在“十五五”規劃草案中,算力發展已經被升至國家戰略。東數西算、算力互聯互通行動計劃等國家級工程推出,截至2024年6月底,東數西算八大樞紐節點直接投資超435億元,機架總規模超195萬架。國家算力“版圖”正在形成,東部省市聚焦生態構建與應用,西部省市依托綠電承接算力轉移。北京2025年智算供給規模達45 EFLOPS,上海2027年自主可控算力占比超70%。
AI產業與航空航天、高鐵等產業的一項關鍵不同之處,在于目前所有國家都還正在開發它的能力,都需要開發者生態的支持,都需要市場的檢驗。因此,自主可控不是為了做一個封閉、昂貴、脫離市場的替代品,不是從敘事上用民族情懷替代商業邏輯,而是要在真實業務場景中證明能用、好用、持續可用,也要接受國內乃至全球開發者的檢驗。
憑借模型算法的輕量化技術和架構創新,很多國產模型已經能做到在保持高性能的同時大幅降低訓練與推理的算力負擔。一些模型已經進入持續迭代和產品化階段,如訊飛星火X2已在醫療、教育、汽車座艙、企業智能體等場景中廣泛部署,醫療應用“訊飛曉醫”也累積完成超1.8億次健康咨詢,以它為基礎的星火教育大模型在批改、錯因分析等核心教學領域的表現,顯著優于GPT-5.2、DeepSeek-V3.2等主流模型。
有媒體將今年稱作“中國算力訓練元年”,這還只是開始。它們未必意味著中國已經在算力競賽中看到曙光,卻至少說明我們還沒有放棄爭奪那張最關鍵的入場券。
“從社會剛需出發,讓人工智能解決真問題,推動社會進步。”劉慶峰說,“人工智能企業是要有家國情懷的,一定要把源頭技術構建在自主可控的平臺上,成為國家可以借助和使用的力量,這是時代賦予我們的使命。”而“在人工智能如此蓬勃發展的今天,世界比以往任何時候都更需要在美國之外擁有人工智能的‘第二種選擇’,中國也比以往任何時候都更需要在完全自主可控的平臺上發展人工智能,才能真正把發展主動權握在自己手中!”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.