當豆包大模型的日調用量悄無聲息地跨過50萬億tokens大關時,很多人還沒意識到,這串數字背后是一場靜默的“電力”革命。算力,這個AI世界的“電能”,其生產與消耗的方式正在被徹底重構。
![]()
在不久前的雪球嘉年華上,云天勵飛董事長兼CEO陳寧的分享,點破了這場變革的核心:我們正從打造“發電廠”(訓練)的時代,快步跑入經營“電網”(推理)的時代[citation]。他認為,2025年這個所謂“AI應用爆發元年”,真正的里程碑是智能體(Agent)從展示柜走向生產線,而這直接引爆了百倍于以往的推理算力需求。
推理:一個“精打細算”的新賽場
過去的AI競賽,充滿了英雄主義式的比拼——堆參數、拼制程、刷榜單,目標是在實驗室里鍛造出最強大的“大腦”。這就像不計成本地研發一輛極限速度最快的F1賽車。英偉達憑借CUDA生態,成為了這個賽道上無可爭議的“引擎供應商”。
但智能體時代的需求變了。當AI要像“數字員工”一樣,為成千上萬人同時處理寫郵件、做分析、調數據這些日常任務時,關鍵就不再是單次回答能多炫酷,而是能否持續、穩定、便宜地提供服務。這更像是運營一個龐大的網約車車隊,客戶不在乎你的車極速有多高,只關心每公里成本是否足夠低、叫車響應是否足夠快。
“訓練追求極致性能,而推理要商業化,必須講求市場經濟,追求極高的性價比。”陳寧的這句話,道破了算力產業重心遷移的商業本質。也正是這個轉折,為中國芯片產業撕開了一道難得的口子。
![]()
中國的“愛迪生”時刻?
在訓練賽道上追趕,我們不得不面對先進制程受限和CUDA生態高墻的現實,差距是客觀存在的。然而,推理賽道呈現的是另一番景象。全球都剛起步,游戲規則從“拼絕對性能”轉向了“拼系統工程優化能力”——如何在真實的成本、功耗約束下,把算力效率榨取到極致。
這恰恰是中國產業所擅長的領域。我們擅長在給定的框架內,通過架構創新、工程優化和完整的供應鏈協作,做出最具性價比的產品。事實上,市場已經給出了信號:谷歌明確“訓推分離”,博通為科技巨頭定制推理芯片,都預示著一個獨立而龐大的推理芯片市場正在崛起。
機會窗口或許已經打開。一些國內企業不再盲目跟隨“堆算力”的舊敘事,而是開始圍繞推理的真實負載設計芯片。例如,中國電信研究院與北京大學合作,通過算法和架構的協同創新,成功將某些大模型的硬件部署成本降低了超過80%。這正是一種典型的、在推理賽道上“精打細算”的突圍思路。
降本之戰:從“一分錢”的目標到千倍的壓力
成本,是橫在AI規模化面前最現實的一座山。陳寧提出了一個清晰的目標:要在較短時間內,把“百萬token”的推理綜合成本打到“一分錢”級別。這聽起來像個技術宣言,但其背后是嚴峻的產業壓力。
我們可以簡單算一筆賬:如果豆包大模型日均50萬億token的處理量不再增長,其所需的資本和運營開支已是天文數字;而若規模繼續攀升,明年的計算量可能觸及百萬億級。屆時,對電力、散熱等基礎設施的需求,可能會出現令人咋舌的“千倍級”躍遷。不把單位成本降下來,AI的應用爆發根本無從談起。
這場降本攻堅戰中,單純的硬件“軍備競賽”效果有限。真正的突破點在于 “架構革命” 。陳寧介紹了云天勵飛提出的GPNPU架構思路,其核心不是模仿,而是取舍——在兼容主流開發生態的同時,針對推理任務中“預填充”和“解碼”等不同階段對算力、帶寬的差異化需求,進行軟硬件一體的深度優化。目標是在計算、存儲和帶寬之間找到最佳配比,從系統層面降低用戶的總體擁有成本。
![]()
尾聲:一場關于“現實感”的競賽
說到底,AI產業正在經歷一場從“技術理想”走向“商業現實”的深刻轉變。國家層面的藍圖已經繪就,到2027年,AI智能體在重點領域的滲透率要超過70%。實現這個目標,靠的不是實驗室里的benchmark(性能基準測試)冠軍,而是能在工廠、辦公室、家庭里穩定工作,且賬單不會讓人窒息的“實干家”。
推理芯片的賽道,比的正是這種賦予AI以“現實感”的能力。在這里,中國公司第一次與全球競爭者站在了相近的起跑線上。這場競賽的終局,或許不是誕生一個替代英偉達的單一巨頭,而是成長起一批能在政務、金融、工業等“糧食產區”深耕,提供穩定、可靠、劃算算力服務的新力量。
當智能體開始真正接管我們的一部分工作,或許我們不會記得驅動它的芯片型號,但整個社會運轉效率的提升和成本的降低,會成為這場“算力范式遷移”最有力的注腳。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.