喂不飽的“龍蝦”:Token爆炸時代的算力困局
被黃仁勛盛贊為“有史以來最重要的軟件發布”——Open Claw(龍蝦)短短 60 天內在Github上斬獲了超過24 萬的星標數,其增長速度已經“碾壓”了擁有十幾年歷史的 Linux。
它所代表的,是一種能夠精準理解目標、具備長期記憶、調用工具并持續執行任務的AI助手,這讓人很難不心動。
但等到你真正開始使用這些自主Agent 時,很快就會發現一個問題:AI Agent的一次復雜任務就需要調用模型上百次,Token消耗會是普通對話的數百倍!有開發者在社區分享過自己的使用體驗:每個月在Agent任務上花費的Token費用達到上千美元。甚至有土豪玩家一天消耗的Token就有10個億!
今年的GTC 2026上,黃仁勛直言:AI基礎設施的本質,正在從“數據中心”轉向“Token工廠”,推理計算需求會在未來短短兩年內增長近百萬倍。
巨頭們早就注意到了未來的走勢,微軟、亞馬遜、谷歌和 Meta 四家科技巨頭在 2026 年的資本支出計劃超過 2,800 億美元。 并搶空了到2027年的配電額度。但是,僅僅是對算力能級上“大力出奇跡”,真的能夠解決用戶在使用場景中遇到的痛點嗎?
GoodVision AI給出了不一樣的解法:算力智能調度 + 邊緣算力部署。
算力擠兌,“大算力”是最優解嗎?
GoodVision AI 的CEO David 在云計算領域深耕多年,積累了跨越多家全球頭部云廠商的豐富經驗。他曾任 IBM 合伙人、AWS 高級管理層成員,同時也是阿里云創始團隊成員之一,并擔任騰訊云北美負責人。在 AWS 早期發展階段,他深度參與區域業務建設,推動其從零起步擴展至數億美元規模。
頻繁與云計算行業打交道的他早早地就意識到:應用需求的增長速度往往遠遠快于算力基礎設施的建設速度。正是這種結構性的供需錯配,讓他看到了新的機會,也成為他在 2019 年創立 GoodVision AI 的重要動機之一。
隨著大模型和AI應用的快速普及,他的觀點不斷地得到了驗證。公司內部數據顯示,在過去幾年AI需求快速增長的背景下,GoodVision AI 的AI業務收入也進入快速增長階段:2025年公司AI相關業務營收已達到近千萬美元,并保持超過100%的年增長率。隨著AI Factory和算力基礎設施逐步落地,預計2027年公司整體AI業務收入預計達到數億美元的規模,進入新的增長階段。
過去幾年,當OpenAI把大模型真正帶到臺前來時,行業討論 AI 時幾乎所有問題都圍繞“訓練算力”展開。但在那時David認為,真正的變化正在發生在推理側——模型只需要訓練一次,但推理會發生數十億次。當 AI Agent 和各類應用被數百萬用戶同時調用時,推理需求就會分布在全球不同地區、設備與網絡環境中。
而現有的云計算體系并不是為這種需求結構設計的。那么當算力需求爆發,AI 推理需求暴增而算力供給跟不上時,就會出現延遲變高、成本飆升,甚至“已讀亂回”的問題。
所以David認為AI算力體系也應該逐漸走向類似的結構。大型云端模型適合處理復雜、高價值的任務;而大量簡單、實時、頻繁的推理需求,則更適合在本地或邊緣側完成。通過智能調度系統,讓不同復雜度的任務被分配到最合適的算力資源上,才能避免所有請求都涌向遠端巨型數據中心,從而導致算力擁堵和成本失控。
解決AI算力供需的關鍵在于分發
如果把今天的AI算力產業簡單劃分,大致可以看到幾種不同的模式:
首先就是微軟,亞馬遜,谷歌幾大巨頭。他們也被稱為“Hyperscalers”(超大規模云服務商,他們的主要業務主要是IAAS(Infrastructure as an Service 基礎設施即服務)面向通用需求,
一類則以CoreWeave 和Lambda為代表的GPU云基礎設施公司。這類公司主要為AI訓練和推理提供算力資源,本質上類似新一代的GPU云服務。
另一類則是像FireworksAI和OpenRouter這樣的模型服務平臺。它們為開發者提供統一接口,讓用戶可以在不同大模型之間切換和調用。
傳統大型云廠商過于依賴中心化數據中心;雖然算力資源池大,但遇到需要遠端需求和計算資源調度的情景下可能低效。后兩類公司的出現則是為了填補前者夠不到的市場空白,即算力供給大模型路由
但他們也有各自的弱點:API 路由平臺缺乏算力控制權,GPU 租賃平臺缺乏調度能力。而伴隨AI Agent應用的興起,行業開始出現新的需求。Agent任務通常包含多個步驟,需要調用不同模型、執行不同類型的計算,并且對響應速度和成本都有要求。如果所有推理任務都集中在遠程云數據中心,延遲和成本都會迅速增加。
解決此類問題的核心關鍵不僅僅只是配置“更大更多的算力”,更需要智能的算力分發網絡進行算力的智能調度;而這也正是GoodVision AI正在做的事情。
算力分發網絡:Good Vision AI 的“AI CDN”路徑
在互聯網早期,網站訪問主要集中在少數服務器上。隨著用戶規模擴大,CDN網絡逐漸出現,將內容緩存到全球各地的節點,讓數據更接近用戶。在AI時代,類似的結構也可能出現。當AI Agent開始大規模運行時,算力需求將分布在全球不同節點。推理任務需要在不同云環境、不同數據中心甚至邊緣設備之間進行調度。
如果說算力供需失衡是 AI 時代正在出現的核心矛盾,那么解決這一問題的關鍵就不只是“生產更多算力”,而是重新思考算力如何被分發。黃仁勛在GTC 2026中也提到,未來AI系統的核心指標不再是算力規模,而是單位功耗下的Token產出、吞吐效率與響應速度,這也重新定義了“Token工廠”的競爭力。Good Vision AI 正是基于這一思路構建自身的技術體系。
在Good Vision AI內部,這套架構被稱為 AI Factory:它不僅包括 GPU 算力資源本身,還包括一整套全球的推理算力節點網絡和智能調度系統,用于在不同環境之間分配 AI 計算任務。
在這一架構中,Good Vision AI自研了一款AI Agent進行智慧大腦層級的調度,并提供現有模式的AI Token聚合器能力,利用自有的物理算力與可部署的私有化模型庫,提升算力資源利用。其中一個關鍵技術即Token 級算力調度。與傳統以“模型”為單位的調用方式不同,Token 級調度可以根據任務復雜度、成本要求和延遲需求,在不同模型和算力資源之間進行更細粒度的動態分配。它能夠在 AWS、GCP 等公有云以及私有機房之間進行動態調度,根據任務需求自動選擇最合適的算力節點。同時Good Vision AI具備可控的AI算力資源,在確保在Token供給的穩定同時,能夠爭取到市場銷售的定價權和最大化利潤。
與此同時,GVAI 也在推進邊緣算力節點的部署。當 AI Agent 開始進入更多終端設備與現實場景時,一部分推理任務并不適合始終依賴遠端云端完成,將算力節點部署在更靠近用戶的位置,可以顯著降低延遲并提升響應速度。這種CDN 網絡相似的架構邏輯解決了調度系統能夠直接把算力“送到”發起AI推理意圖的用戶身邊
自有AI算力擴張的速度優勢
在 AI 算力競爭日益激烈的背景下,“誰能更快接入電力和算力基礎設施”,正在成為決定勝負的關鍵。Good Vision AI和其他同類型產品最大的不同,即團隊在早期便積累了大量的能源基礎設施資源
自2025年起,GoodVision AI 已經開始從亞洲為起點,乃至全球,布局自己的推理算力基礎設施。其中,日本、韓國與美國被視為最重要的區域節點之一。公司在這些地區已經儲備超過400MW 的電力資源,并計劃逐步部署規模化的AI推理算力中心。按照規劃,未來整體算力網絡將具備40萬張推理GPU卡的部署能力,對應推理算力資產規模可達到數十億美元級別。這些算力節點將與公司的智能調度系統共同構成一個分布式算力網絡。
未來愿景:當每座城市都有自己的 AI Factory
毫無疑問,隨著 AI Agent 逐漸進入日常工作流,算力需求將迎來爆發式增長。這些需求本質上來自持續不斷的推理任務——它們分布在企業系統、個人設備乃至城市基礎設施中,對實時性與穩定性提出更高要求。
與之對應的,則是AI基礎設施也會逐漸演化為由全球算力節點構成的網絡,使計算資源能夠像互聯網數據一樣被動態調度。這正是 GoodVision AI 提出的 AI Factory 構想:為本地與區域AI應用提供推理能力。每一個 AI Factory 都可以理解為一個小型AI生產中心,既服務本地企業與開發者,也接入全球算力網絡進行協同調度。
與傳統大型數據中心不同,這些 AI Factory 更接近用戶側,可在城市級節點完成大量實時推理任務,從而顯著降低延遲并提升算力利用效率。在已落地案例中,客戶遷移至 GoodVision AI Factory 后,整體成本降低約60%,延遲降低約50%,平臺毛利率提升約50%。
目前,Good Vision AI已經開始與視頻生成、生物醫藥等高算力消耗領域的相關企業展開合作。對這些行業而言,真正的問題不在于模型能力,而是持續增長的推理需求、Token 消耗與算力供給之間的匹配效率。例如視頻生成中海量的圖像與視頻推理請求;和AI制藥體系中,從分子結構生成、蛋白質折疊預測,到藥物篩選、臨床試驗模擬;每一個環節都依賴大規模計算,其背后都需要穩定、低延遲且可持續擴展的推理算力支持。隨著這些高精尖行業,尤其是生物醫藥對 AI 的依賴不斷加深,它們也會持續成為 Good Vision AI 算力網絡的重要客戶與增長來源。
當越來越多城市擁有自己的 AI Factory,算力將不再只是少數科技公司的資源,而會逐漸成為類似電力與網絡的基礎設施。個人開發者乃至普通用戶,也能按需調用Agent完成創作、開發與自動化任務。AI的真正普及,將建立在這樣一張分布式算力網絡之上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.