
AI Coding 演化進行時。
作者 | 董超
責編 | Echo Tang
出品丨AI 科技大本營(ID:rgznai100)
過去三年里,AI 編碼從“補一句代碼”躍遷為“承包一次變更”。Coding 可能是第一個找到所謂 PMF 的方向…如今 AI Coding 已經進入下半場,Coding 到底是 AGI 的子集還是新路徑,我們一起略窺一二。
![]()
三年演進:范式落地 → 開源上位 →
執行力為王
2023:范式落地,“可執行代理”苗頭已現
如果要給 2023 下一個極簡注解,那就是:范式被大型平臺坐實,開源在邊緣地帶萌芽。前者不難理解——Copilot 與 ChatGPT 把“人寫—AI 輔”的協作方式帶進了日常;后者更值得留心:初創公司和個人開發者開始探索“不僅會說,還要能做”。我們能在當年的兩個方向上嗅到這種味道:
IDE/多端一體化:Continue 以開源擴展與 CLI 同步推進,讓“對話、補全、結構化編輯、Agent 工作流”在 VS Code / JetBrains / 終端間貫通,初步具備“把建議落成動作”的骨架。
本地可執行:Open-Interpreter 把“和模型對話→讓它在本機跑腳本/代碼”的路徑公開化,終端里一條命令就能進入循環試錯。
它們還不是“產業級代理”,卻清晰地為次年的開源 Code Agent 熱身:從“能聊代碼”邁向“能動手”。
2024:Coding Agent 上位,社區百花齊放
來到 2024,Coding Agent 從舞臺邊側走到中央,形成兩股彼此強化的潮流。
第一股:可執行的 Coding Agent ,開始對真實倉庫交付。
OpenHands(原名:OpenDevin),直言“面向軟件開發的 AI 代理平臺”,強調從計劃→調工具→編輯代碼→跑命令/測試→產出 PR 的一條龍閉環,且在項目文檔中明確“formerly OpenDevin”,標志著 Coding Agent 從演示走向工程與評測。
第二股:IDE 內的“許可式執行”成為交互共識。
Cline 把代理裝進 VS Code,但每一步都走用戶授權:讀/改倉、開終端、啟瀏覽器皆需你點頭。自動化有了抓手,可控性也不丟,這套 user-in-the-loop 范式,恰好契合工程團隊的安全與可觀測訴求。
與之并行的,是“對話 → 可跑應用”的云端工作臺:
StackBlitz · bolt.new 以 WebContainers 為底座,把“Prompt→運行→部署/分享”壓成直線。它不是替代 IDE,而是把從想法到可運行這條鏈路極限拉短,成為前端/全棧原型場景的高頻入口,并迅速形成開源社群與使用高潮。
2024 的關鍵詞是可執行代理 + 許可式自動化。一個把“提示”落成“動作”,一個為“動作”加上剎車與護欄;兩股合力讓“寫—測—改—提 PR”真正跑起來,也自然把目光推向 2025 的“形態之爭”。
2025:形態之爭進入加速段,CLI 成了主戰場
到了 2025,AI Coding 的主線從“誰補得更準”轉向“誰把一次變更穩妥地跑完”。這也是為什么 CLI 形態格外出圈:它天生貼著腳手架、測試與 CI/CD,最容易把“讀庫→計劃→修改→驗證→提交 PR”的閉環壓縮在開發者熟悉的命令與腳本里。Claude Code 代表了這種“終端即中樞”的范式:官方把它定義為 Agentic Coding 的終端工具,并給出完整的 CLI 參考與工作流示例,讓代理在命令行里承包從 Issue 到 PR 的整活,這種“拉直執行鏈路”的體驗,是它能夠走紅的直接原因。
與之并行,開源 CLI 代理把“好用”與“可治理”結合得更緊。Gemini CLI 以 Apache-2.0 開源發布,本身就是一套可插拔的命令行工作臺;更關鍵的是,它把 GitHub Actions 做成“一等公民”:在倉庫里 @gemini-cli 便能觸發協作任務,或直接將其編排進團隊工作流,使“代理執行”天然具備可觀測與可回歸的工程屬性,這解釋了它在團隊側迅速擴散的動能。
如果說 Gemini CLI 強調的是“協作原生”,那 SST 的 Opencode 則把“本地可控與多模型自由度”做到了極致。它堅持 100% 開源 與 供應商無鎖定,在 TUI 里流暢地切換 Anthropic、OpenAI、Google 甚至本地模型;對希望控制成本、規避鎖定、又想保持手感的開發者而言,這正是“能長期落地的開源氣質”。
另一條支線來自 OpenAI Codex:一頭連著本地 Codex CLI(強調“輕量、腳本化、在你機器上跑”),一頭連著 Codex Web / IDE 集成(把并行執行與倉庫上下文搬到云端)。這種“本地自治 + 云端加速”的雙軌設計,等于把可執行代理做成了一個可擴展的通用底座,既順著當下 CLI 的熱度,又為之后的系統級協同留出了增長曲線。
綜上,今年項目“火爆”的共同邏輯并不神秘:誰把執行閉環做得最順、最可插拔,誰就最容易贏得團隊側的采用。CLI 之所以成為主戰場,是因為它把“可組合(腳本/管道)”“可治理(權限/審計/觀測)”“可遷移(接現有工具鏈)”三點合而為一;而開源項目之所以在這一波里占優勢,則在于它們更容易成為“標準拼裝件”:既能接入 IDE 與 Web 工作臺(例如前一年流行起來的 bolt.new 這類“對話→可跑應用”的入口),又能下沉到 CI/CD 的底層執行。接下來,勝負將更多取決于上下文理解與工具生態(誰更懂你的代碼資產)、推理與穩定性(復雜改動能否一把過)、以及開放與成本(是否便于團隊規模化落地)。
![]()
針對近幾年如火如荼的 AI Coding 領域,市場側也給出背書,根據 The Business Research Company 的數據,全球 AI 編程工具市場規模預計將從 2024 年的 62.1 億美元增長至 2029 年的 182 億美元,對應 CAGR 為 24.0%。某種意義上,這是“滲透率 + 客單價 + 組織級復用”的合力。
![]()
![]()
數據脈動:新上榜與“長紅”并存,生態換擋加速
與今年 5 月份的大模型開源開發 Landscape 相比,百日后我們看到“兩端拉長”的態勢:Cline、Continue、OpenHands 等“長紅”項目穩居高位,同時 Gemini CLI、opencode、goose、marimo、openai/codex、avante.nvim 等“新面孔”快速上行。
![]()
這組數據背后,我們可以看出:
1)協議/接口優先的項目擴散更快(如 ACP/MCP 生態、Actions 一等公民);
2)本地可控 + 多模型自由度帶來開發者粘性(opencode、Avante.nvim + Ollama);
3)從原型到交付的鏈路被壓短(bolt.new、Codex Web),降低了“從想法到產物”的門檻。
縱覽近兩年的熱門項目,其出圈背后有以下因素:
降低“黑箱云端”的心智負擔:優先在本地/可控環境動手,審批與可追蹤執行是默認能力;
協議優先、生態可插拔:MCP/ACP/ACI 等把“工具—代理—宿主”解耦,IDE/終端/CI 的接入成本驟降;
開發體驗“一條龍閉環”:從建議到自動打補丁、測試、PR、回滾/審計,交付路徑更短;
“Vibe Coding” 讓代碼平權:自然語言操控倉庫與腳手架,更多角色能參與原型與運維,但生產級仍強調審閱與回歸。
![]()
為什么今年偏愛 CLI ?
是個例還是趨勢?
以新上榜的 Gemini CLI 為例,它到底是什么?
Gemini CLI 是 Google 開源的命令行智能代理,目標是“從你的提示直達模型”,把代碼生成、改動、測試與協作動作嵌回到開發者最熟悉的終端里。項目采用 Apache-2.0 許可證,并提供官方的 GitHub Action(run-gemini-cli),將“代理執行”直接接入倉庫級工作流(Issue/PR 觸發、@gemini-cli 命令派發等)。這使它既是“個人終端工具”,也是“團隊協作節點”。
為什么它“上來就很像團隊的工具”?
協作原生:官方 Action 把它做成“倉庫的一等公民”,可在 PR/Issue 上自動值守:分揀與優先級、出測試、補修復、響應 @gemini-cli 命令等;企業側可用 Google Cloud 的 WIF(Workload Identity Federation)做安全集成,減少長期密鑰暴露。
上下文與容量:官方口徑對外強調與 Gemini Code Assist、MCP 等生態協作,并主打“大上下文 + 高頻免費限額”作為開發者冷啟動的動力。這類“足夠用”的默認配額,降低了團隊一線嘗試的門檻。
從 CLI 到 CI 的“半步距”:開發者本地跑順手后,幾乎零改造就能把同一套命令編排進 GitHub Actions 里做回歸與可觀測。對于需要“把 Issue 變成可審 PR”的團隊而言,這一步是決定能否規模化推廣的關鍵。
因此,它更適用于需要“默認協作”的組織,希望讓代理圍繞 PR/Issue 工作,而不是只在本地 IDE 里“幫我寫點代碼”。不過,值得注意的是,與 IDE 內部深度上下文的體驗相比,CLI/CI 形態對“細粒度編輯體驗”的可視反饋較少,必要時可與 Cline/Continue 這類 IDE 代理搭配使用;
Gemini CLI 不是“更酷的命令行”,而是“把代理直接變成團隊協作節點”的范式樣本——這正是 2025 年 CLI 出圈的縮影:承接現有腳本 → 接入 CI/PR → 形成可觀測的執行閉環。
這并不意味著 IDE/插件 與 Web 工作臺式微:前者在“所見即所得”的上下文編輯上仍是個人效率之王(如 Cline、Continue),后者把“從零到可運行/可分享”的鏈路縮到極短(如 bolt.new)。CLI 則是團隊把自動化落地的“承力面”。三者是界面層的取舍,而非零和博弈。
![]()
從應用到模型:“模型吞噬應用”的回響
應用側的卷法,終究受制于模型側的躍遷。比如 Qwen3-Coder 模型可以為模型配置讀寫文件、列舉文件等工具,使其可以直接修改代碼文件。
![]()
Qwen3-Coder collection /DeepSeek-Coder collection
互聯網巨頭的大模型在 Coding 榜單名列前茅,最近陸續下場,借助簡潔的命令行形態調用模型,進一步增強模型能力。我們從 HumanEval、SWE-Bench verified、LiveCode-Bench 這些專業的代碼大模型榜單可以看出,OpenAI 的 O3 、Anthropic 的 claude、Google 的 Gemini 均穩穩占據前三。OpenAI 是在調出了 O3 之后,推了 DeepResearch 和增強版本的 O3Search;打了 perplexity 的主陣地;Claude Code是在 Claude 3.7 獨占 Coding 領域一段時間后,和 Claude 4 一起發的,雖然形態不是 IDE,但也引起了大量程序員的切換。當模型迭代到“能理解倉庫 + 能穩態執行”,僅做“調用包裝”的工具會更難存活——這也是為何協議、流程與數據(而非“只換個 API”)正在成為真正的護城河。這種"降維打擊"被迫讓很多開源項目最終進入“墓園”,曇花一現。
![]()
代碼大模型相關的榜單
![]()
技術剖面:AI Coding 的“五層堆棧”
AI Coding 迭代極快,如果不把這些項目放進統一的技術坐標,很容易陷入“今天誰加了新按鈕”的比較,而忽視了會決定長期護城河的層次。同時由于模型側“降維打擊”來得更快(榜單換代、推理升級、本地化增強),只有把能力拆到層上,才能在模型換代時替換最上游的一層,而不是推倒重來。因此,為了防止過度追逐熱點項目導致失焦,我們把 AI Coding 拆解為五層堆棧:
1)接口形態(IDE/CLI/Web):決定人機邊界與團隊嵌入方式,代表項目分別是以 Cline 為代表的 IDE 形態,以 Gemini CLI 為代表的 CLI 形態,以及以 bolt.new 為代表的 Wed 形態,成為前端/全棧原型的高頻入口。
2)執行內核(Agent Runtime):計劃、工具編排、沙箱/并行、斷點恢復;
3)上下文織層(Context Fabric):RAG over repo/issue/wiki、語義索引、AST/CFG 級編輯;
4)標準與協議(MCP、ACP、ACI 等):讓工具與代理可插拔、可觀測;
5)模型與路由:多模型/本地/級聯仲裁,平衡成本、質量與時延。
把開源項目往這五層一落,差異就一目了然:例如 OpenHands 強執行內核與 ACI;opencode 強接口形態(CLI/TUI)與多模型路由;Gemini CLI 把協作工作流(Actions)做成外部擴展的“北向接口”;Codex 以本地/云端雙軌把上下文與執行拉通。
因此,在 AI Coding 的下半場,競爭的焦點回歸到三件事:推理與穩定性(復雜改動能否一把過)、工具/上下文生態(誰更懂你的代碼資產)、開放與成本(能否以可控成本落進企業流程)。開源社區將持續作為“最快擴散層”,CLI 與 IDE 插件吸收新模型/新工具更快;像 OpenHands、Codex CLI、Gemini CLI 這樣的“可執行代理底座”,會成為團隊流水線里的標準拼裝件。底層收斂到“統一執行內核 + 協議層”(開源更具外延力),負責計劃、工具調用、讀寫倉、運行/觀測與回退;上層維持 IDE、CLI、Web 多形態,按“個人效率、團隊自動化、原型演示”各取所需。
![]()
結語
AI Coding 的拐點不是“模型更聰明”,而是“讓聰明的模型可靠地完成一次真實的變更”。當可執行的 Coding Agent 與自動化授權成為默認,把 IDE/CLI/Web 三種形態放進同一臺“執行引擎”上,人機協作就從“能交互”進化為“能交付”。下一輪競爭,將在執行閉環、上下文理解與開放生態里決出高下。
本文出自《》洞察報告專題洞察 AI Coding 篇,作者董超(螞蟻開源)。
10 月 16-17 日,2025 全球機器學習技術大會將在北京威斯汀大酒店(亮馬橋)舉行,大會特別設置了「AI 賦能軟件研發與氛圍編程」專題,北京大學博雅特聘教授李戈、阿里 Qoder 技術專家彭佳漢、騰訊代碼大模型技術專家夏偉、百度 Comate 資深算法工程師陳一言、智譜 AI CodeGeeX 算法研究員張少博、深信服研發主管、Costrict 負責人韋體東等深耕 AI Coding 的資深專家學者將深入 AI Coding 在軟件工程的探索與實踐,幫助大家一起更好地擁抱 AI Coding 下半場,歡迎掃描下方二維碼報名。
日程詳情可戳:《》
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.