AI 已從“前沿探索”變成軟件研發的日常工具,但在我接觸的大量中國企業里,管理層對它的期待與現實體驗,往往并不一致。最新發布的 DORA 2025 報告,給我們提供了一套相對冷靜、基于證據的視角:AI 到底改善了哪些研發效能指標,又在哪些地方制造了新的不穩定?本文嘗試站在中高層管理者與 PMO 的角度,對這些關鍵發現做一次系統梳理,幫助你用更務實的方式審視 AI 研發效能。
從“要不要上 AI”,到“AI 已經無處不在”
過去兩年,我在不同規模和行業的客戶現場聽到最多的兩個問題是:
- “我們是不是也該搞點 AI,別被落下?”
- “AI 研發效能到底有沒有實打實的提升?”
DORA 2025 的數據,至少可以幫我們回答第一部分——這已經不是“要不要上 AI”的問題,而是“你有沒有能力駕馭 AI”的問題。
1. AI 使用已經成為軟件研發的“新默認”
DORA 報告顯示:在 2022 年,開發者使用 AI 還算新鮮事,如今超過 90% 的技術專業人員會在工作中使用 AI 工具;其他行業調研也表明,84% 的開發者正在使用或計劃使用 AI 工具進行開發。
這背后還有兩組值得管理層注意的信號:
- 企業層面:88% 的企業領導者表示,加速 AI 采納是優先事項,2024 年全球企業在 AI 上的總投資達到 2523 億美元,同比增長 26%。
- 招聘層面:包含“生成式 AI 技能”的職位發布量在一年內增長了 300%+。
換句話說,無論你個人是否樂觀,AI 已經是大多數研發團隊的“日常基建”,而不是未來時的選配項。
2. 但“廣泛采納”不等于“廣泛價值”
雖然上面提到 AI 已經是大多數研發團隊的“日常基建”,但 DORA 報告中同時也提醒我們:
很多企業的 AI 計劃仍然是由“FOMO(錯失恐懼癥)”驅動,而不是深思熟慮的戰略。
這句話對國內環境尤為適用。在不少客戶現場,我看到的 AI 項目是這樣推進的:
- 由上而下定一個目標:“要在某某大會上講我們也在用 AI”;
- 集中采購一批許可證,安排幾輪培訓;
- 要求研發部報“節省了多少人天”“代碼產出提升了多少”。
許可證買了、插件裝了、分享會開了,開發者主觀上覺得好像更快了。短期看,這類項目有一些可展示的成果;但長期看,它們往往沒有改變組織的 AI 研發效能——也就是沒有在交付節奏、質量穩定性、價值流效率上留下清晰的改善軌跡。
AI 真正改善了哪些“研發效能”指標?
DORA 團隊這次用了一個相對嚴謹的方式:在控制環境和流程等因素之后,比較同類人群中 AI 采納程度不同的人,看他們在各類結果上的差異。它沒有停留在“開發者好感度調查”,而是嘗試用多維度指標去刻畫“AI 研發效能”的真實變化。
1. 個體視角:生產力與代碼質量的真實提升
在個人層面,AI 研發效能的提升是被數據反復驗證的。
DORA 發現,在其它條件相同的情況下,AI 采納程度越高的從業者,越有可能報告更高的個人效能和代碼質量。比如:
- 更高水平的個人效能;
- 更高比例的時間用于“有價值的工作”;
- 更高水平的代碼質量;
- 更高水平的團隊效能、組織效能以及產品效能;
- 更高的軟件交付吞吐量。
用大白話講,就是:
AI 讓開發者更容易把時間花在“創造價值”的事情上,而不是機械勞動上;同時對代碼質量和產品結果,也有統計意義上的正向影響。
這與我在客戶現場的觀察基本一致:當團隊已經有一定的工程基礎,AI 非常擅長削減“邊角料工作”——寫重復代碼、整理接口文檔、生成簡單測試、起草方案初稿。讓骨干可以把精力更多放在架構決策、復雜場景和跨團隊協作上——這才是真正的 AI 研發效能。
2. 組織視角:效能的多個維度“同時變好”
如果把視角從個體拉到組織,DORA 進一步指出:在具備一定基礎設施和管理成熟度的前提下,AI 采納度更高的團隊在組織效能、團隊效能、產品效能和交付吞吐量上整體表現更好。
這說明,只要底層沒有嚴重短板,AI 研發效能的提升是可以傳導到業務側的,而不是只停留在“個人自我感覺良好”。
我通常會建議管理層,把這部分效應理解為:
AI 不會幫助一個混亂的組織“起死回生”,但會顯著放大一個本來就走在正確方向上的組織的優勢。
AI 沒有解決的三個問題:摩擦、倦怠與不穩定性
然而,DORA 也非常坦誠地展示了另外一面——有些問題,采用 AI 后幾乎沒有動靜,甚至在惡化。
1. 摩擦與倦怠:這是組織問題,不是工具問題
DORA 報告顯示,AI 采納程度與“工作摩擦”和“職業倦怠”的改善幾乎沒有顯著相關性。——換句話說,用不用 AI,大家吐槽流程、抱怨疲憊的程度差不多。
DORA 給出的解釋是:
這些結果更多是“社會技術系統”(流程 + 文化)的產物,即流程、結構和文化共同作用的結果。超出了個體開發者能夠左右的范圍。
這非常符合國內很多研發團隊的現實:
- 需求變更頻繁、優先級經常反復拉扯;
- 評審鏈路長、審批層級多,決策遲緩;
- 跨團隊協作模糊,職責邊界不清晰;
- 指標壓力只下沉不共擔。
在這種場景下,你即便給每個人配一個頂級 AI 助手,他也最多只能幫你“更快地做完錯誤的事”。
從組織治理角度看,這組數據在提醒管理層:
不要指望用 AI 來彌補結構性問題——那些問題需要的是決策機制調整、權限劃分與流程重構,而不是一個更聰明的編輯器。
2. 軟件交付不穩定性:AI 把“隱性風險”提前暴露
更值得警惕的一點是:AI 與“軟件交付不穩定性”的上升存在統計相關性。
2024 年的 DORA 研究曾指出:當 AI 采納率每增加 25%,如果不配套改進交付體系,會出現“交付吞吐量平均下降 1.5%,不穩定性上升 7.2%”的反常現象。
2025 年的情況好一些——吞吐量開始提升,但不穩定性問題依然沒有根本好轉。
原因其實不難理解:
- AI 把“寫代碼的門檻”進一步放低了,讓開發者更容易做出“更大體量的變更”;
- 但測試自動化、灰度發布、監控與回滾能力,如果仍停留在“人肉 + 手工”的舊時代,系統自然會變得更脆弱。
DORA 的表述是:AI 目前主要集中在“鍵盤端”,因此提升了代碼質量和生產力,但沒有觸及引發摩擦、倦怠和不穩定性的那些深層結構。
如果管理層只看到 AI 研發效能帶來的“提速”,卻忽略了不穩定性與隱性風險的疊加,就很容易在一年后迎來一波“質量與運維事故的反噬”。
![]()
AI 是“放大器”而不是“銀彈”:七項能力與七類團隊
DORA 在摘要部分給技術領導者提了一個非常重要但容易被忽略的結論:
成功的 AI 采納是一個系統問題,而非工具問題。
這句話背后,有兩個關鍵支點。
1. 七項 AI 能力:決定 AI 研發效能的“上限”
今年 DORA 報告的一個重要成果,是首次提出了 DORA 人工智能能力模型,總結出七項能顯著放大 AI 效益的能力,其中幾項與 AI 研發效能直接相關的包括:
① 明確且已共識的 AI 立場
- 是否有清晰的 AI 使用政策;
- 員工是否知道哪些場景可以大膽試驗,哪些場景必須嚴格審慎。
② 健康的數據生態系統 & AI 可訪問的內部數據
- 內部數據(代碼庫、文檔、工單、日志)是否干凈、可訪問、結構化;
- AI 是否能安全訪問這些內部信息,而不僅僅停留在“通用聊天機器人”。
③ 穩健的版本控制 + 小批量工作模式
- 團隊是否鼓勵小步提交、頻繁集成;
- 出現問題時,能否快速精準地回滾到安全版本。
④ 以用戶為中心的關注點與高質量內部平臺
- 研發是否真正圍繞用戶價值做優先級決策;
- 是否存在一個統一的內部平臺,為開發者提供統一入口、統一規范。
從 AI 研發效能的角度看,這些能力決定了本一家企業的“研發效能上限”,AI 只是讓你更快地觸碰那個上限——是高是低,取決于你之前打的地基。
2. 七類團隊:先知道自己在哪里,再談要去哪里
另一方面,DORA 還基于研發效能結果,比如吞吐量、不穩定性、團隊效能、產品效能、摩擦、倦怠等維度,將團隊劃分為七類典型畫像,從“和諧高成就者”到“遭遇基礎性挑戰者”。
有兩個關鍵觀察值得管理層重視:
- 最佳表現者(聚類 6 與 7)能夠在“速度”和“穩定性”兩個維度上同時取得卓越成績,占樣本近 40%。
- 另一端的團隊(例如聚類 1、聚類 4),要么深陷基礎問題,要么“高影響低節奏”,速度缺乏穩定性,是危險且不可持續的狀態。
這直接打破了一個傳統迷思:速度與穩定性不是天然對立的,優秀團隊完全可以兩者兼得。
而 AI 在這里扮演的角色,很可能是:
- 對于已經接近聚類 6/7 的團隊,AI 是一個加速器,可以進一步放大 AI 研發效能;
- 對于停留在聚類 1/2 的團隊,AI 可能只是把問題“放大并提前暴露”——這未必是壞事,但如果管理層沒有系統觀,就容易誤以為“AI 沒用,甚至添亂”。
因此,在設計 AI 路線圖之前,最重要的一步其實是:搞清楚自己屬于哪一類團隊,而不是“簡單抄一份別家的 AI 方案”。
這一點,我會留到下一篇文章中,用專門的一篇來展開。
給中高層和 PMO 的三點行動建議
站在項目治理與組織效能的角度,結合 DORA 2025 的數據和本土實踐,我會給中高層和 PMO 三個相對直接的建議。在規劃 AI 研發效能提升時,至少考慮以下三件事。
1. 把 AI 項目從“工具采購”升級為“交付系統重構”
如果你的 AI 項目目標只有兩條:
- 采購若干 AI 工具或平臺;
- 證明“我們也在用 AI,且節省了 X% 人力”。
那么在 DORA 的體系中,你大概率會落入那類高不穩定性、低可持續性的組織。
更健康的 framing 應該是:
我們希望能借助 AI 這次契機,整體升級軟件交付系統
這意味著,AI 規劃要與以下議題強綁定:
- 系統架構是否支持小批量、易回滾的變更;
- 測試與發布流水線是否足夠自動化、可觀測;
- 需求管理、優先級機制是否真正以用戶和業務價值為導向。
2. 用價值流管理,把 AI 接入“端到端”
DORA 用大量數據證明:價值流管理(VSM)可以顯著提升團隊效能、有價值工作時間與產品效能,是 AI 投資的放大器。
一個可操作的小步驟是:
- 選一個有代表性的產品或系統;
- 讓產品、研發、測試、運維、安全坐在一起,用一張 A3 紙畫出當前從“想法”到“上線”的全過程;
- 標注每個環節的平均等待時間、返工率以及常見摩擦點。
在這張圖出來之前,不要急著討論“用哪種 AI 工具”,否則你很可能在非瓶頸環節取得漂亮的局部優化,卻看不到整體 AI 研發效能的提升。
3. 把平臺工程與數據治理當成 AI 成功的“基礎設施項目”
最后,DORA 明確指出:
- 90% 的企業已采用平臺工程,76% 擁有專職平臺團隊;
- 高質量內部平臺能顯著增強 AI 對組織效能的正面影響,是 AI 成功應用的關鍵基礎。
同樣,健康的數據生態也是七項 AI 能力中的核心一環:高質量、可訪問、一致性的內部數據,直接決定 AI 能否從“聰明玩具”變成“業務助手”。
對管理層來說,這意味著:
- 如果你沒有統一的內部開發者平臺,AI 工具只會進一步加劇“工具碎片化”和“協作割裂”;
- 如果你的數據分散在多個孤島,質量參差不齊,AI 再強也只能給你生成“看起來聰明但不可信”的回答。
因此,把 AI 項目的預算單獨拎出來討論往往是陷阱。更務實的做法,是把平臺工程建設、內部數據治理、AI 能力接入與治理,視為同一個“AI 研發效能基礎設施項目”的三個側面。
結語:管理者需要的,是“更清醒的系統觀”
DORA 2025 帶來的最大價值,不在于告訴我們“AI 很重要”(這一點你可能早就感受到了),而在于用數據提醒我們:
- AI 能顯著提升個體與組織的研發效能,但前提是底層系統足夠健康。
- 工作摩擦、職業倦怠和交付不穩定性,是組織結構與文化的結果,不會因為買了 AI 工具自動消失。
- 真正優秀的團隊,可以在高吞吐與高穩定之間實現雙贏,關鍵在于你有沒有勇氣用系統工程的方式重構交付體系。
作為中高層管理者與 PMO,如果你把 AI 看成一場 “交付系統升級”與“組織能力重塑” 的契機,而不是一輪工具采購,這場變革將更有可能為你的企業帶來長期的 AI 研發效能優勢。
在下一篇文章中,我會結合 DORA 2025 提出的七類團隊畫像模型,進一步展開討論:
- 如何判斷你的團隊屬于哪一種類型?
- 不同類型在上 AI 時應該先補哪些課、踩哪些剎車?
- 如何在不透支團隊的前提下,逐步提升 AI 研發效能?
敬請留意下一篇:《DORA 2025:基于七類團隊畫像的 AI 研發效能診斷方法》。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.