AI 浪潮正席卷軟件行業,程序員們在 FOMO 情緒和效率訴求的雙重驅動下,越來越多地把 AI 編程工具融入日常工作,“Vibe Coding”逐漸成為一種新的開發常態。
然而,近期 Replit AI 編程平臺發生誤刪生產數據庫的事件,為熱烈的 AI Coding 氛圍蒙上陰影。事件一出,迅速引發業內關于 AI 編程安全性的廣泛討論:AI 生成的代碼究竟有多安全?在享受效率紅利的同時,如何真正保障 AI Coding 的安全性?
01
真實開發場景下,AI生成代碼的安全性研究
為此,我們邀請國內領先的AI安全企業----安恒信息做了一次雙層次實驗,并且搭建了一套完整的“多智能體(MCPs)協同驅動的自動化安全審計體系”,系統性評估AI代碼生成工具在不同條件下的安全表現。
![]()
實驗框架圖 (點擊放大)
實驗目標主要聚焦兩個方向:評估AI生成代碼的基礎安全性、探索安全設計對代碼安全的影響機制。
實驗選取國內外主流的10款 AI 代碼生成工具,設計涵蓋代碼片段任務與完整項目的提示詞集合,生成真實的代碼樣本。隨后,依托數字員工平臺,構建“多引擎審計 → AI 研判降噪 → AI 深度審計 → AI 修復建議 → 報告生成”的全自動化流程,實現對AI生成代碼的系統化漏洞評估。
![]()
02
你的代碼正在“裸奔”:AI默認生成的
代碼是不安全的
測評結果顯示,AI在默認狀態下生成的代碼存在嚴重的安全隱患。如果不加任何限制,代碼上線幾乎等同于“裸奔”。因此,至少要引入安全提示詞和靜態安全測試作為最低安全門檻。
1、AI默認生成代碼=裸奔!AI寫的Bug比你想象的多
在無安全設計的情況下,AI生成代碼的平均缺陷密度約為 11.28 個/千行代碼,部分模型甚至超過 20 個/千行。高頻出現的問題包括:SQL注入、路徑遍歷、弱加密、硬編碼密鑰等等。
![]()
不同AI編程模型生成代碼的漏洞數量(每千行代碼) (點擊放大)
![]()
AI生成代碼的漏洞類型分布 (點擊放大)
更令人擔憂的是,高危漏洞比例占比驚人,這意味著一旦投入生產環境,后果可能極其嚴重。
![]()
AI生成代碼的漏洞風險等級分布(點擊放大)
2、增加安全提示詞后,缺陷密度下降一半
通過引入安全提示詞,缺陷密度從11.28 個/千行降至約 7.41,再進一步使用增強型提示詞,降至5.67 個/千行。換句話說,安全提示詞能讓缺陷數量幾乎減半,效果非常顯著。
![]()
加入安全提示后各模型生成代碼的漏洞數量變化(每千行代碼)(點擊放大)
![]()
平均缺陷密度變化(每千行代碼)(點擊放大)
3、真刀真槍測評:10大AI編程工具安全性
先看合規性:漏洞榜單對照
CWE Top 25 和 OWASP Top 10 是國際公認的核心 Web 應用安全風險清單。我們將 AI 生成代碼中的漏洞類型與這兩大基準對照,如果觸發了對應弱點,就視為“不合規”;反之,則合規度越高。
通過統計命中率并轉換為排名,可以直觀量化不同模型在規避行業標準漏洞方面的表現。表 1、表 2 展示了不同提示詞條件下的 CWE / OWASP 合規排名。
![]()
表1-不同提示詞加入后各模型的CWE合規排名
![]()
表2-不同提示詞加入后各模型的OWASP合規排名
再看綜合評分:誰更穩健
綜合評分按“安全30% + 合規20% + 代碼質量15% + 安全成熟度15% + OWASP10% + CWE10%”計算。
![]()
表3-不同提示詞加入后各模型的綜合排名
結果很有意思:在 無提示詞 或僅用 全局提示詞 時,各模型差異不大,幾乎都踩了不少坑,導致排名大量并列。
但一旦加入 增強提示詞,分化就出現了——并列情況明顯減少,有的模型安全性迅速拉開差距。
換句話說:安全提示詞,確實能讓模型“收斂亂跑”,規避更多風險。從源頭降低了高危缺陷發生的概率。
結論
總的來說,在無安全提示詞的情況下,各模型的表現差異并不大,都存在較多不合規項;加入全局安全提示詞后,達到合規基線的模型占比明顯提升且方差收斂。
AI 寫代碼默認不安全,必須疊加外部安全體系加固,才有可能達到上線標準。
03
AI Coding時代,如何做安全審計?
如何應對以上問題,安恒提出了一套自己的實踐思路,經過充分研究以及在多家公司成功實踐的基礎上,依托數字員工平臺,提出“多智能體(MCPs)驅動的自動化安全審計體系”。覆蓋了從威脅建模、代碼生成、審計研判的全流程。由多個MCP協同完成,從設計到報告輸出形成閉環,框架包括六個部分:
1)AI威脅建模MCP。根據需求自動生成安全約束,確保后續開發帶有安全上下文。該智能體能夠自動推演攻擊路徑與威脅場景,如:支付繞過、越權訪問、敏感數據泄露等,并且生成與業務風險高度耦合的安全控制建議。
2)多引擎融合審計MCP。融合多種源代碼審計引擎,實現引擎間優勢互補,消除檢測盲區,同時支持靈活擴展,輸出更全面的審計結果。
3)開源組件風險分析MCP。通過漏洞可達性分析、代碼指紋比對、深度遞歸依賴解析等技術,精準判定組件風險,全面覆蓋直接與傳遞依賴,分鐘級采集并驗證全球開源情報,輸出完整的成分風險清單。
4)AI智能研判MCP。依托實戰沉淀的高危漏洞規則,結合上下文語義分析,對多引擎掃描結果進行精準研判,覆蓋 SQL 注入、反序列化、路徑遍歷、弱加密等關鍵風險,輸出高可信度的漏洞判定。
5)AI代碼深度審計MCP。定向聚焦安全敏感區,過濾無價值代碼噪聲,基于 Java 高危函數清單與內部安全規范構建規則矩陣,覆蓋配置漏洞、高危缺陷及中間件風險,彌補傳統審計在規則盲區與上下文分析的不足,輸出高精度的漏洞檢測結果。
6)AI自動修復與綜合報告MCP。依托上下文感知與規范驅動,綜合技能一至四的分析與審計結果,實現高效可信的漏洞整改,輸出一鍵可落地的修復方案及完整綜合報告。
該框架已在實驗中驗證,能同時提升審計效率與覆蓋率,支持與企業DevSecOps流程深度融合。是AI Coding安全“左移”的最佳實踐。
更重要的是,安恒信息還將這一框架集成到統一的交付形態中,打造出了“安全開發一體機”。
可以把它理解為:多智能體框架是底層“發動機”,而安全開發一體機則是把發動機、底盤和駕駛艙都裝配齊全的“整車”,企業只需開箱即可使用。
“安全開發一體機”將國產代碼倉庫、威脅建模、SAST、SCA、CI/CD、制品庫等核心安全模塊形成“一機打包”的完整安全開發基礎設施。它既繼承了多智能體框架的智能化優勢,又通過產品化集成降低了落地門檻,使企業能夠快速實現從研發到上線的全流程安全閉環。在版本設計上,提供基礎版與旗艦版兩個形態:
基礎版:集成國產代碼倉庫、SAST、SCA、CI/CD等核心能力,幫助用戶快速落地DevSecOps,實現安全檢測與流程管理的一體化。
旗艦版(AI):在基礎能力之上,進一步疊加AI威脅建模、AI漏洞研判、AI源代碼審計、AI修復建議與智能報告生成等模塊,利用大模型驅動的自動化能力,實現“生成即安全”的目標,大幅提升漏洞識別精度、修復效率和整體安全成熟度。
通過這種分層架構,用戶既可以根據自身安全建設階段靈活選擇合適版本,又能在未來平滑升級到旗艦版,實現安全能力的可持續演進。
04
企業級代碼“生成即安全”的可行路徑
AI Coding的安全問題并不是一個簡單的技術問題,它需要模型廠商、安全團隊以及開發者的持續協同。多智能體審計框架為我們指出了一條切實可行的實踐路徑,企業級代碼的“生成即安全”將在越來越多的場景進行落地。
AI編程只有真正成為可靠的生產力,而非極客工具箱里的玩具,才能夠給企業帶來生產效率的提升、價值的增量。這場變革才剛剛開始,但每一步探索,都在為更安全的AI Coding未來鋪路。
05
AI驅動安全防御范式全面升級
除 AI 編程外,其他網絡安全領域也正遭遇AI驅動的攻擊升維挑戰,倒逼防御范式迎來革命性突破。面對 “以 AI 對抗 AI” 的需求,行業亟需更高效的AI安全服務創新范式。
![]()
作為國內唯一以數字貿易為主題的國家級展會,第四屆全球數字貿易博覽會(以下簡稱“數貿會”)即將于9月25日 - 29日在杭州大會展中心盛大啟幕。安恒信息正式成為本屆數貿會“數字安全技術服務合作伙伴”,將以自主研發的AI+安全產品,為這場聚焦“數字貿易 商通全球”的國際盛會保駕護航。
安恒信息屆時將全球首發集成18年實戰沉淀、千名專家經驗煉成的“AI安服數字員工”,致力于構建高效智能的新時代數字安全服務體系。這不僅是對谷歌認定的十大AI+應用領域(安全 Agent)的率先落地,更是中國安全治理理念與經驗向全球的重要輸出。
大會即將開始,歡迎掃碼關注
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.