網易首頁 > 網易號 > 正文申請入駐

Anthropic 工程師深度解讀 Skills：AI Agent 的專業進化之路

2026-01-14 22:11:41　來源: 人工智能學家

北京舉報

分享至

　　最近刷屏Skills是什么，發布5周出現了數千個 Skills，他們有哪些類型，Skills為什么重新定義了 AI Agent 的開發方式，又有令人興奮的應用場景？我們詳細拆解了Claude Code 兩位核心開發者的演講視頻（Stop building agents, build skills instead），帶你一文讀懂Skills如何讓AI從"每次從頭學"變成"越用越懂你"。

　　Barry Zhang 和 Mahesh Murag 是 Anthropic 的工程師，他們發現，如今許多人已經將 AI Agent 深度融入了日常工作。即便如此，差距依然存在，生成的回報里仍夾雜著不少低質內容。

　　問題的本質是：AI Agent 雖然聰明、有能力，但未必具備解決實際業務所需的專業經驗。

　　舉個例子，Mahesh 是智商 300 的數學天才，Barry 是經驗豐富的稅務專家，當你需要報稅時，你會找誰？毫無疑問，我會選 Barry。我不希望 Mahesh 從第一性原理中推導出 2025 年的稅法，我需要的是領域專家那種穩定、可靠的執行力。

　　這里可以做個類比：AI Agent = 智商 300 的 Mahesh，極其聰明，在深度引導下能做出驚人成績，但在起步階段往往缺乏關鍵的背景信息。

　　你想要的理想狀態 = Barry：擁有領域專家的穩定、可靠執行力，無需從頭推導就能給出專業答案。

　　想要達到理想狀態，AI Agent 暴露出有三個缺陷：

　　無法高效吸收你的專業經驗

　　無法隨時間自我進化

　　起步階段缺乏關鍵背景信息

　　這也是 Skills 誕生的原因。

　　在分享解決方案之前，Barry 和 Mahesh 先回顧了 Anthropic 內部的三個關鍵認知轉變。這些認知是理解 Skills 設計的基礎。

　　三大關鍵認知

　　認知 1："代碼即一切"

　　過去的認知：

　　不同領域的 AI Agent 在架構上會大相徑庭

　　需要各自的工具鏈和底層腳手架

　　每個用例、每個領域都要獨立開發一個 AI Agent

　　在開發 Claude Code 后，團隊意識到：

　　代碼不僅是應用場景，更是通往數字世界的通用接口

　　底層 Agent 邏輯比預想中更具通用性

　　舉個例子，生成一個財務報告，讓我們看這個任務具體的任務分解：

　　調用 API 抓取數據

　　在文件系統整理資料

　　用 Python 分析數據

　　合成特定格式報告

　　底層僅需：Bash 環境 + 文件系統

　　結論：底層核心架構可以極其精簡，但擴展性極強。

　　認知 2：文件是最佳協作單元

　　Skills 的本質：文件的有序集合（就是一個個文件夾）

　　Skills 是文件的有序集合，它為 AI Agent 打包了可組合的過程性知識。通俗點說，它們就是一個個文件夾。

　　為什么選擇文件作為 Skills 的載體？為什么選擇如此"原始"的形式？ Anthropic 團隊有 3 大設計理念：

　　1. 普適性

　　任何擁有電腦的人都能創建和使用

　　開發者可以用

　　AI Agent 自己也可以用（這點很關鍵）

　　2. 兼容性

　　完美融入現有工作流：

　　用 Git 做版本控制

　　存在 Google Drive

　　打包分享給團隊

　　3. 永恒性

　　幾十年來，文件一直是最基礎的協作單元，既然好用，為何要改變呢？選擇文件作為載體，工具生態成熟，學習成本為零，遷移成本為零。

　　認知 3：代碼勝過傳統工具定義

　　這也是最關鍵的一個認知。

　　傳統工具定義的四大缺陷：

　　指令含糊不清

　　無法自我修改：模型執行受阻時陷入"冷啟動"困境

　　持續占用上下文：定義會一直占用上下文窗口空間

　　缺乏靈活性

　　相比之下，代碼的三大優勢：

　　自文檔化：代碼本身就是最好的說明

　　可隨時修改：AI 可以自己優化工具

　　按需加載：平時存儲在文件系統，僅在需要時調用

　　舉個例子：Claude 經常重復編寫相同的 Python 腳本來調整幻燈片樣式，每次都要重新編寫，浪費 tokens，質量不穩定。

　　現在給個解決方案：讓 Claude 將這段腳本保存為一項 Skill，現在只需直接運行腳本即可，效率和一致性大幅提升將"重復勞動"轉化為"可復用知識"。

　　Skills 系統架構設計

　　1. 核心組成

　　Skills 包含什么？

　　Markdown 文件（核心指令）

　　軟件包

　　可執行文件和二進制文件

　　腳本

　　各類資產

　　復雜度演進：

　　初期：簡單的 Markdown 文件（幾分鐘完成）

　　現在：綜合體（需數周甚至數月精耕細作）

　　2. 逐步披露策略

　　當你擁有成百上千個 Skills 時，出現一個問題：如果全部加載到上下文窗口，會瞬間耗盡 tokens。因此，Anthropic 采用了一個逐步披露策略。

　　如何實現？運行時流程：

　　初始狀態：模型只看到 Skills 元數據

　　需要使用時：AI Agent 讀取 SKILL.md 文件

　　獲取：核心指令 + 目錄索引

　　效果是，即使擁有成千上萬個 Skills，系統依然高效。

　　舉個例子：假設一個 AI Agent 擁有 500 個 Skills，

　　初始狀態：

　　Context window：僅包含 500 個 Skills 的元數據

　　占用空間：約 5-10K tokens

　　用戶請求："幫我生成一份銷售報告"

　　執行流程：

　　Agent 掃描元數據 → 識別出 "sales_reporting" Skill

　　加載 sales_reporting/SKILL.md → 讀取核心指令和文件結構 → 占用空間：約 1-2K tokens

　　按需加載具體腳本 → 讀取 generate_report.py → 讀取 format_template.json → 執行完畢后從 context 中清除

　　這種設計的好處是支持成千上萬個 Skills ，上下文窗口消耗始終可控，不需要的 Skills 不占用空間，可以動態組合多個 Skills ，支持復雜的工作流編排。

　　統一架構模型

　　經過一年的探索，Anthropic 觀察到一個趨勢：通用 AI Agent 的架構正趨于統一。

　　新興通用 AI Agent 架構的四大組件：

　　Agent Loop：職責是大腦，理解用戶意圖、規劃執行步驟、管理上下文窗口、決定何時調用哪些工具或 Skills。

　　運行時環境：執行環境，提供代碼執行能力、管理文件系統、處理進程隔離和安全。

　　MCP：負責外部世界的物理連接，連接外部 API、訪問數據庫、調用第三方服務。

　　Skills：職責是知識與經驗，提供靈魂（專業知識），包含領域專業知識、最佳實踐、過程性經驗等。

　　兩者完美互補，形成完整生態。

　　Skills 生態三大類別

　　自發布以來，Skills 生態已經擁有數千項 Skills，主要分為 3 大類。

　　1. 基礎 Skills

　　賦予 AI Agent 全新的通用能力或領域能力。

　　案例：

　　Document Skills：創作和編輯專業辦公文檔，支持 Word、PPT、Excel 等格式，理解文檔結構和業務邏輯，讓 Claude 具備創作和編輯專業辦公文檔的能力。

　　基礎 Skills 擴展了模型的基礎能力邊界，就像為操作系統增加新的系統調用。

　　2. 第三方 Skills

　　讓 Claude 更好地適配第三方產品和服務。

　　案例：

　　Cadence - 科學研究 Skills：使 Claude 在 EHR 數據分析上表現遠超原生模型，熟練應用 Python 生物信息庫。

　　Browserbase - Stagehand Skills：為開源瀏覽器自動化工具構建專屬 Skills，讓 Claude 更熟練地操控瀏覽器。

　　Notion - 工作空間 Skills：深度理解用戶的 Notion 工作空間，進行跨文檔研究。

　　3. 企業私有 Skills

　　最令人興奮的應用場景，針對公司特定場景構建的 Skills。

　　典型用例：

　　傳授組織最佳實踐：將公司獨特的工作方法編碼為 Skills，讓新來的 AI 立即理解公司文化，按規矩辦事。

　　內部軟件培訓：教會 AI 如何使用公司特有工具，讓 AI 像老員工一樣熟悉內部系統。

　　代碼規范遵循：讓 Claude Code 遵循內部代碼風格和工作流，代碼一致性大幅提升。

　　Anthropic 的工程師觀察到的三大趨勢

　　趨勢 1：非技術人員也在構建 Skills

　　來自以下領域的專業人士正在創建 Skills：有財務部門、招聘團隊、會計師事務所、法律顧問。Skills 讓 AI Agent 變得觸手可及，即使不擅長編程也能讓 AI 適配日常工作。

　　趨勢 2：Skills 與 MCP 形成完美互補

　　開發者正在利用 Skills 編排多個 MCP 工具的工作流

　　分工明確：MCP 負責連接，專注于"能不能"，MCP 開發者不需要了解所有業務場景。Skills 負責智慧和業務邏輯，專注于"該不該"和"怎么做"，Skills 創建者不需要處理底層連接細節。

　　N 個 MCP Servers × M 個 Skills，靈活性遠超單一工具。

　　趨勢 3：Skills 日益復雜化

　　從簡單 Markdown 到包含多種資產的綜合體，開發周期從幾分鐘到數周/數月。為什么復雜化是好事？說明 Skills 開始承載真實業務邏輯，生態走向成熟。

　　Anthropic 內部應用成果

　　在分享中， Anthropic 工程師還介紹了公司內部的垂直領域落地案例。在 Skills 功能發布后，Anthropic 緊接著推出了兩個專業方案：

　　金融服務專業方案

　　生命科學專業方案

　　實現方式：預裝 MCP 服務器 + Skills 包 → Claude 立即成為領域專家助手。傳統方式開發垂直領域 AI 需要 6-12 個月，Skills 方式配置垂直領域 AI 僅需數周。不只可以快速迭代和調整，Skills 還可以跨場景使用。

　　Skills 未來探索的四大方向

　　1. 軟件工程化管理

　　需求：像對待軟件一樣對待 Skills

　　具體措施：

　　引入測試與評估機制

　　開發更好的觸發工具（確保正確時間觸發正確 Skills）

　　建立輸出質量衡量標準

　　完善版本控制系統

　　2. Skills 依賴關系管理

　　目標：讓 Skills 可以引用其他 Skills、MCP 服務器或環境包

　　價值：

　　AI Agent 在復雜環境下行為更可控、更精準

　　通過多 Skills 組合，激發處理高級任務的潛力

　　3. 共享與分發生態

　　愿景：企業內部擁有由員工與 AI 共同維護、不斷進化的能力知識庫

　　復利效應：企業內部能力知識庫的不斷進化。

　　4. 持續學習

　　核心突破：Skills 是邁向持續學習的具體步驟

　　記憶具象化：

　　過去：信息的堆砌

　　現在：針對特定任務的過程性知識

　　學習可能性：標準化格式保證：Claude 記錄的任何經驗都能被未來的自己高效繼承。

　　靈活優勢：隨著合作時間增加，瞬間習得新能力，根據需求不斷優化，果斷舍棄過時操作。

　　終極目標

　　"與你共事 30 天后的 Claude，表現應當遠優于第 1 天。"

　　當前進展：Claude 已可利用 Skill Creator 自動生成 Skills。

　　Skills 的定位

　　讓每個人都能通過簡單的文件夾，將創意與專業知識轉化為解決現實問題的力量。

　　Anthropic 的工程師表示，Skills，只是這場變革的起點。Skills 系統，通過極簡的文件格式，解決了 AI Agent 缺乏領域專業知識的核心痛點，并構建了一個開放、可組合、可進化的生態系統。AI 持續學習，讓專業經驗自由流動，讓組織知識的永久沉淀。

　　真正的價值不在于構建更聰明的 AI，而在于讓 AI 具備可復用、可積累、可共享的專業經驗。這才是 AI Agent 走向實用的關鍵路徑。

　　| 文章來源：數字開物

　　 ? END ?

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.