![]()
最近刷屏Skills是什么,發布5周出現了數千個 Skills,他們有哪些類型,Skills為什么重新定義了 AI Agent 的開發方式,又有令人興奮的應用場景?我們詳細拆解了Claude Code 兩位核心開發者的演講視頻(Stop building agents, build skills instead),帶你一文讀懂Skills如何讓AI從"每次從頭學"變成"越用越懂你"。

Barry Zhang 和 Mahesh Murag 是 Anthropic 的工程師,他們發現,如今許多人已經將 AI Agent 深度融入了日常工作。即便如此,差距依然存在,生成的回報里仍夾雜著不少低質內容。
問題的本質是:AI Agent 雖然聰明、有能力,但未必具備解決實際業務所需的專業經驗。
舉個例子,Mahesh 是智商 300 的數學天才,Barry 是經驗豐富的稅務專家,當你需要報稅時,你會找誰?毫無疑問,我會選 Barry。我不希望 Mahesh 從第一性原理中推導出 2025 年的稅法,我需要的是領域專家那種穩定、可靠的執行力。
這里可以做個類比:AI Agent = 智商 300 的 Mahesh,極其聰明,在深度引導下能做出驚人成績,但在起步階段往往缺乏關鍵的背景信息。
你想要的理想狀態 = Barry:擁有領域專家的穩定、可靠執行力,無需從頭推導就能給出專業答案。
想要達到理想狀態,AI Agent 暴露出有三個缺陷:
無法高效吸收你的專業經驗
無法隨時間自我進化
起步階段缺乏關鍵背景信息
這也是 Skills 誕生的原因。
在分享解決方案之前,Barry 和 Mahesh 先回顧了 Anthropic 內部的三個關鍵認知轉變。這些認知是理解 Skills 設計的基礎。
三大關鍵認知
認知 1:"代碼即一切"
過去的認知:
不同領域的 AI Agent 在架構上會大相徑庭
需要各自的工具鏈和底層腳手架
每個用例、每個領域都要獨立開發一個 AI Agent
在開發 Claude Code 后,團隊意識到:
代碼不僅是應用場景,更是通往數字世界的通用接口
底層 Agent 邏輯比預想中更具通用性
舉個例子,生成一個財務報告,讓我們看這個任務具體的任務分解:
調用 API 抓取數據
在文件系統整理資料
用 Python 分析數據
合成特定格式報告
底層僅需:Bash 環境 + 文件系統
結論:底層核心架構可以極其精簡,但擴展性極強。
認知 2:文件是最佳協作單元
Skills 的本質:文件的有序集合(就是一個個文件夾)
Skills 是文件的有序集合,它為 AI Agent 打包了可組合的過程性知識。通俗點說,它們就是一個個文件夾。
為什么選擇文件作為 Skills 的載體?為什么選擇如此"原始"的形式? Anthropic 團隊有 3 大設計理念:
1. 普適性
任何擁有電腦的人都能創建和使用
開發者可以用
AI Agent 自己也可以用(這點很關鍵)
2. 兼容性
完美融入現有工作流:
用 Git 做版本控制
存在 Google Drive
打包分享給團隊
3. 永恒性
幾十年來,文件一直是最基礎的協作單元,既然好用,為何要改變呢?選擇文件作為載體,工具生態成熟,學習成本為零,遷移成本為零。
認知 3:代碼勝過傳統工具定義
這也是最關鍵的一個認知。
傳統工具定義的四大缺陷:
指令含糊不清
無法自我修改:模型執行受阻時陷入"冷啟動"困境
持續占用上下文:定義會一直占用上下文窗口空間
缺乏靈活性
相比之下,代碼的三大優勢:
自文檔化:代碼本身就是最好的說明
可隨時修改:AI 可以自己優化工具
按需加載:平時存儲在文件系統,僅在需要時調用
舉個例子:Claude 經常重復編寫相同的 Python 腳本來調整幻燈片樣式,每次都要重新編寫,浪費 tokens,質量不穩定。
現在給個解決方案:讓 Claude 將這段腳本保存為一項 Skill,現在只需直接運行腳本即可,效率和一致性大幅提升將"重復勞動"轉化為"可復用知識"。
Skills 系統架構設計
1. 核心組成
Skills 包含什么?
Markdown 文件(核心指令)
軟件包
可執行文件和二進制文件
腳本
各類資產
復雜度演進:
初期:簡單的 Markdown 文件(幾分鐘完成)
現在:綜合體(需數周甚至數月精耕細作)
![]()
2. 逐步披露策略
當你擁有成百上千個 Skills 時,出現一個問題:如果全部加載到上下文窗口,會瞬間耗盡 tokens。因此,Anthropic 采用了一個逐步披露策略。
如何實現?運行時流程:
初始狀態:模型只看到 Skills 元數據
需要使用時:AI Agent 讀取 SKILL.md 文件
獲取:核心指令 + 目錄索引
效果是,即使擁有成千上萬個 Skills,系統依然高效。
舉個例子:假設一個 AI Agent 擁有 500 個 Skills,
初始狀態:
Context window:僅包含 500 個 Skills 的元數據
占用空間:約 5-10K tokens
用戶請求:"幫我生成一份銷售報告"
執行流程:
Agent 掃描元數據 → 識別出 "sales_reporting" Skill
加載 sales_reporting/SKILL.md → 讀取核心指令和文件結構 → 占用空間:約 1-2K tokens
按需加載具體腳本 → 讀取 generate_report.py → 讀取 format_template.json → 執行完畢后從 context 中清除
這種設計的好處是支持成千上萬個 Skills ,上下文窗口消耗始終可控,不需要的 Skills 不占用空間 ,可以動態組合多個 Skills ,支持復雜的工作流編排。
![]()
統一架構模型
經過一年的探索,Anthropic 觀察到一個趨勢:通用 AI Agent 的架構正趨于統一。
新興通用 AI Agent 架構的四大組件:
Agent Loop:職責是大腦,理解用戶意圖、規劃執行步驟、管理上下文窗口、決定何時調用哪些工具或 Skills。
運行時環境:執行環境,提供代碼執行能力、管理文件系統、處理進程隔離和安全。
MCP:負責外部世界的物理連接,連接外部 API、訪問數據庫、調用第三方服務。
Skills:職責是知識與經驗,提供靈魂(專業知識),包含領域專業知識、最佳實踐、過程性經驗等。
兩者完美互補,形成完整生態。
![]()
Skills 生態三大類別
自發布以來,Skills 生態已經擁有數千項 Skills,主要分為 3 大類。
1. 基礎 Skills
賦予 AI Agent 全新的通用能力或領域能力。
案例:
Document Skills:創作和編輯專業辦公文檔,支持 Word、PPT、Excel 等格式,理解文檔結構和業務邏輯,讓 Claude 具備創作和編輯專業辦公文檔的能力。
基礎 Skills 擴展了模型的基礎能力邊界,就像為操作系統增加新的系統調用。
2. 第三方 Skills
讓 Claude 更好地適配第三方產品和服務。
案例:
Cadence - 科學研究 Skills:使 Claude 在 EHR 數據分析上表現遠超原生模型,熟練應用 Python 生物信息庫。
Browserbase - Stagehand Skills:為開源瀏覽器自動化工具構建專屬 Skills,讓 Claude 更熟練地操控瀏覽器。
Notion - 工作空間 Skills:深度理解用戶的 Notion 工作空間,進行跨文檔研究。
3. 企業私有 Skills
最令人興奮的應用場景,針對公司特定場景構建的 Skills。
典型用例:
傳授組織最佳實踐:將公司獨特的工作方法編碼為 Skills,讓新來的 AI 立即理解公司文化,按規矩辦事。
內部軟件培訓:教會 AI 如何使用公司特有工具,讓 AI 像老員工一樣熟悉內部系統。
代碼規范遵循:讓 Claude Code 遵循內部代碼風格和工作流,代碼一致性大幅提升。
![]()
Anthropic 的工程師觀察到的三大趨勢
趨勢 1:非技術人員也在構建 Skills
來自以下領域的專業人士正在創建 Skills:有財務部門、招聘團隊、會計師事務所、法律顧問。Skills 讓 AI Agent 變得觸手可及,即使不擅長編程也能讓 AI 適配日常工作。
趨勢 2:Skills 與 MCP 形成完美互補
開發者正在利用 Skills 編排多個 MCP 工具的工作流
分工明確:MCP 負責連接,專注于"能不能",MCP 開發者不需要了解所有業務場景。Skills 負責智慧和業務邏輯,專注于"該不該"和"怎么做",Skills 創建者不需要處理底層連接細節。
N 個 MCP Servers × M 個 Skills,靈活性遠超單一工具。
趨勢 3:Skills 日益復雜化
從簡單 Markdown 到包含多種資產的綜合體,開發周期從幾分鐘到數周/數月。為什么復雜化是好事?說明 Skills 開始承載真實業務邏輯,生態走向成熟。
Anthropic 內部應用成果
在分享中, Anthropic 工程師還介紹了公司內部的垂直領域落地案例。在 Skills 功能發布后,Anthropic 緊接著推出了兩個專業方案:
金融服務專業方案
生命科學專業方案
實現方式:預裝 MCP 服務器 + Skills 包 → Claude 立即成為領域專家助手。傳統方式開發垂直領域 AI 需要 6-12 個月,Skills 方式配置垂直領域 AI 僅需數周。不只可以快速迭代和調整,Skills 還可以跨場景使用。
Skills 未來探索的四大方向
1. 軟件工程化管理
需求:像對待軟件一樣對待 Skills
具體措施:
引入測試與評估機制
開發更好的觸發工具(確保正確時間觸發正確 Skills)
建立輸出質量衡量標準
完善版本控制系統
2. Skills 依賴關系管理
目標:讓 Skills 可以引用其他 Skills、MCP 服務器或環境包
價值:
AI Agent 在復雜環境下行為更可控、更精準
通過多 Skills 組合,激發處理高級任務的潛力
3. 共享與分發生態
愿景:企業內部擁有由員工與 AI 共同維護、不斷進化的能力知識庫
復利效應:企業內部能力知識庫的不斷進化。
4. 持續學習
核心突破:Skills 是邁向持續學習的具體步驟
記憶具象化:
過去:信息的堆砌
現在:針對特定任務的過程性知識
學習可能性:標準化格式保證:Claude 記錄的任何經驗都能被未來的自己高效繼承。
靈活優勢:隨著合作時間增加,瞬間習得新能力,根據需求不斷優化,果斷舍棄過時操作。
終極目標
"與你共事 30 天后的 Claude,表現應當遠優于第 1 天。"
當前進展:Claude 已可利用 Skill Creator 自動生成 Skills。
Skills 的定位
讓每個人都能通過簡單的文件夾,將創意與專業知識轉化為解決現實問題的力量。
Anthropic 的工程師表示,Skills,只是這場變革的起點。Skills 系統,通過極簡的文件格式,解決了 AI Agent 缺乏領域專業知識的核心痛點,并構建了一個開放、可組合、可進化的生態系統。AI 持續學習,讓專業經驗自由流動,讓組織知識的永久沉淀。
真正的價值不在于構建更聰明的 AI,而在于讓 AI 具備可復用、可積累、可共享的專業經驗。這才是 AI Agent 走向實用的關鍵路徑。
| 文章來源:數字開物
? END ?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.