<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      請立刻升級你的所有Skills

      0
      分享至

      我所有的 skills 都是與 Agent 溝通清楚需求之后由 Anthropic 的 skill-creator 創(chuàng)建的

      最近 anthropic 官方更新了skill-creator模板


      https://github.com/anthropics/skills/tree/main/skills/skill-creator

      這兩天我重新刷了一遍 Anthropic 的 Skills 相關文檔(居然有中文版),明顯感覺:Skills 不再只是一個小功能,而是在被當成 Claude 的核心能力層來建設。


      https://code.claude.com/docs/

      Anthropic 還有一個公開課,可以說把 Agent 相關內容事無巨細將透徹了(本身很多 AI Agent 概念就是 A 社發(fā)明的),市面上沒有比這個更好的素材了


      https://anthropic.skilljar.com/

      我先把結論放前面:

      1. Anthropic 已經把 Skills 講得越來越"工程化"了,不再停留在概念層。

      2. GitHub 上的官方skill-creator模板,也已經從"教你怎么寫"升級成"教你怎么評測、迭代、優(yōu)化觸發(fā)效果"。

      3. 如果你正在做個人工作流、團隊知識沉淀、或者 Agent 自動化,現(xiàn)在就是認真做 Skills 的好時機。

      做了一下測試,我常用的文章核心內容設計成高密度 svg 的 skills,本來也在逐步優(yōu)化,但是依然不穩(wěn)定,時常頁面顯示有 bug


      然后我讓最新的 skill-creator 重新設計了這個 svg skills


      同樣輸入,得到的結果就改善不少


      真誠建議:你的所有 Skills 都需要重新做一遍!至少我會逐步全部優(yōu)化一遍

      前面推薦的材料,如果你時間不多,我建議按這個順序看:

      1. 官方集合頁:Features and capabilities

      這是我這次最想推薦的入口頁,集合頁里已經收錄了26 篇能力說明文章,里面不光有 Skills,還有 Artifacts、Web Search、Research、Projects、Memory、Cowork、Excel、PowerPoint 等等。

      最關鍵的是,這個集合頁已經明確提供了簡體中文入口 https://support.claude.com/zh-CN/collections/18031719-%E5%8A%9F%E8%83%BD%E4%B8%8E%E8%83%BD%E5%8A%9B

      尤其不能錯過這一篇::如何創(chuàng)建自定義技能

      2.公開課

      https://anthropic.skilljar.com/

      看前幾個就行了


      3. GitHub 官方 skill-creator(重點推薦!)

      這個版本給我的最大感受是:

      Anthropic 已經默認你做 Skill,不是一次性寫完,而是要反復迭代。

      它里面強調的流程非常像正經產品開發(fā):

      1. 先定義 Skill 想解決什么問題

      2. 再寫草稿

      3. 準備測試 prompt

      4. 跑"帶 Skill"和"不帶 Skill"的基線對比

      5. 看結果、做評估

      6. 改描述、改內容、繼續(xù)迭代

      7. 最后還要做Description 觸發(fā)優(yōu)化

      skill-creator 里最讓我震撼的是它的評測體系。

      不是讓你"看看感覺對不對",而是一套非常工程化的系統(tǒng):

      第一步:基線對比(A/B Test)

      對每一個測試用例,同時跑兩個版本:

      • With-skill:帶著你的 Skill 執(zhí)行

      • Without-skill(或舊版 Skill):不用 / 用舊版執(zhí)行

      兩組任務同時起跑(用 subagent 并行),結果分別存進with_skill/without_skill/目錄。

      這是真正的 A/B Test 思維——不是"我覺得好了",而是"有沒有帶來可量化的提升"。

      第二步:量化斷言(Assertions)

      在測試跑著的同時,給每個用例寫量化斷言——這些斷言是可編程驗證的。比如:

      • 輸出文件里是否包含目錄結構

      • 圖表是否有坐標軸標簽

      • 格式是否符合模板

      好的斷言有兩個特點:客觀可驗證+描述性命名(一眼能看懂在檢查什么)。

      對于那些主觀性強的維度(寫作風格、設計美感),skill-creator 明確說了:不要硬塞斷言,用人工評審。

      第三步:Eval Viewer 可視化評審

      skill-creator 自帶了一個瀏覽器評審工具(eval-viewer/generate_review.py),打開后有兩個標簽頁:

      • Outputs 標簽:逐個展示測試用例的輸入和輸出,你可以直接在里面寫反饋

      • Benchmark 標簽:展示量化數(shù)據(jù)——通過率、用時、Token 消耗,帶均值和標準差

      迭代到第二輪以后,還能看到和上一輪的對比。

      這套評審界面做得真的很用心。Anthropic 在 SKILL.md 里反復強調(甚至用了大寫字母強調):一定要先讓人看結果,再改 Skill!

      第四步:迭代改進

      讀完用戶反饋后,改 Skill,重新跑所有測試用例到新的iteration-N/目錄,再次評審。循環(huán)往復,直到:

      • 用戶滿意

      • 反饋全部為空

      • 改進幅度不再明顯

      skill-creator 甚至還提供了盲評機制——把兩個版本的輸出交給一個獨立的 Agent,不告訴它哪個是新版、哪個是舊版,讓它獨立判斷哪個更好。

      然后再用analyzerAgent 分析贏的那個為什么贏。

      這是不是很像學術論文里的"雙盲評審"?

      Anthropic 把這套方法論塞進了一個 Skill 的創(chuàng)建工具里,格局之大,可見他們對 Skills 生態(tài)的重視程度。

      核心:Description 觸發(fā)優(yōu)化

      這可能是 skill-creator 里價值最高的一個功能。

      它的原理是:

      1. 生成 20 條測試查詢——一半應該觸發(fā) Skill,一半不應該觸發(fā)

      2. 這些查詢不是"讀取 PDF"這種簡單的,而是模擬真實用戶的具體描述(帶文件名、帶背景、帶口語化表達、甚至帶錯別字)

      3. 60/40 拆分:60% 用于訓練,40% 用于驗證(防過擬合)

      4. 每條查詢跑 3 次取穩(wěn)定觸發(fā)率

      5. Claude 根據(jù)觸發(fā)失敗的 case 提出 description 改進建議

      6. 重新評估新 description,最多迭代 5 輪

      7. 最終按驗證集分數(shù)(不是訓練集)選出最佳 description

      這整個流程和機器學習的超參數(shù)調優(yōu)一模一樣。

      迭代改進的四條心法

      skill-creator 里還給出了改進 Skill 時的思維方式,非常值得分享:

      1. 從反饋中泛化:你只在幾個測試用例上迭代,但 Skill 未來要用無數(shù)次。不要過擬合到特定例子上,不要寫死板的 MUST/NEVER,而是用不同思路去解決頑固問題

      2. 保持 Skill 精簡:去掉沒起作用的部分,讀測試過程的完整日志(不只看最終輸出),看看 Skill 有沒有讓 Claude 做了很多無用功

      3. **解釋"為什么"**:不要只告訴 Claude "必須這樣做",而是解釋為什么要這樣做。今天的 LLM 很聰明,理解了 why 比記住 what 更有效

      4. 發(fā)現(xiàn)重復模式:如果多個測試用例中 Claude 都獨立寫了類似的輔助腳本,那就說明這個腳本應該被打包進 Skill 的scripts/目錄,省得每次重新發(fā)明輪子

      但這次官方文檔反復在強調一個更準確的視角:

      Skill 是把你的流程、標準、語氣、工具使用方式,封裝成 Claude 在合適時機主動調用的能力。

      這里最重要的不是"內容多不多",而是兩個字:

      觸發(fā)。

      官方文檔這次明確強調,description不是裝飾字段,而是 Claude 判斷"什么時候該用這個 Skill"的核心依據(jù)。

      GitHub 上的skill-creator甚至直接建議:描述要寫得更明確、更主動一點,避免 Skill 該觸發(fā)的時候不觸發(fā)。并且它還給出了一套完整的Description 優(yōu)化流程——自動生成測試查詢、拆分訓練集和驗證集、跑 3 次取穩(wěn)定觸發(fā)率、迭代 5 輪找最優(yōu) description,這和機器學習調參一個思路。

      這個細節(jié)非常關鍵。

      因為現(xiàn)實里最好用的 Skill,往往不是寫得最長的那個,而是觸發(fā)最準的那個。

      skill-creator 還揭示了一個很多人不知道的觸發(fā)機制:Claude 對簡單任務不會觸發(fā) Skill。如果它自己就能處理(比如"讀這個 PDF"),它不會去查 Skill。只有復雜的、多步驟的任務才會激活觸發(fā)邏輯。這意味著你測試 Skill 的時候,用過于簡單的 prompt 是測不出來的。

      2. 官方開始鼓勵"小而專"的 Skill 設計

      幫助中心里有一句我很認同,大意是:

      不要把所有東西都塞進一個大 Skill 里,多個聚焦的小 Skill,組合起來反而更強。

      這個思路和寫程序很像。

      函數(shù)越單一,越容易復用,越容易測,越不容易崩。

      Skill 也是一樣。

      比如你可以拆成:

      • 一個負責"技術文章撰寫"

      • 一個負責"PDF 翻譯"

      • 一個負責"本地視頻轉錄"

      • 一個負責"Obsidian 筆記歸檔"

      這些 Skill 單獨看都不復雜,但一旦 Claude 能根據(jù)場景自動組合,威力就很大。

      3. 安全被提到了正式位置

      這次官方文檔還專門單獨列了安全注意事項。

      比如:

      • 不要把 API Key、密碼之類敏感信息硬編碼到 Skill 里

      • 下載別人的 Skill 之前先審查內容

      • 如果要訪問外部服務,優(yōu)先走合適的 MCP 連接

      如果你現(xiàn)在就想開始做 Skills,我建議這么干 第一步:只挑高頻、重復、標準化的任務

      比如這些就很適合:

      • 根據(jù)幾個固定鏈接寫技術文章

      • 固定格式總結會議紀要

      • 讀取 Obsidian 某類筆記并輸出周報

      • 把一份 PDF 翻成中文并保留版式

      • 根據(jù)一篇文章生成短視頻口播稿

      這些任務有一個共同點:

      步驟清楚,產出穩(wěn)定,重復率高。

      這類任務最值得先做成 Skill。

      第二步:先把觸發(fā)描述寫對

      這是很多人最容易忽略的地方。

      一個好 Skill 的描述,至少要說清楚三件事:

      1. 它解決什么問題

      2. 用戶在什么語境下提到它時應該觸發(fā)

      3. 最終輸出大概是什么

      如果這三點寫不清楚,Claude 很可能就"知道有這個 Skill,但就是不用"。

      第三步:資源外置,不要把所有東西都堆在 SKILL.md 里

      官方現(xiàn)在推薦的結構已經很清楚了:

      my-skill/
      ├── SKILL.md
      ├── scripts/
      ├── references/
      └── assets/

      這個結構的好處非常直接:

      • SKILL.md負責規(guī)則和入口

      • scripts/負責確定性執(zhí)行

      • references/負責大塊知識

      • assets/負責模板和素材

      說白了,就是讓 Skill 既能"會說",也能"會干活"。

      第四步:一定要做基線對比

      這點是 GitHub 官方skill-creator給我的最大啟發(fā)。

      很多人做完 Skill,你至少要看兩件事:

      1. 帶 Skill 和不帶 Skill,輸出到底差了什么

      2. Skill 觸發(fā)率、穩(wěn)定性、結構一致性有沒有提升

      如果沒有明顯提升,那這個 Skill 可能只是讓你心理安慰更強了,并沒有真正提升生產力。

      具體怎么做?skill-creator 給出了一套可操作的方法:

      • 準備 2-3 個真實場景的 prompt——不是"幫我寫個報告"這種籠統(tǒng)的,而是帶有具體背景、具體文件、具體要求的

      • 同時執(zhí)行帶 Skill 和不帶 Skill 的兩組任務

      • 寫量化斷言:輸出里是否包含某個結構、格式是否一致、關鍵信息有沒有遺漏

      • 用 eval viewer 可視化對比:通過率、Token 用量、耗時一目了然

      • 記錄每一輪迭代:存到iteration-1/iteration-2/目錄,跟蹤改進趨勢

      聽起來麻煩?其實不用自己折騰。直接在 Claude Code 里用 skill-creator,它會自動幫你跑完這一套。

      最后一句

      我越來越覺得,2026 年做 AI 提效,真正的分水嶺已經不是"會不會寫 Prompt"了。

      而是你有沒有能力把自己的工作流,沉淀成一套可以復用、可以組合、可以迭代的 Skills。

      Prompt 是一次性的。

      Skill 才是資產。

      skill-creator 的 SKILL.md 里有一句話讓我印象很深:

      This task is pretty important (we are trying to create billions a year in economic value here!) and your thinking time is not the blocker; take your time and really mull things over.

      "思考時間不是瓶頸,認真想清楚才是關鍵。"

      這句話不只是說給創(chuàng)建 Skill 的 Claude 聽的,也是說給我們每一個用 AI 的人聽的。

      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      看了沙特的海水淡化技術,再看中國海水淡化技術,才懂差距有多大

      看了沙特的海水淡化技術,再看中國海水淡化技術,才懂差距有多大

      原夢叁生
      2026-03-11 04:20:45
      豐特:我們短期內不可能簽哈蘭德,我相信10年合同很難履行完

      豐特:我們短期內不可能簽哈蘭德,我相信10年合同很難履行完

      懂球帝
      2026-03-12 21:10:11
      “從西海岸外的不明船只發(fā)射無人機”,F(xiàn)BI:伊朗或突襲美國本土!特朗普:現(xiàn)在只能走一步看一步!此前有人穿伊朗元素衣服槍擊,致3死14傷

      “從西海岸外的不明船只發(fā)射無人機”,F(xiàn)BI:伊朗或突襲美國本土!特朗普:現(xiàn)在只能走一步看一步!此前有人穿伊朗元素衣服槍擊,致3死14傷

      每日經濟新聞
      2026-03-12 15:16:04
      TA:巴爾韋德難以理解阿隆索的戰(zhàn)術要求,新帥要求沒那么復雜

      TA:巴爾韋德難以理解阿隆索的戰(zhàn)術要求,新帥要求沒那么復雜

      懂球帝
      2026-03-12 11:25:06
      連續(xù)5主場!火箭迎甜蜜賽程!9天5戰(zhàn),僅1個背靠背,穩(wěn)守西部前3

      連續(xù)5主場!火箭迎甜蜜賽程!9天5戰(zhàn),僅1個背靠背,穩(wěn)守西部前3

      熊哥愛籃球
      2026-03-12 18:56:08
      這一仗徹底打醒中國!美軍的狠毒的作戰(zhàn)方式,中國已徹底摸清

      這一仗徹底打醒中國!美軍的狠毒的作戰(zhàn)方式,中國已徹底摸清

      壹知眠羊
      2026-03-12 07:24:23
      以為是假新聞其實是真新聞,從袁立到王星,件件離譜又驚人

      以為是假新聞其實是真新聞,從袁立到王星,件件離譜又驚人

      上官晚安
      2026-01-06 08:08:35
      范元甄:與江青齊名的延安四美之一,嫁主席秘書,卻輸?shù)袅艘簧?>
    </a>
        <h3>
      <a href=干史人
      2026-03-05 21:06:35
      德日急眼了:我們壟斷全球100年的磨鏡技術,如今卻被云南干翻了

      德日急眼了:我們壟斷全球100年的磨鏡技術,如今卻被云南干翻了

      大魚簡科
      2026-03-11 10:02:36
      向佐踢主持人后續(xù)!百克力回應,確實有不爽,曝對方私下真實人品

      向佐踢主持人后續(xù)!百克力回應,確實有不爽,曝對方私下真實人品

      離離言幾許
      2026-03-12 16:53:51
      裁判幫倒忙!東道主遇大麻煩,中國女足仁至義盡,朝鮮隊偷著樂

      裁判幫倒忙!東道主遇大麻煩,中國女足仁至義盡,朝鮮隊偷著樂

      籃球看比賽
      2026-03-12 10:55:08
      73年一男子來成都軍區(qū),被拒絕后拿出一封信,秦基偉:速速來見我

      73年一男子來成都軍區(qū),被拒絕后拿出一封信,秦基偉:速速來見我

      浩舞默畫
      2026-03-11 10:52:24
      心定向陽,方見真情:解鎖女性情感里的最柔軟底色

      心定向陽,方見真情:解鎖女性情感里的最柔軟底色

      青蘋果sht
      2026-03-10 05:21:56
      世界第一女巨人來自中國安徽,穿78碼的鞋子,一頓飯吃六碗炒面

      世界第一女巨人來自中國安徽,穿78碼的鞋子,一頓飯吃六碗炒面

      流史歲月
      2026-02-25 14:05:05
      網購羅技鼠標:到貨拆開卻是一包白色粉末!所幸拍了開箱視頻

      網購羅技鼠標:到貨拆開卻是一包白色粉末!所幸拍了開箱視頻

      快科技
      2026-03-11 16:05:39
      NBA季后賽球隊最差勁的隊友群 2006年科比身邊到底是一群什么人?

      NBA季后賽球隊最差勁的隊友群 2006年科比身邊到底是一群什么人?

      籃球小煙花
      2026-03-12 08:00:05
      前AC米蘭球員:穆帥曾想讓我回羅馬,我沒有與羅馬每個人都不和

      前AC米蘭球員:穆帥曾想讓我回羅馬,我沒有與羅馬每個人都不和

      福醬的小時光
      2026-03-12 18:23:23
      34人領刑!朱立倫這回把鄭麗文坑慘了,盧秀燕卻穩(wěn)穩(wěn)掌權藍營

      34人領刑!朱立倫這回把鄭麗文坑慘了,盧秀燕卻穩(wěn)穩(wěn)掌權藍營

      阿天愛旅行
      2026-03-12 15:28:04
      微信又出新功能,網友:太實用了!

      微信又出新功能,網友:太實用了!

      學申論的談妹
      2026-03-12 20:53:32
      以色列掐斷中東電網,卻帶火了中國神器!深圳這幫搞電池的太牛了

      以色列掐斷中東電網,卻帶火了中國神器!深圳這幫搞電池的太牛了

      樂天閑聊
      2026-03-09 21:52:00
      2026-03-12 22:23:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3266文章數(shù) 11092關注度
      往期回顧 全部

      科技要聞

      當養(yǎng)蝦人開始卸載,大廠的戰(zhàn)爭才真正開始

      頭條要聞

      伊朗最高領袖:不會放棄復仇 霍爾木茲海峽將繼續(xù)關閉

      頭條要聞

      伊朗最高領袖:不會放棄復仇 霍爾木茲海峽將繼續(xù)關閉

      體育要聞

      建議將“出球型門將”納入反詐app

      娛樂要聞

      田亮一家新年全家福!森碟變清純少女

      財經要聞

      盧鋒:從特朗普團隊群演看時代變局

      汽車要聞

      大眾2025財報:轉型雖有陣痛 "大象"已然起跑

      態(tài)度原創(chuàng)

      健康
      家居
      房產
      手機
      教育

      轉頭就暈的耳石癥,能開車上班嗎?

      家居要聞

      觸感本真 家的跡象

      房產要聞

      唏噓!三亞又一房企巨頭破產,狂欠43億甩賣資產!

      手機要聞

      摩托羅拉Edge 70 Fusion+手機發(fā)布,搭載驍龍7s Gen 4

      教育要聞

      率先啟動!一區(qū)2026初中入學登記已開始

      無障礙瀏覽 進入關懷版