<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<u id="tfd8w"></u>

<sup id="tfd8w"></sup>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Claude悄悄更新了Skills生成器，這絕對是一次史詩級升級。

2026-03-11 10:09:13　來源: 數字生命卡茲克

天津舉報

0

分享至

　　上周直播的時候，發現Anthropic的skills倉庫居然有更新了。

　　點進去一看，然后居然發現了一個超級剛需的Skills迎來了更新。

　　就是這個，甚至可以說是整個Skills生態的基石。

　　Skill-creator。

　　可以說，現在小龍蝦的能力能這么強，有一半的原因都要歸功于Skills，而這些Skills能被創造出來，幾乎都要歸功于這個母Skills，Skill-creator。

　　我相信，任何一個看過我們過去關于Skills的文章，或者玩過Skills的朋友，都絕對不可能對這個Skill-creator陌生。

　　簡單總結就是，這是Anthropic官方出的Skills生成器。

　　你可以用嘴描述出你的需求，然后直接用Skill-creator，幫你做成一個Skill。

　　如果有不了解的，可以去看一下我們過去的這一篇文章：自認為寫的還是比較詳細的。

　　這周終于有時間，詳細翻了一下這次更新的Skill-creator的文檔，然后發現，這次真的可以說，是史詩級更新也不為過，強了太多太多了。

　　

　　所以我覺得，值得寫一篇文章，來給大家聊聊，這次Skill-creator更新的新特性和新功能。

　　真的，所有的skills，都值得重新優化一遍。

　　非常簡單的說，這次他們一口加了4個全新的能力，分別是：

　　1. 評估系統，跑完直接告訴你這個skill到底行不行。

　　2. 基準測試，把通過率、耗時、token用量，全都量化。

　　3. 多代理并行測試，每個測試在干凈的環境里獨立跑，支持A/B盲評，結果不互相污染。

　　4. 描述調優，可以自動幫你改skill描述，該觸發的觸發，不該觸發的就別亂觸發。

　　之前的Skill-creator其實一直有個痛點，就是你生成完的Skills，其實是個黑盒，你完全不知道，這個Skills到底好不好用，它的質量怎么樣，它的觸發機制合不合理。

　　用我們現代經常提的工業化體系來說，就是缺少了一個很重要的東西，評估機制。

　　評估太重要了，一個好的評估，是真的可以引領方向的。

　　而現在，新版的Skill-creator，直接把整個評估體系，全都補上了。

　　我極力推薦大家，一定要更新到最新版。

　　更新方式也究極無敵簡單，你直接把這段話，發給你的Agent就行，無論是Claude code、OpenClaw、OpenCode等等等等：

　　https://github.com/anthropics/skills/tree/main/skills/skill-creator，這個skills更新了，幫我更新到最新版本

　　對，就這么一句話。

　　然后你的Agent，就會自己去更新了。

　　

　　很快，就更新完了。

　　

　　我用一個案例，來給大家演示一下新版Skill-creator的能力。

　　在之前有一篇文章中，我把Github上的yt-dlp做成了一個Skill，能從YouTube、B站等各種視頻網站下載視頻。

　　

　　但其實我們后來發現，光能下載視頻還不夠。

　　我還希望拿到視頻鏈接之后，能直接生成文字版的講稿。

　　而且如果是英文或其他語言的視頻，最好能直接給我中英雙語的講稿文檔。

　　所以正好，借著這個機會，我就用skill-creator又搓了一個新skill。

　　提示詞很簡單。

　　我想創建一個skill，我希望能夠實現我給了一個視頻鏈接，它能夠把文字版的講稿發給我，如果是別的語言，最好是把原語言版和中文版的講稿文檔給我。

　　它會先問你幾個問題，確認需求細節，然后開始幫你設計整個skill。

　　

　　大概3到5分鐘，這個Skill就設計完了。

　　我拿一個OpenClaw創始人的YouTube訪談視頻來試一下。

　　

　　就給了一個YouTube的鏈接。

　　五分鐘后，中文版的講稿就出來了。

　　

　　但是，其實有個問題。。。

　　這一大坨文字堆在一起，字又小又擠。

　　根本沒法看。

　　這時候你就可以繼續對話，讓它給你優化，幫你改進這個skill。

　　

　　新版的Skill-creator，在改進的能力上，也有一些提升。

　　改進之后的效果：

　　

　　幾乎完美。

　　排版清晰，段落分明，這才像個文檔該有的樣子。

　　但這還沒完。

　　但這個時候，一個頭疼的問題就來了，我害怕我的skills觸發會打架。

　　因為我現在有兩個skill都跟視頻鏈接相關。

　　一個是yt-dlp，負責下載視頻到本地。

　　一個是剛做的講稿生成，負責把視頻轉成文字。

　　兩個skill的觸發條件都是給一個視頻鏈接，我害怕他們會打架，就是出現該觸發的不觸發，不該觸發的亂觸發。

　　那就可以使用Skill-creator的評估體系了，讓它來幫你，進行優化skill描述。

　　它受會先讀取你當前skill的描述，然后告訴你接下來要做四件事：

　　

　　自動生成兩組查詢，應觸發的10條和不應觸發的10條。

　　設計得很有意思。

　　故意把邊界情況都擺進去，逼模型在模糊地帶做判斷。

　　

　　然后，直接生成了一個網頁，讓你確認，特別牛逼。

　　真的，我用到的時候都驚呆了。

　　

　　所有查詢排在界面里，每一條右邊有個開關，標著是否應該觸發。

　　你可以逐條看一遍，覺得哪條判斷不對，直接關就行。

　　打個比方，第三條這種情況，我不想讓它再觸發了，我就直接讓它關掉就行。

　　

　　然后還有不應該觸發的10條，我看了一遍，沒啥問題。

　　

　　所有的都確認之后，這時候，你點導出評估集，就完事啦。

　　確認完樣本之后，優化循環會在后臺啟動，最多跑5輪迭代。

　　每一輪做三件事來幫你進行測試和評估，整個過程大約需要10-20分鐘。

　　

　　它害會定期匯報進度。

　　跑完之后就是你就能看到一個巨型表格。

　　

　　每一列是一個查詢樣本，每一行是一個迭代版本的描述。

　　綠色勾對勾表示觸發成功，紅色叉×表示沒觸發。

　　

　　藍色列是測試集，其余是訓練集。

　　

　　它把樣本分成60%訓練集和40%測試集，在訓練集上迭代優化，最終用測試集上的表現來選，防止過擬合。

　　跑完之后，最優的描述會自動寫回你的SKILL.md，全程不用你動手。

　　Anthropic官方在自己6個文檔類skill上測了一下，5個觸發率都有提升。

　　僅僅就用新版的skill-creator優化了一下，真的很牛逼。

　　

　　通過這一步，能大大提升你的Skills的觸發準確率。

　　但觸發對了，并不等于OK。

　　所以，你的Skill裝上并且能穩定觸發之后，到底在實際任務上表現如何，這個能力，也還要評估一下。

　　我就繼續拿這個剛做好的skill來跑一遍，帶你大家看看整個過程。

　　直接對剛剛那個skill進行一下評估。

　　

　　它會先把你的skill文件完整讀一遍，搞清楚這個skill的核心流程是什么。

　　

　　然后它會問你：你更想測哪個方面？

　　我選了全面評估。

　　它根據skill的功能，自動設計了三類測試場景，同時設計了量化驗收標準。

　　

　　確認方案之后，它一次性啟動了4個獨立子代理，同時跑。

　　

　　這次4個并行的Agent來進行測試，就很香了。

　　以前其實你也可以做一些簡單的評估，但是，最大的問題，就是會按順序跑，一個跑完再跑下一個。

　　但是大家都知道，上下文管理有多重要，前一個任務積累的上下文，會污染后一個的結果。

　　你以為是skill的功勞，但，其實完全是對話歷史幫了忙。

　　這次的評估，就對味了很多。

　　每個代理都在完全干凈的環境里獨立運行，有自己的token 計數和時間指標。

　　互相之間零交叉。

　　結果更快，數據更干凈。

　　等待的時候，它也順手就把量化評分腳本也準備好了。

　　等測試結果回來之后，就直接自動檢查格式是否符合要求，很多小細節全都在里面。

　　

　　測試跑完，瀏覽器會里彈出評估查看頁面，有兩個標簽頁。

　　輸出標簽頁，可以直接看每個測試用例的輸出。

　　下面還有一個反饋框，你可以直接標注哪里不對、哪里需要改進。

　　這些反饋會被存起來，下次改進skill的時候直接用。

　　

　　另一個是基準測試標簽頁，可以看有skill vs 無skill。

　　通過量化對比，一目了然。

　　

　　數據這塊，也是極度量化。

　　

　　有skill的通過率100%，無skill基線9%，差值91.5%。

　　費用上，有skill每次大約4000token，無skill1750token，差了2250。

　　但這是skill帶來的額外消耗，對比產出的結果，值得。

　　但評估的價值遠不止于此。

　　Anthropic官方也舉了個例子。

　　他們有個PDF skill，之前在處理表格時會出錯。

　　Claude需要把文字精確的放在特定坐標上，但因為沒有明確的字段做引導，經常放歪。

　　這個問題在評估過程中被發現，再進行修復改進定位邏輯后，問題就解決了。

　　

　　也就是說，找到問題之后不用從頭來過。

　　評估結果會存在本地，下次你用skill-creator改進這個skill的時候，它會把上次標注的問題直接帶進去，針對那里改。

　　改完再跑一遍評估，看有沒有提升。

　　測試、發現、修、再測，這個循環是完整的。

　　Anthropic把軟件開發的一些嚴謹做法，比如測試、基準、迭代改進等等，這次引入Skills的創作流程。

　　真的，牛逼太多了。

　　這絕對對于所有人來說，都是一個史詩級增強。

　　你要知道，小龍蝦為什么那么強，能做那么多的事，其實真不是因為他本身有多牛逼，純粹是因為，它身上掛的SKills，太多了，那都是一個一個的技能包。

　　可以說，Skills，就是整個Agent未來大繁榮生態的基石，而我自己，也一直極力的看好和強力推廣各種各樣的Skills。

　　所以，我極度建議，大家把Skill-creator更新到最新版，然后把你自己所有的Skills，都進行優化和評估一遍。

　　當然，你得先分清楚，你寫的Skills是哪種。

　　因為本質上，Skills其實分兩種。

　　第一種是能力提升型。

　　就是教Claude做它本來不擅長的事。

　　比如官方的前端設計skill、文檔創建skill，里面寫了大量技巧，是你光靠Prompt根本拿不到的效果。

　　我們大多數人自己搓的skill，基本也都是這類。

　　第二種官方叫編碼偏好型。

　　就是告訴Claude按你的規矩來。

　　Claude本身每一步都能做，但你的skill把這些步驟按你團隊的流程串起來了。

　　比如一個會議紀要整理skill，按你們公司固定的格式，自動把錄音轉成帶行動項的文檔。

　　或者一個周報生成skill，從各個平臺里拉數據，按你要的格式排好。

　　你可以把這種，理解成一個Workflow，就是一個工作流。

　　對這兩種類型，評估的方向會稍微不太一樣。

　　對于能力提升型，測的是模型更新之后這個skill還有沒有存在的必要。

　　用A/B測試對比，有skill和沒skill各跑一次。

　　結果如果差不多，這個skill就可以退休了。

　　

　　編碼偏好型測的是另一件事，它有沒有老老實實按你的流程走？

　　有沒有漏步驟？有沒有自作主張改了順序？有沒有忘了你特別說過的某個要求？

　　所以會稍稍有一些區別，這個大家在自己評估的時候，可以注意一下。

　　回頭想想，以前造完一個skill，其實也就是自我感覺良好。

　　但說實話，全是黑盒，根本不知道該怎么評估。

　　現在就舒服多了。

　　評估跑一遍，數據擺出來，好不好用，一眼就見真章。

　　所有的Skills，真的都值得重新優化和評估一遍。

　　Skills生態。

　　感覺又要迎來一波大繁榮了。

　　以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

　　>/ 作者：卡茲克、可達

　　>/ 投稿或爆料，請聯系郵箱：wzglyay@virxact.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenAI徹底重構Codex！長出獨立鼠標，自己排班狂卷打工人

新智元 2026-04-17 14:43:06
0 跟貼 0
Claude Opus 4.7深夜上線，評分碾壓

機器之心Pro 2026-04-17 10:08:00
1 跟貼 1

從越用越便宜到越用越貴，誰在為AI的“算力饑渴”買單？

鈦媒體APP 2026-04-17 13:32:25
0 跟貼 0

Claude Opus 4.7深夜炸場！勝任更長任務、自主檢查，視覺能力拉滿

智東西 2026-04-17 12:08:22
1 跟貼 1
這個 pubmed 插件自帶全文下載通道，校外可用

生物學霸 2025-10-31 17:26:22
0 跟貼 0

DeepSeek悄悄更新：Mega MoE、FP4 Indexer來了

機器之心Pro 2026-04-17 11:12:13
7 跟貼 7

從能力到商品：Skills市場正在重塑開發者的生產方式

36氪 2026-03-20 10:24:05
31 跟貼 31
AI視頻混戰升級，字節在模型之外加了道防線

鈦媒體APP 2026-04-16 19:28:13
1 跟貼 1

用好Agent最重要的技巧不是Skills，是這四個字

數字生命卡茲克 2026-04-14 10:14:57
2 跟貼 2
Lovart 又上新了，我做出了10年前就想做的動畫！

新浪財經 2026-04-17 17:08:59
0 跟貼 0
日更地圖？這家游戲公司把玩家逼成質檢員

碼上閑敘 2026-04-15 18:18:36
0 跟貼 0
D&D跑團10年，DM最恨的"加一附魔劍"終于被AI干掉了

字節漫游指南 2026-04-13 17:38:40
0 跟貼 0
兔子牙齒像剪刀一樣鋒利，女生拿它來標簽，兔子：剪刀買不起嗎？

蛋蛋說笑 2026-04-15 16:03:07
3 跟貼 3
間諜策反中企員工致項目停工停產國安機關披露詳情

極目新聞 2026-04-17 07:00:50
9779 跟貼 9779
不裝了我就是你的后臺

艾瑪影視匯 2026-04-17 16:25:46
2 跟貼 2
段曉天以為羅子君沒有后臺，肆無忌憚的欺負

熊樣動漫 2026-04-17 08:48:52
0 跟貼 0
有人把巴菲特芒格煉成AI Agent，Github標星狂攬5w+

量子位 2026-04-15 09:48:11
2 跟貼 2
趙本山春晚后臺崩潰大哭，揭秘《火炬手》幕后故事

涼了時光人 2026-04-16 03:02:05
1 跟貼 1
長文問答準確率大漲 17% 后，Anthropic 把“不亂猜”做成了核心賣點

鈦媒體APP 2026-04-17 11:26:15
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
Claude Code之父，公開Opus 4.7內部使用技巧

智東西 2026-04-17 18:50:21
2 跟貼 2
谷歌隱形水印被失業印度小哥摳掉了

量子位 2026-04-16 13:27:53
0 跟貼 0
Transformer與RNN合體，谷歌打下顯存門檻，解鎖超長上下文

機器之心Pro 2026-04-17 18:31:53
0 跟貼 0
揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
3683 跟貼 3683
XYZ曲線丈量萬億市場：智元給具身智能的演進定了新路徑

雷科技 2026-04-17 21:34:55
0 跟貼 0
π0.7的泛化能力有多強？零樣本純靠口述就能用空氣炸鍋

DeepTech深科技 2026-04-17 21:34:56
0 跟貼 0
馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
30 跟貼 30
單任務狂飆16小時！模型+Harness雙輪驅動，金融Agent跑通了

新智元 2026-04-17 21:12:05
2 跟貼 2
“機器人將改變世界”，廣交會驚喜不斷，再次圈粉全球客商

南方都市報 2026-04-15 20:44:53
0 跟貼 0
剛剛，美國發動史詩級搶劫，無恥的搶到了天量財富！

一個壞土豆 2026-04-17 19:34:56
1 跟貼 1
OpenAI Codex迎來更新：可排班可斷點續跑，還能直接操作Mac應用

智東西 2026-04-17 19:43:05
0 跟貼 0
人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
0 跟貼 0
為證清白瘋狂殺人？邏輯鬼才

喜蕃影視 2026-04-13 15:56:00
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
組裝V8汽車發動機模型

制造科技 2026-04-16 13:26:17
0 跟貼 0
哈佛給AI上萬美刀自主交易，五大頂尖模型誰盈誰虧？

量子位 2026-04-17 17:06:05
0 跟貼 0

絕不向中國低頭！寧愿裁員9000人公司破產，也不接受中國的幫助？

絕不向中國低頭！寧愿裁員9000人公司破產，也不接受中國的幫助？

混沌錄

2026-04-11 15:18:05

上海電影院現場被捉奸，帶情夫當老公面出軌，狗血女主角真容曝光

上海電影院現場被捉奸，帶情夫當老公面出軌，狗血女主角真容曝光

靜若梨花

2026-03-01 16:25:46

坎寧安重獲評獎的受害者！白白損失4000萬，活塞最想看到的結果

坎寧安重獲評獎的受害者！白白損失4000萬，活塞最想看到的結果

你的籃球頻道

2026-04-17 08:08:24

定了！國足第三檔身份參加抽簽，或將進超級死亡之組，出線又懸了

定了！國足第三檔身份參加抽簽，或將進超級死亡之組，出線又懸了

綠茵舞著

2026-04-17 10:30:20

良莠不齊的“莠”不讀yòu，也不讀xiù，常見字，讀錯說不過去！

良莠不齊的“莠”不讀yòu，也不讀xiù，常見字，讀錯說不過去！

未央看點

2026-04-12 00:02:41

雷軍稱油價飛漲開電車省錢：一個月省大幾千還基本不用維護

雷軍稱油價飛漲開電車省錢：一個月省大幾千還基本不用維護

快科技

2026-04-17 09:30:03

卡里克更新多爾古和梅努的情況；記者：若曼聯獲得歐冠資格，夏窗將有更多引援資金

卡里克更新多爾古和梅努的情況；記者：若曼聯獲得歐冠資格，夏窗將有更多引援資金

MUREDS

2026-04-17 23:35:24

德天空：歐足聯將調查球迷沖場致攝影師受傷事件，拜仁可能受罰

德天空：歐足聯將調查球迷沖場致攝影師受傷事件，拜仁可能受罰

懂球帝

2026-04-18 02:07:15

TA：周末邁阿密更衣室發生爭執；球員當天得知馬斯切拉諾辭職

TA：周末邁阿密更衣室發生爭執；球員當天得知馬斯切拉諾辭職

懂球帝

2026-04-17 12:20:00

41歲男子威脅女鄰居發生關系，事后女子為自證清白，讓他再來一次

41歲男子威脅女鄰居發生關系，事后女子為自證清白，讓他再來一次

丫頭舫

2026-04-10 21:54:02

00年以來晉級歐戰4強最多的10位主帥：穆帥12次第1，埃梅里第4

00年以來晉級歐戰4強最多的10位主帥：穆帥12次第1，埃梅里第4

懂球帝

2026-04-18 01:35:20

這是迄今為止，我見過身材最美的女人之一，不接受反駁

這是迄今為止，我見過身材最美的女人之一，不接受反駁

小椰的奶奶

2026-04-11 12:33:07

德國防部因擔心中俄間諜，禁止工作期間使用個人手機

德國防部因擔心中俄間諜，禁止工作期間使用個人手機

阿芒娛樂說

2026-04-18 00:58:13

建國曝汪小菲猛料，全和S家有關，張蘭傻眼，馬筱梅痛哭真相大白

建國曝汪小菲猛料，全和S家有關，張蘭傻眼，馬筱梅痛哭真相大白

萌姐

2026-04-16 22:55:50

歐美盯上廣西！這所學校，成為眼中釘

歐美盯上廣西！這所學校，成為眼中釘

毛豆論道

2026-04-17 19:16:45

姜至鵬：被罰下一人后，我能做的就是在場上多跑一點

姜至鵬：被罰下一人后，我能做的就是在場上多跑一點

懂球帝

2026-04-17 21:53:29

一代飲品傳奇跌落神壇！50億營收化為烏影，21億債務讓它黯然退市

一代飲品傳奇跌落神壇！50億營收化為烏影，21億債務讓它黯然退市

云景侃記

2026-04-17 19:45:22

【2026】星座周運4/20-4/26

【2026】星座周運4/20-4/26

別人都叫我阿螫

2026-04-17 10:07:18

四大核心技術加持！極氪8X正式上市限時32.98萬元起

四大核心技術加持！極氪8X正式上市限時32.98萬元起

CNMO科技

2026-04-17 21:04:05

重慶市委常委羅藺，被查

澎湃新聞

2026-04-17 19:00:15

數字生命卡茲克

反復橫跳于不同的AI領域，努力分享一些很酷的AI干貨

501文章數 626關注度

往期回顧全部

科技要聞

7家頭部平臺被罰沒35.97億元

頭條要聞

特朗普：感謝伊朗開放霍爾木茲海峽

頭條要聞

特朗普：感謝伊朗開放霍爾木茲海峽

體育要聞

中超-泰山1-1海港楊希處子球克雷桑任意球扳平

娛樂要聞

劉德華摯友潘宏彬離世曾一起租房住

財經要聞

"影子萬科"2.0：管理層如何吸血萬物云？

汽車要聞

又快又穩的開掛動力！阿維塔06T全系搭分布式電驅

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

健康

房產

數碼

教育要聞

別再無效卷了你需要一套不累的學習系統！！

今日熱點：許光漢否認和周子瑜戀情；郝熠然與誠實一口終止合作……

干細胞抗衰4大誤區,90%的人都中招

房產要聞

重磅利好！2500個學位，海口濱江片區，要建九年一貫制學校！

數碼要聞

庫克都沒想到：MacBook Neo賣爆了！官網交付已排到5月

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<em id="fhdut"></em>

<blockquote id="fhdut"></blockquote>

<cite id="fhdut"><rp id="fhdut"></rp></cite>