由于不可抗力的限流導致無法接收推送文章的問題,我們迫切需要以下操作:
點擊標題下方藍字 “一半杯 ” → 點擊右上角“...” → 點選“設為星標★”,這樣就更容易找到我們和收到推送文章!
保持愛讀文章,保持領先!
![]()
人工智能與人類在學習新事物方式上的巨大差距,促使研究人員重新思考當今 AI 模型背后的數學基礎。
但開發者找到了一種更即時、更實用的權宜之計,讓 AI 能持續學習:所謂“skills(技能)”。
所謂技能,是一段文本提示詞,其中包含指令,告訴智能體(agent)該如何完成某項任務。比如,一個被要求去調整 PDF 的智能體,在執行任務前可能會先查閱一條用于 PDF 編輯的技能說明。
OpenClaw是一款增長迅速的開源軟件,用于驅動個人 AI 智能體。它可以瀏覽一個名為 ClawHub的網站,在那里尋找技能,內容涵蓋從總結 YouTube 視頻到使用 Google Cloud等各種任務。
像 Claude Code和 Codex這樣的編程智能體,也能利用技能來更輕松地處理各種任務,否則它們會更吃力。
技能彌補了 AI 模型學習新能力方式中的一個關鍵缺口。如今的 AI 要么在訓練過程中吸收知識,要么在與用戶對話的過程中學到東西,但對話一結束就很快遺忘這些信息。(像 ChatGPT這樣的聊天機器人也可以存儲關于用戶的簡單備注,并在未來對話中引用。)
相比之下,人類能在當下迅速而靈活地掌握新技能或新信息,并且在最后一次使用后的數月甚至數年之后仍能回憶起來。
一些開發者認為,給 AI 智能體配備 skills(技能),是一條長期沒有得到充分重視的解決路徑。
Jo是一家成立兩年的舊金山灣區初創公司,開發的智能體與 OpenClaw類似,采用設備端模型。其首席市場官 Kevin Li說:“我覺得很多人沒有意識到,OpenClaw 因為能訪問自己的文件系統,其實具備自我改進的能力。我認為,只要你持續給它加載越來越好的技能,或者它在犯錯后自己寫出技能并據此改進,用戶手里的 OpenClaw 的能力演進速度就會隨著時間推移轉為指數級加速增長。”
讓一個 AI 智能體在執行任務前先去瀏覽一套“說明書庫”,與從底層重新設計 AI 模型相比,聽起來像是用膠帶臨時粘出來的方案。但技能相較于通過編寫軟件代碼或更新模型權重來學習新能力,有一個關鍵優勢:技能用的是自然語言寫成,人類用戶更容易理解。
不過,在技能以及其他面向智能體的指令體系上,仍有一些毛病需要修補。
例如,除了面向具體任務的技能之外,Claude Code還使用一個名為 claude.md 的文本文件,用戶會在其中存放背景偏好與指令,比如要求 Claude 避免不必要的奉承。
當 Claude 出錯時,“它會承諾下次做得更好。”AI Policy Network(人工智能政策網絡)政策負責人 彼得·威爾德福德(Peter Wildeford)說。該組織位于華盛頓,致力于推動 AI 立法游說。“但 Claude 并不總是有那種直覺,知道為了下次改進,它需要把東西寫下來。所以我得告訴 Claude,類似這樣:‘不,你沒有持久記憶。請把這點標記到你的 claude.md 文件里。’然后它才會這么做。”(不過,Anthropic昨天開始測試一項新的自動記憶存儲功能,這可能會改善 Claude Code 如何為自己保存備注。)
盡管有這些磕絆,claude.md 可能比技能更好用,因為這個文件始終對智能體可用。相比之下,潛在技能的數量太多了,智能體不可能全部讀完,所以它必須在恰當的時候加載恰當的技能。
Zo Computer是一家成立三年的初創公司,正在為非技術用戶開發個人智能體。其聯合創始人 Ben Guo說,技能往往“不會在正確的時機被調用”。他還表示,當下圍繞技能與 claude.md 這類文件的做法“非常原始”。
但 Guo 的聯合創始人 Rob Cheung說,人和組織同樣依賴這種原始的筆記方式來記住如何完成工作。比如,他說,GitLab就使用一套內容極其龐大的員工手冊,讓遠程員工保持一致。
這反倒讓人安心,因為要等到 AI 研究人員用一種更聰明也更簡潔的新模型設計真正破解“持續學習”,很可能還得花上好幾年。與此同時,像 ClawHub這樣的網站會不斷拿出更好的技能,而像 OpenClaw這樣的智能體也會越來越擅長在需要時把這些技能調出來并用得更到位。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.