網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Token 剛定了中文名，AI 圈又多了個(gè)翻譯不了的詞

2026-03-26 21:27:20　來源: AppSo

廣東舉報(bào)

分享至

　　馬上又來了一個(gè)亟需被認(rèn)證的新詞 Harness。

　　這年頭想要在 AI 圈子里當(dāng)個(gè)「全面發(fā)展的專業(yè)人士」，每天要學(xué)習(xí)的概念是真的多。從最早一個(gè) ChatGPT 能指代一切 AI，我能知道 ChatGPT 就已經(jīng)領(lǐng)先身邊大多數(shù)人。

　　到后面慢慢發(fā)展到，我要去學(xué)習(xí)什么是 Prompt，是提示詞還是文令、「已死的」MCP，是被 CLI 替代的模型上下文協(xié)議、RAG 是風(fēng)靡一時(shí)的檢索增強(qiáng)生成、Agent 不是代理，是智能體、Skills 是技能，也是專家、Claude Code 是代碼助手。

　　還有因?yàn)樽ψ?Claw 得名龍蝦的 OpenClaw、以及龍蝦太火需要大量消耗的 Token = xxx……

　　這些堪比「顆粒度」、「對(duì)齊」的職場黑話，如果你都聽過，大概率還是能在一些聊 AI 的飯局上稍微顯露一波的。

　　之前 MiniMax M2.7 模型介紹博客里提到的 Agent Harness 能力

　　但現(xiàn)在，新的詞又來了，什么是 Harness。有網(wǎng)友在社交媒體上用一張?zhí)詫毸阉鞯慕貓D回應(yīng)，表示「很好理解」。

　　很離譜，但是我們把 AI 當(dāng)牛馬去指揮它干活，Harness 翻譯成套在 AI 身上的馬具/束縛，也并不是全無道理。

　　其實(shí) Harness 最早被真正放進(jìn) Agent 領(lǐng)域，還是在 Anthropic 去年十一月的一篇博客，文章里他們探討了現(xiàn)在的 Agent 要執(zhí)行的任務(wù)越來越長，需要一個(gè)有效的 Harness 來確保 Agent 的運(yùn)作正常。

　　博客鏈接：https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

　　到了今年本地運(yùn)行的 Agent 重新搬上臺(tái)面，一眾 AI 開發(fā)者和研究員在自己的技術(shù)博客里，也頻繁提到 Harness 這個(gè)詞。知名博主 Mitchell 提到 Harness Engineering 的理念是，「每當(dāng)發(fā)現(xiàn)某個(gè)智能體犯錯(cuò)時(shí)，就花時(shí)間設(shè)計(jì)一個(gè)解決方案，確保它以后不再犯同樣的錯(cuò)誤。」

　　緊接著 OpenAI 在今年二月也發(fā)了幾篇博客，講的也是 Harness engineering，在他們看來，未來工程師的工作，不是寫代碼，而是設(shè)計(jì)智能體的「工作環(huán)境」，Harness 就是這個(gè)工作環(huán)境。

　　在 OpenAI 官網(wǎng)選擇中文后，直接翻譯成了「工程技術(shù)」，博客鏈接：https://openai.com/zh-Hans-CN/index/harness-engineering/

　　為什么 Harness 開始被重視

　　無論是 Anthropic 最早的博客，還是后面 OpenAI 的 Harness 工程，它們?cè)谖恼吕锩婷枋龅墓适露际且粯拥摹?/p>

　　Harness 是一種包含環(huán)境配置、多 Agents 協(xié)作機(jī)制、嚴(yán)格架構(gòu)約束和上下文管理的系統(tǒng)，它彌補(bǔ)了 AI 的「上下文焦慮」和易錯(cuò)性。

　　兩家頂級(jí) AI 實(shí)驗(yàn)室都用大量的內(nèi)部工程實(shí)踐證明了，讓大模型自主寫出百萬行代碼的關(guān)鍵，并非模型本身有多聰明，而在于構(gòu)建了一個(gè)強(qiáng)大的 Harness（工作流框架 / 護(hù)欄系統(tǒng)）。

　　我們讓 Claude 畫了一張圖，來完整介紹一下 Agent Harness，Harness = Agent 的運(yùn)行容器 + 安全邊界 + 調(diào)度控制器

　　在 Anthropic 的內(nèi)部實(shí)驗(yàn)中，研究員們發(fā)現(xiàn) AI 竟然也會(huì)有「心理問題」。

　　當(dāng) Claude 執(zhí)行長周期的代碼任務(wù)時(shí)，一旦它感覺到自己的上下文窗口快要填滿了，它就會(huì)產(chǎn)生「上下文焦慮」。就像快要下班的打工人，開始瘋狂敷衍，試圖趕緊結(jié)束任務(wù)。

　　要命的是，Claude 并不覺得自己在敷衍，當(dāng)研究員要求 AI 評(píng)估這些「為了下班趕緊結(jié)束任務(wù)」所編寫的代碼時(shí)，它發(fā)現(xiàn)不了其中的問題。

　　面對(duì)這種毛病，傳統(tǒng)的提示詞設(shè)計(jì)毫無用處。Anthropic 的研究員給出的 Harness 解法是：改變組織架構(gòu)。

　　他設(shè)計(jì)了一個(gè)包含三個(gè)角色的 Harness 閉環(huán)：

　　規(guī)劃師（Planner）：負(fù)責(zé)把一句話需求擴(kuò)寫成詳細(xì)的產(chǎn)品文檔。

　　生成器（Generator）：純粹的牛馬，只負(fù)責(zé)按文檔寫代碼。

　　評(píng)估器（Evaluator）：極其冷酷的 QA 兼產(chǎn)品經(jīng)理，手握自動(dòng)化測(cè)試工具。

　　Anthropic 的報(bào)告中提到，應(yīng)用了 Harness 框架的 Agent 在生成網(wǎng)頁質(zhì)量上要好很多，但是成本和時(shí)間更長。

　　要求是開發(fā)一個(gè)游戲制作器，沒有 Harness 的那組，AI 跑了 20 分鐘，花了 9 美元。結(jié)果是界面能看，但核心功能是壞的——游戲里的角色出現(xiàn)在屏幕上，但對(duì)任何鍵盤操作都沒有反應(yīng)，游戲沒法玩。

　　有 Harness 的那組，跑了 6 小時(shí)，花了 200 美元。結(jié)果是游戲不只是能玩，還有動(dòng)畫系統(tǒng)、音效、AI 輔助的關(guān)卡設(shè)計(jì)。

　　在這套 Harness 里，生成器寫完一段代碼，評(píng)估器就會(huì)像真實(shí)用戶一樣去點(diǎn)擊、測(cè)試，一旦發(fā)現(xiàn) Bug 或是那種充滿「AI 塑料味」的平庸設(shè)計(jì)，直接打回重做。

　　包括我們經(jīng)常用來測(cè)試 AI Coding 能力的網(wǎng)頁生成，Anthropic 也發(fā)現(xiàn)，Harness 的潛力相當(dāng)大。在一個(gè)設(shè)計(jì)荷蘭藝術(shù)博物館網(wǎng)頁的任務(wù)中，前 9 次迭代，AI 都在老老實(shí)實(shí)地畫平庸的網(wǎng)頁。

　　但在評(píng)估器不斷施壓下，第 10 次迭代，AI 突然拋棄了所有常規(guī)模板。它交出了一個(gè)特立獨(dú)行的 3D 空間：畫作懸掛在透視棋盤格的房間里，用戶需要像走迷宮一樣穿梭。

　　如果說 Anthropic 的 Harness 側(cè)重于組織架構(gòu)，去探索 Harness 的設(shè)計(jì)原理，OpenAI 的 Codex 團(tuán)隊(duì)則是把這件事做成了一種工程文化，更多地把 Harness 當(dāng)作一種工作流框架。

　　他們的核心約束只有一條，那就是沒有人工手寫的代碼。所有代碼——業(yè)務(wù)邏輯、測(cè)試、CI 配置、文檔、內(nèi)部工具、生產(chǎn)監(jiān)控儀表盤——都由 Codex 寫。工程師的工作不是寫代碼，而是設(shè)計(jì)讓 AI 能可靠工作的環(huán)境。

　　一開始他們用一個(gè)超長的 AGENTS.md 文件告訴 AI 所有的規(guī)則。但很快就因?yàn)樯舷挛南拗疲瑢?dǎo)致 AI 只會(huì)進(jìn)行本地模式匹配，沒有真正理解。而且文件很快過時(shí)，沒有人維護(hù)，AI 開始被一堆可能不再成立的規(guī)則誤導(dǎo)。

　　一套完整的工作流程

　　后來的做法是：AGENTS.md 只有 100 行，只充當(dāng)一個(gè)「目錄」，把 AI 指向結(jié)構(gòu)化的 docs/ 文件夾。架構(gòu)文檔、產(chǎn)品規(guī)格、設(shè)計(jì)決策、技術(shù)債務(wù)追蹤，全部是可以被 AI 直接讀取的版本化文件。每個(gè) doc 由 AI 寫，由 AI 維護(hù)，定期有「文檔園丁」Agent 掃描過時(shí)的文檔來自動(dòng)更新。

　　他們不在乎 AI 怎么寫具體的邏輯，但在 Harness 中設(shè)置了極其嚴(yán)格的 Linter（代碼檢查工具）和物理依賴邊界。業(yè)務(wù)代碼只能單向調(diào)用，越界就會(huì)被系統(tǒng)無情切斷，根本合并不進(jìn)項(xiàng)目主分支。

　　在這個(gè) Harness 中，我們所設(shè)置的規(guī)則，變成了 AI 不可違背的意志。AI 就像生活在「楚門的世界」里，它擁有寫代碼的絕對(duì)自由，但這種自由，永遠(yuǎn)在人類設(shè)定的結(jié)界，即 Harness 之內(nèi)。

　　把這些研究放在一起，其實(shí) harness 的本質(zhì)就是一套系統(tǒng)，用來補(bǔ)償當(dāng)前 AI 不擅長的事。

　　AI 不擅長長期記憶，Harness 就用進(jìn)度文件、git 歷史、結(jié)構(gòu)化來補(bǔ)。

　　AI 評(píng)價(jià)自己太寬松，用獨(dú)立的評(píng)估 Agent，帶著具體標(biāo)準(zhǔn)和真實(shí)環(huán)境測(cè)試。

　　AI 在復(fù)雜任務(wù)里容易偏航，用任務(wù)分解、結(jié)構(gòu)化、合約約定來約束范圍。

　　AI 不具備對(duì)代碼庫架構(gòu)品味的直覺，因此需要用文檔和自動(dòng)化規(guī)范檢查，將人類的判斷轉(zhuǎn)化為系統(tǒng)規(guī)則。

　　Claude 生成的 Harness 在 AI 領(lǐng)域的位置信息圖

　　有意思的是，隨著模型能力增強(qiáng)，harness 的有些部分會(huì)變得不再必要，但新的部分又會(huì)出現(xiàn)。

　　Anthropic 在升級(jí)到 Opus 4.6 之后，發(fā)現(xiàn)之前為了對(duì)抗「上下文焦慮」設(shè)計(jì)的「上下文重置」機(jī)制可以直接去掉了，因?yàn)樾履Ｐ鸵呀?jīng)能自己處理了。

　　但同時(shí)，他們發(fā)現(xiàn)了新的方向，用 harness 來讓 AI 在應(yīng)用里自動(dòng)集成 AI 功能，這是之前模型做不到的事。

　　對(duì) Harness 來說，模型越強(qiáng)，Harness 不是變得更簡單，而是要去做更難的事。

　　怎么翻譯 Harness

　　在那篇詢問「繼 token、Agent 之后，又來了一個(gè)難以翻譯的詞：Harness」推文下，除了給出那張炸裂的「戰(zhàn)術(shù)胸帶 Harness」截圖外，還有很多網(wǎng)友給出了自己的翻譯。

　　有人說應(yīng)該叫「線束」，因?yàn)檫@個(gè)詞在汽車行業(yè)已經(jīng)很多年了。還有「駕馭層」、「駕馭系統(tǒng)」、「Agent 框架」、「控制框架」、「管控層」、「錨定層」、「= Scaffold 腳手架」……

　　更有意思的回復(fù)是「安全套」、「套馬桿」、以及約束牛馬該做什么不該做什么的「槽具」。

　　微博上關(guān)于 Harness 怎么翻譯的討論也很多，Token 可以翻譯成智元的話，那 Harness 就叫智馭吧……也有人覺得和 MCP 現(xiàn)在無人問津的狀態(tài)一樣，Harness 這個(gè)概念只是現(xiàn)在熱，過一段時(shí)間又會(huì)有新的詞被造出來、被流行。

　　我們問了問 Claude，它給了好幾個(gè)答案。

　　「框架」，它認(rèn)為很多東西都叫框架，framework 可以，architecture 也可以；「執(zhí)行框架」，強(qiáng)調(diào)了運(yùn)行層面，但中性，沒有「約束」的感覺。

　　「駕馭層」中文語境下不太用這種說法；「管控層」強(qiáng)調(diào)了「約束」，但是沒有「執(zhí)行」；「套具」在 AI 領(lǐng)域完全是陌生的概念。

　　所以最后它說比較實(shí)用的方案是，不翻譯，就用 Harness。

　　一個(gè)概念如果能被一個(gè)詞完整概括，翻譯本來順理成章的事。Harness 之所以又是一個(gè)不容易確定的詞，是因?yàn)樗?LLM 這套流程里，同時(shí)包含了「約束」、「執(zhí)行」、「環(huán)境」、「系統(tǒng)」等幾層意思，拆開來哪個(gè)都只說對(duì)了一半。

　　和 Token 最終被認(rèn)證為「詞元」，Harness 大概率也會(huì)有自己的官方中文。在那天之前，你在技術(shù)文章里看到這個(gè)詞，知道它在說什么就夠了。

　　然后在某個(gè)聊到 AI 的飯局上，記得說一句，「在未來，會(huì)寫提示詞和 Skills 都不是核心競爭力。真正的頂級(jí)人才，是那些懂得如何設(shè)計(jì) Harness 的人。」

　　關(guān)于 Harness 的詳細(xì)內(nèi)容，還可以閱讀下面這些文章：

　　1、Anthropic, Harness design for long-running application development, 適用于長時(shí)間運(yùn)行應(yīng)用程序開發(fā)的 Harness 設(shè)計(jì), 2026-03-24, https://www.anthropic.com/engineering/harness-design-long-running-apps

　　2、OpenAI, Harness engineering: leveraging Codex in an agent-first world, Harness 工程：在智能體優(yōu)先的世界中利用 Codex, 2026-02-11, https://openai.com/index/harness-engineering/

　　3、Mitchell Hashimoto, My AI Adoption Journey, 我的 AI 應(yīng)用之旅, 2026-02-05, https://mitchellh.com/writing/my-ai-adoption-journey

　　4、OpenAI, Unlocking the Codex harness: how we built the App Server, 解鎖 Codex 的 Harness：我們?nèi)绾螛?gòu)建 App Server, 2026-02-04, https://openai.com/index/unlocking-the-codex-harness/

　　5、Anthropic, Effective harnesses for long-running agents, 適用于長期運(yùn)行 Agents 的有效 Harness, 2025-11-26, https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

聲明：包含AI生成內(nèi)容

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.