<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Token 剛定了中文名,AI 圈又多了個翻譯不了的詞

      0
      分享至

        馬上又來了一個亟需被認證的新詞 Harness。

        這年頭想要在 AI 圈子里當個「全面發展的專業人士」,每天要學習的概念是真的多。從最早一個 ChatGPT 能指代一切 AI,我能知道 ChatGPT 就已經領先身邊大多數人。

        到后面慢慢發展到,我要去學習什么是 Prompt,是提示詞還是文令、「已死的」MCP,是被 CLI 替代的模型上下文協議、RAG 是風靡一時的檢索增強生成、Agent 不是代理,是智能體、Skills 是技能,也是專家、Claude Code 是代碼助手。

        還有因為爪子 Claw 得名龍蝦的 OpenClaw、以及龍蝦太火需要大量消耗的 Token = xxx……

        這些堪比「顆粒度」、「對齊」的職場黑話,如果你都聽過,大概率還是能在一些聊 AI 的飯局上稍微顯露一波的。

        

        之前 MiniMax M2.7 模型介紹博客里提到的 Agent Harness 能力

        但現在,新的詞又來了,什么是 Harness。有網友在社交媒體上用一張淘寶搜索的截圖回應,表示「很好理解」。

        

        很離譜,但是我們把 AI 當牛馬去指揮它干活,Harness 翻譯成套在 AI 身上的馬具/束縛,也并不是全無道理。

        其實 Harness 最早被真正放進 Agent 領域,還是在 Anthropic 去年十一月的一篇博客,文章里他們探討了現在的 Agent 要執行的任務越來越長,需要一個有效的 Harness 來確保 Agent 的運作正常。

        

        博客鏈接:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

        到了今年本地運行的 Agent 重新搬上臺面,一眾 AI 開發者和研究員在自己的技術博客里,也頻繁提到 Harness 這個詞。知名博主 Mitchell 提到 Harness Engineering 的理念是,「每當發現某個智能體犯錯時,就花時間設計一個解決方案,確保它以后不再犯同樣的錯誤。」

        緊接著 OpenAI 在今年二月也發了幾篇博客,講的也是 Harness engineering,在他們看來,未來工程師的工作,不是寫代碼,而是設計智能體的「工作環境」,Harness 就是這個工作環境。

        

        在 OpenAI 官網選擇中文后,直接翻譯成了「工程技術」,博客鏈接:https://openai.com/zh-Hans-CN/index/harness-engineering/

        為什么 Harness 開始被重視

        無論是 Anthropic 最早的博客,還是后面 OpenAI 的 Harness 工程,它們在文章里面描述的故事都是一樣的。

        Harness 是一種包含環境配置、多 Agents 協作機制、嚴格架構約束和上下文管理的系統,它彌補了 AI 的「上下文焦慮」和易錯性。

        兩家頂級 AI 實驗室都用大量的內部工程實踐證明了,讓大模型自主寫出百萬行代碼的關鍵,并非模型本身有多聰明,而在于構建了一個強大的 Harness(工作流框架 / 護欄系統)。

        

        我們讓 Claude 畫了一張圖,來完整介紹一下 Agent Harness,Harness = Agent 的運行容器 + 安全邊界 + 調度控制器

        在 Anthropic 的內部實驗中,研究員們發現 AI 竟然也會有「心理問題」。

        當 Claude 執行長周期的代碼任務時,一旦它感覺到自己的上下文窗口快要填滿了,它就會產生「上下文焦慮」。就像快要下班的打工人,開始瘋狂敷衍,試圖趕緊結束任務。

        要命的是,Claude 并不覺得自己在敷衍,當研究員要求 AI 評估這些「為了下班趕緊結束任務」所編寫的代碼時,它發現不了其中的問題。

        面對這種毛病,傳統的提示詞設計毫無用處。Anthropic 的研究員給出的 Harness 解法是:改變組織架構。

        他設計了一個包含三個角色的 Harness 閉環:

        規劃師(Planner):負責把一句話需求擴寫成詳細的產品文檔。

        生成器(Generator):純粹的牛馬,只負責按文檔寫代碼。

        評估器(Evaluator):極其冷酷的 QA 兼產品經理,手握自動化測試工具。

        

        Anthropic 的報告中提到,應用了 Harness 框架的 Agent 在生成網頁質量上要好很多,但是成本和時間更長。

        要求是開發一個游戲制作器,沒有 Harness 的那組,AI 跑了 20 分鐘,花了 9 美元。結果是界面能看,但核心功能是壞的——游戲里的角色出現在屏幕上,但對任何鍵盤操作都沒有反應,游戲沒法玩。

        有 Harness 的那組,跑了 6 小時,花了 200 美元。結果是游戲不只是能玩,還有動畫系統、音效、AI 輔助的關卡設計。

        在這套 Harness 里,生成器寫完一段代碼,評估器就會像真實用戶一樣去點擊、測試,一旦發現 Bug 或是那種充滿「AI 塑料味」的平庸設計,直接打回重做。

        包括我們經常用來測試 AI Coding 能力的網頁生成,Anthropic 也發現,Harness 的潛力相當大。在一個設計荷蘭藝術博物館網頁的任務中,前 9 次迭代,AI 都在老老實實地畫平庸的網頁。

        但在評估器不斷施壓下,第 10 次迭代,AI 突然拋棄了所有常規模板。它交出了一個特立獨行的 3D 空間:畫作懸掛在透視棋盤格的房間里,用戶需要像走迷宮一樣穿梭。

        

        如果說 Anthropic 的 Harness 側重于組織架構,去探索 Harness 的設計原理,OpenAI 的 Codex 團隊則是把這件事做成了一種工程文化,更多地把 Harness 當作一種工作流框架

        他們的核心約束只有一條,那就是沒有人工手寫的代碼。所有代碼——業務邏輯、測試、CI 配置、文檔、內部工具、生產監控儀表盤——都由 Codex 寫。工程師的工作不是寫代碼,而是設計讓 AI 能可靠工作的環境。

        一開始他們用一個超長的 AGENTS.md 文件告訴 AI 所有的規則。但很快就因為上下文限制,導致 AI 只會進行本地模式匹配,沒有真正理解。而且文件很快過時,沒有人維護,AI 開始被一堆可能不再成立的規則誤導。

        

        一套完整的工作流程

        后來的做法是:AGENTS.md 只有 100 行,只充當一個「目錄」,把 AI 指向結構化的 docs/ 文件夾。架構文檔、產品規格、設計決策、技術債務追蹤,全部是可以被 AI 直接讀取的版本化文件。每個 doc 由 AI 寫,由 AI 維護,定期有「文檔園丁」Agent 掃描過時的文檔來自動更新。

        他們不在乎 AI 怎么寫具體的邏輯,但在 Harness 中設置了極其嚴格的 Linter(代碼檢查工具)和物理依賴邊界。業務代碼只能單向調用,越界就會被系統無情切斷,根本合并不進項目主分支。

        在這個 Harness 中,我們所設置的規則,變成了 AI 不可違背的意志。AI 就像生活在「楚門的世界」里,它擁有寫代碼的絕對自由,但這種自由,永遠在人類設定的結界,即 Harness 之內。

        把這些研究放在一起,其實 harness 的本質就是一套系統,用來補償當前 AI 不擅長的事。

        AI 不擅長長期記憶,Harness 就用進度文件、git 歷史、結構化來補。

        AI 評價自己太寬松,用獨立的評估 Agent,帶著具體標準和真實環境測試。

        AI 在復雜任務里容易偏航,用任務分解、結構化、合約約定來約束范圍。

        AI 不具備對代碼庫架構品味的直覺,因此需要用文檔和自動化規范檢查,將人類的判斷轉化為系統規則。

        

        Claude 生成的 Harness 在 AI 領域的位置信息圖

        有意思的是,隨著模型能力增強,harness 的有些部分會變得不再必要,但新的部分又會出現。

        Anthropic 在升級到 Opus 4.6 之后,發現之前為了對抗「上下文焦慮」設計的「上下文重置」機制可以直接去掉了,因為新模型已經能自己處理了。

        但同時,他們發現了新的方向,用 harness 來讓 AI 在應用里自動集成 AI 功能,這是之前模型做不到的事。

        對 Harness 來說,模型越強,Harness 不是變得更簡單,而是要去做更難的事

        怎么翻譯 Harness

        在那篇詢問「繼 token、Agent 之后,又來了一個難以翻譯的詞:Harness」推文下,除了給出那張炸裂的「戰術胸帶 Harness」截圖外,還有很多網友給出了自己的翻譯。

        有人說應該叫「線束」,因為這個詞在汽車行業已經很多年了。還有「駕馭層」、「駕馭系統」、「Agent 框架」、「控制框架」、「管控層」、「錨定層」、「= Scaffold 腳手架」……

        更有意思的回復是「安全套」、「套馬桿」、以及約束牛馬該做什么不該做什么的「槽具」。

        

        微博上關于 Harness 怎么翻譯的討論也很多,Token 可以翻譯成智元的話,那 Harness 就叫智馭吧……也有人覺得和 MCP 現在無人問津的狀態一樣,Harness 這個概念只是現在熱,過一段時間又會有新的詞被造出來、被流行。

        我們問了問 Claude,它給了好幾個答案。

        「框架」,它認為很多東西都叫框架,framework 可以,architecture 也可以;「執行框架」,強調了運行層面,但中性,沒有「約束」的感覺。

        「駕馭層」中文語境下不太用這種說法;「管控層」強調了「約束」,但是沒有「執行」;「套具」在 AI 領域完全是陌生的概念。

        

        所以最后它說比較實用的方案是,不翻譯,就用 Harness

        一個概念如果能被一個詞完整概括,翻譯本來順理成章的事。Harness 之所以又是一個不容易確定的詞,是因為它在 LLM 這套流程里,同時包含了「約束」、「執行」、「環境」、「系統」等幾層意思,拆開來哪個都只說對了一半。

        和 Token 最終被認證為「詞元」,Harness 大概率也會有自己的官方中文。在那天之前,你在技術文章里看到這個詞,知道它在說什么就夠了。

        然后在某個聊到 AI 的飯局上,記得說一句,「在未來,會寫提示詞和 Skills 都不是核心競爭力。真正的頂級人才,是那些懂得如何設計 Harness 的人。」

        關于 Harness 的詳細內容,還可以閱讀下面這些文章:

        1、Anthropic, Harness design for long-running application development, 適用于長時間運行應用程序開發的 Harness 設計, 2026-03-24, https://www.anthropic.com/engineering/harness-design-long-running-apps

        2、OpenAI, Harness engineering: leveraging Codex in an agent-first world, Harness 工程:在智能體優先的世界中利用 Codex, 2026-02-11, https://openai.com/index/harness-engineering/

        3、Mitchell Hashimoto, My AI Adoption Journey, 我的 AI 應用之旅, 2026-02-05, https://mitchellh.com/writing/my-ai-adoption-journey

        4、OpenAI, Unlocking the Codex harness: how we built the App Server, 解鎖 Codex 的 Harness:我們如何構建 App Server, 2026-02-04, https://openai.com/index/unlocking-the-codex-harness/

        5、Anthropic, Effective harnesses for long-running agents, 適用于長期運行 Agents 的有效 Harness, 2025-11-26, https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      日本從“深表遺憾”,升級為“正式道歉”,中國態度告訴世界事實

      日本從“深表遺憾”,升級為“正式道歉”,中國態度告訴世界事實

      一葉禪林
      2026-03-28 08:00:13
      張雪峰去世事件升級!網傳有健身房的跑步機空無一人,恐慌加劇…

      張雪峰去世事件升級!網傳有健身房的跑步機空無一人,恐慌加劇…

      火山詩話
      2026-03-27 17:20:58
      蘋果新品突然上架,3月27日,全面開售

      蘋果新品突然上架,3月27日,全面開售

      科技堡壘
      2026-03-27 13:34:57
      許家印遭受最大虧損的三個項目分別是什么?

      許家印遭受最大虧損的三個項目分別是什么?

      混沌錄
      2026-03-21 15:41:07
      中國腦梗人數全球第一:肉吃得越少,血管就越通,真的嗎?

      中國腦梗人數全球第一:肉吃得越少,血管就越通,真的嗎?

      蜉蝣說
      2026-03-24 10:00:57
      警惕!公知正在悄悄換掉我們的價值觀:三件事正在瓦解社會根基

      警惕!公知正在悄悄換掉我們的價值觀:三件事正在瓦解社會根基

      云景侃記
      2026-03-26 14:56:36
      奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

      奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

      品牌營銷報
      2026-02-23 11:31:10
      張雪峰女兒張姩菡發文緬懷爸爸,引網友淚目

      張雪峰女兒張姩菡發文緬懷爸爸,引網友淚目

      環球網資訊
      2026-03-27 10:41:04
      網傳《雄獅少年》出品方倒閉,當年懟網友,終于為自己的行為買單

      網傳《雄獅少年》出品方倒閉,當年懟網友,終于為自己的行為買單

      八卦南風
      2026-03-27 17:17:39
      伊朗媒體:以美襲擊伊朗核設施

      伊朗媒體:以美襲擊伊朗核設施

      新華社
      2026-03-27 23:30:33
      傾向加入美以行動?海灣多國聯合聲明譴責伊朗,沙特、阿聯酋已有所動作

      傾向加入美以行動?海灣多國聯合聲明譴責伊朗,沙特、阿聯酋已有所動作

      澎湃新聞
      2026-03-27 14:26:27
      霍啟山激動:嫂子我喜歡這個!郭晶晶:等著,嫂子給你要微信去!

      霍啟山激動:嫂子我喜歡這個!郭晶晶:等著,嫂子給你要微信去!

      拳擊時空
      2026-03-28 07:07:19
      精準打擊!伊朗兩大鋼鐵廠徹底被毀,工業命脈被一刀掐斷

      精準打擊!伊朗兩大鋼鐵廠徹底被毀,工業命脈被一刀掐斷

      老馬拉車莫少裝
      2026-03-27 22:23:14
      20人的山東“老頭樂”小廠,給小米汽車上了一課?

      20人的山東“老頭樂”小廠,給小米汽車上了一課?

      道哥說車
      2026-03-27 09:54:47
      FIFA官方祝賀!比國足贏球更意外是國腳信服邵佳一,下場時間如下

      FIFA官方祝賀!比國足贏球更意外是國腳信服邵佳一,下場時間如下

      侃球熊弟
      2026-03-28 01:10:03
      荷蘭經濟部長:是我讓安世脫離中國的,這一切全部為了荷蘭與歐洲

      荷蘭經濟部長:是我讓安世脫離中國的,這一切全部為了荷蘭與歐洲

      離離言幾許
      2026-03-27 20:34:48
      清純得不像動作片女一號!

      清純得不像動作片女一號!

      貴圈真亂
      2026-03-26 11:33:33
      簽約湖人第一天,羅德曼就睡到珍妮阿姨床上,51天后就被掃地出門

      簽約湖人第一天,羅德曼就睡到珍妮阿姨床上,51天后就被掃地出門

      畫夕
      2026-03-27 18:04:41
      大反撲!快船最多落后24分縮小分差:倫納德11分,加蘭出現崴腳

      大反撲!快船最多落后24分縮小分差:倫納德11分,加蘭出現崴腳

      體壇小李
      2026-03-28 08:20:57
      21999元 雅迪發布半固態電池電摩:極速110km/h 一次充電能跑112公里

      21999元 雅迪發布半固態電池電摩:極速110km/h 一次充電能跑112公里

      快科技
      2026-03-26 07:52:08
      2026-03-28 10:35:01
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6237文章數 26805關注度
      往期回顧 全部

      科技要聞

      遭中國學界"拉黑"后,這家AI頂會低頭道歉

      頭條要聞

      現役軍官帶刀闖中使館日方僅表示"遺憾" 高市沒反應

      頭條要聞

      現役軍官帶刀闖中使館日方僅表示"遺憾" 高市沒反應

      體育要聞

      “我是全家最差勁的運動員”

      娛樂要聞

      范瑋琪加盟,官宣《浪姐7》遭全網抵制

      財經要聞

      我在小吃培訓機構學習“科技與狠活”

      汽車要聞

      與眾08,金標大眾不能輸的一戰

      態度原創

      親子
      旅游
      本地
      藝術
      時尚

      親子要聞

      夫妻生孩子的核心目的就是生孩子

      旅游要聞

      鏡觀中國丨赴一場春天的約會

      本地新聞

      在濰坊待了三天,沒遇到一個“濰坊人”

      藝術要聞

      華國鋒與耿飚的草書書信,你見過嗎?氣勢恢宏引發熱議!

      推廣中獎名單-更新至2026年3月11日推廣

      無障礙瀏覽 進入關懷版