網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

龍蝦讓位！硅谷頂流AI「愛(ài)馬仕」一夜闖進(jìn)微信，沖上全球第一

2026-04-13 11:18:28　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子好困

【新智元導(dǎo)讀】硅谷新寵Hermes Agent一夜爆火，不僅在GitHub狂攬6.6萬(wàn)星，更因原生接入微信讓開(kāi)發(fā)者全線沸騰。如今，Hermes署名的首篇「頂會(huì)級(jí)」論文也出世了。

Hermes Agent實(shí)火，全然蓋過(guò)了「龍蝦」的熱度。

就在今天，Hermes在OpenRouter上的token消耗日榜位列第二，僅次于OpenClaw。

不僅如此，它還登頂全球「編程應(yīng)用」榜首，「生產(chǎn)力榜」第二，直逼冠軍寶座。

如今，這款歷經(jīng)9個(gè)月打磨，一夜成名的Agent，已在GitHub上狂攬66k星，F(xiàn)ork有8.8k。

由于項(xiàng)目太過(guò)爆火，提交Issues數(shù)量高達(dá)2.3k（最新）。

GitHub地址：https://github.com/nousresearch/hermes-agent

一時(shí)間，許多人直接棄掉了OpenClaw，紛紛轉(zhuǎn)戰(zhàn)Hermes了。

「愛(ài)馬仕」接入微信，掃個(gè)碼就行

憑借著「自我成長(zhǎng)型」Agent這個(gè)關(guān)鍵特質(zhì)，整個(gè)硅谷爭(zhēng)相追捧的新寵，如今已經(jīng)從「龍蝦」換到了「愛(ài)馬仕」。

YC CEO Garry Tan直言，親自嘗試后，徹底回不去了。

最讓人上頭的是，這幾天，Nous Research官宣Hermes也可「原生」支持微信了。

公網(wǎng)服務(wù)器，不用webhook，掃個(gè)碼就完事。

官方文檔：https://hermes-agent.nousresearch.com/docs/user-guide/messaging/weixin

這個(gè)功能上線當(dāng)天，Nous Research官方賬號(hào)專門(mén)發(fā)了一條中文推，549.1K瀏覽，是這家美國(guó)實(shí)驗(yàn)室近期互動(dòng)最高的幾條之一。

一條評(píng)論挺戳人，在中國(guó)你能把微信搞定，你就起飛了。

值得拎出來(lái)說(shuō)一句的是，一家硅谷實(shí)驗(yàn)室在中文推下面用中文跟中國(guó)用戶互動(dòng)，本身就不太常見(jiàn)。

至于中文寫(xiě)得為什么這么順，Nous自己揭了底，他們請(qǐng)Hermes幫忙潤(rùn)色過(guò)。

技術(shù)底色這邊Nous也交代了一句，用的是騰訊官方的iLink Bot API，不是第三方破解協(xié)議或非官方客戶端。

不過(guò)，還是建議先用小號(hào)試一下，再?zèng)Q定要不要掛主號(hào)。

順帶提一句，國(guó)內(nèi)主流IM Hermes基本都接全了。

釘釘、飛書(shū)、企業(yè)微信、企業(yè)微信自建應(yīng)用回調(diào)，加上這次新加的個(gè)人微信，一個(gè)不落。

挑哪個(gè)掛全看自己的工作流落在哪。

說(shuō)回到微信，具體配置流程如下。

先裝依賴

兩個(gè)包是硬要求，少一個(gè)都起不來(lái)。

pip install aiohttp cryptography

想在終端里直接看到二維碼的，再加一個(gè)。

pip install qrcode

掃碼登錄

一行命令拉起setup向?qū)А?/p>

hermes gateway setup

選Weixin。接下來(lái)的事情向?qū)?huì)自己辦，拉二維碼、在終端里畫(huà)出來(lái)（或者給一個(gè)鏈接）、等手機(jī)掃、等手機(jī)上點(diǎn)確認(rèn)，然后把賬號(hào)憑證寫(xiě)到~/.hermes/weixin/accounts/下面。

確認(rèn)成功后，終端會(huì)蹦出一句。

微信連接成功，account_id=your-account-id

account_id、token、base_url這三樣向?qū)?huì)自動(dòng)落盤(pán)，后面不用手動(dòng)填。

寫(xiě)一下環(huán)境變量

打開(kāi)~/.hermes/.env，最少把a(bǔ)ccount_id塞進(jìn)去。

WEIXIN_ACCOUNT_ID=your-account-id

剩下的幾項(xiàng)按需打開(kāi)。想限定只有自己能給Bot發(fā)消息，加這兩行。

WEIXIN_ALLOWED_USERS=user_id_1,user_id_2

群消息默認(rèn)是也關(guān)的。要在某個(gè)群里用，需手動(dòng)開(kāi)allowlist。

WEIXIN_GROUP_ALLOWED_USERS=group_id_1

定時(shí)任務(wù)和通知想發(fā)到固定的某個(gè)聊天窗口，再加兩行。

WEIXIN_HOME_CHANNEL_NAME=Home

起服務(wù)

到這一步，適配器會(huì)把剛才存下來(lái)的憑證撿回來(lái)，連上iLink，開(kāi)始長(zhǎng)輪詢。

手機(jī)微信里隨便給Bot發(fā)一句話，幾秒鐘之內(nèi)就能看到回信，連「正在輸入」的狀態(tài)都能在對(duì)話框里看到。

hermes gateway

幾個(gè)已經(jīng)被踩過(guò)的坑

一個(gè)翻車現(xiàn)場(chǎng)來(lái)自JamesweiymWei。他實(shí)測(cè)發(fā)現(xiàn)，微信回復(fù)經(jīng)常一句話被切成好幾段發(fā)出去，很多時(shí)候一段回復(fù)還沒(méi)說(shuō)完就先被截?cái)唷?/p>

問(wèn)Hermes自己是怎么回事，得到的答復(fù)是，微信單條消息上限4000 token，超過(guò)就自動(dòng)chunking，暫時(shí)沒(méi)有更好的處理方案。截至發(fā)稿前這個(gè)問(wèn)題還掛在那里。這也是目前接微信最勸退的一點(diǎn)，長(zhǎng)回復(fù)的體驗(yàn)不太行。

掉線最常見(jiàn)的原因是session過(guò)期，錯(cuò)誤碼-14。解法是，重新跑hermes gateway setup掃個(gè)新碼。

報(bào)Another local Hermes gateway is already using this Weixin token的，說(shuō)明有另一個(gè)gateway實(shí)例在用同一個(gè)token。一個(gè)token只能掛一個(gè)poller，把另一個(gè)先停掉。

媒體文件收發(fā)失敗，先確認(rèn)cryptography裝了。微信的CDN走的是AES-128-ECB加密，少了這個(gè)庫(kù)連圖片都拉不下來(lái)。

換掉OpenClaw，3.99美元上手

如今，全網(wǎng)都被Hermes Agent實(shí)力深深震撼。

一位開(kāi)發(fā)者同時(shí)深度評(píng)測(cè)了Hermes和OpenClaw兩大Agent，整體感受是——

OpenClaw系統(tǒng)容易出現(xiàn)太多可能崩潰的環(huán)節(jié)，讓人心累；

Hermes才是真正讓他感受到「開(kāi)箱即用」的AI Agent，而且僅需3.99美元即可用上了。

還有國(guó)內(nèi)大佬體驗(yàn)后，一致認(rèn)為Hermes Agent把真正的「自我進(jìn)化」體現(xiàn)的淋漓盡致。

3.99美元的門(mén)檻，再加上足以撼動(dòng)OpenClaw的性能表現(xiàn)。

AI Agent的「平權(quán)時(shí)代」，或許就從這個(gè)被戲稱為「愛(ài)馬仕」的Agent開(kāi)始了。

Hermes署名首篇論文，曝大模型致命傷

就在今天，一篇由Hermes署名的「頂會(huì)級(jí)」水準(zhǔn)的論文誕生！

這篇論文提出了一個(gè)全新推理方法——Autoreason，正是受到Karpathy的AutoResearch的啟發(fā)。

一直以來(lái)，在大模型日常使用中，人們通常有一種執(zhí)念——

讓它再改一版，效果肯定會(huì)更好。

然而，Hermes直接給這一執(zhí)念澆了一盆冷水，實(shí)驗(yàn)證明了：傳統(tǒng)的「自我優(yōu)化」（Self-Refinement）往往會(huì)讓結(jié)果變得更糟。

論文地址：https://github.com/NousResearch/autoreason/blob/main/paper/autoreason.pdf

他們發(fā)現(xiàn)，無(wú)論提示詞寫(xiě)得多好，傳統(tǒng)的「批評(píng)-修改」模式普遍存在以下三大死穴：

幻覺(jué)瑕疵：為了滿足用戶的批評(píng)指令，模型會(huì)憑空捏造缺點(diǎn)；
規(guī)模失控：每一次迭代都會(huì)導(dǎo)致內(nèi)容范圍不受控地?cái)U(kuò)張；
拒絕無(wú)能：即使原稿已經(jīng)非常出色，模型也幾乎從不拒絕修改建議，導(dǎo)致過(guò)度打磨。

Autoreason的核心邏輯不再是盲目的「改改改」，而是引入了嚴(yán)謹(jǐn)?shù)母?jìng)爭(zhēng)與收斂機(jī)制。

每一輪迭代都被設(shè)計(jì)成一場(chǎng)三方錦標(biāo)賽：選手A（維持現(xiàn)狀）；選手B（對(duì)抗修改）；選手AB（優(yōu)勢(shì)合成）。

這三個(gè)版本，會(huì)交由一組「盲評(píng)智能體」（Blind Agents）進(jìn)行評(píng)審，并采用Borda 計(jì)數(shù)法進(jìn)行投票。

Autoreason 引入了一個(gè)極具啟發(fā)性的停止邏輯：如果「維持現(xiàn)狀（選手A）」連續(xù)兩次勝出，系統(tǒng)將立即停止迭代。

這種機(jī)制確保了輸出的穩(wěn)定性——

只有當(dāng)修改確實(shí)帶來(lái)了價(jià)值，迭代才會(huì)繼續(xù)；當(dāng)模型不再有建設(shè)性貢獻(xiàn)時(shí)，它會(huì)自動(dòng)「收手」。

小模型逆襲

在涵蓋策略、系統(tǒng)設(shè)計(jì)、政策制定、競(jìng)爭(zhēng)定位及事故響應(yīng)的五項(xiàng)寫(xiě)作任務(wù)中，Autoreason展示了統(tǒng)治級(jí)的表現(xiàn)。

使用Haiku 3.5（成本僅Sonnet的十分之一）配合 Autoreason，產(chǎn)出質(zhì)量竟與Sonnet 4單次生成持平。

在三項(xiàng)任務(wù)的蒙特卡洛模擬中，無(wú)論路徑如何，最終都拿下了42/42的滿分評(píng)價(jià)。

經(jīng)過(guò)15輪優(yōu)化后，模型因無(wú)法區(qū)分「優(yōu)化」與「破壞」，硬生生地將345字的精華刪減到了102字（內(nèi)容暴減70%），內(nèi)容近乎崩毀。

而Autoreason的輸出卻每次都在增長(zhǎng)，因?yàn)樗牟门袡C(jī)制直接攔截了任何「越改越爛」的情況。

在用Sonnet 4跑了五個(gè)寫(xiě)作任務(wù)后，結(jié)果顯示，Autoreason的Borda計(jì)分平均達(dá)到了27.8分，最差也沒(méi)掉出過(guò)前兩名。

在那種需要做實(shí)質(zhì)性權(quán)衡取舍的任務(wù)里，Autoreason的表現(xiàn)最好。

此外，在150個(gè)編程難題中，Autoreason的失敗恢復(fù)率達(dá)62%，遠(yuǎn)高于單次生成的43%。

強(qiáng)制性的結(jié)構(gòu)化分析讓模型在嘗試修復(fù)前，先學(xué)會(huì)了思考「為什么會(huì)失敗」。

Autoreason的誕生，標(biāo)志著AI推理正從「大力出奇跡」轉(zhuǎn)向「結(jié)構(gòu)出效率」。

值得一提的是，這篇論文最后還是由Autoreason進(jìn)行了潤(rùn)色優(yōu)化。

與此同時(shí)，完整的Skill同步放出，想聯(lián)手Hermes搓出論文的可以上手了。

參考資料：

https://github.com/NousResearch/hermes-agent/releases

https://x.com/garrytan/status/2043016576568561829

https://x.com/garrytan/status/2042497872114090069

https://x.com/NousResearch/status/2042821620281053641

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.