![]()
新智元報(bào)道
編輯:桃子 好困
【新智元導(dǎo)讀】硅谷新寵Hermes Agent一夜爆火,不僅在GitHub狂攬6.6萬(wàn)星,更因原生接入微信讓開(kāi)發(fā)者全線沸騰。如今,Hermes署名的首篇「頂會(huì)級(jí)」論文也出世了。
Hermes Agent實(shí)火,全然蓋過(guò)了「龍蝦」的熱度。
就在今天,Hermes在OpenRouter上的token消耗日榜位列第二,僅次于OpenClaw。
不僅如此,它還登頂全球「編程應(yīng)用」榜首,「生產(chǎn)力榜」第二,直逼冠軍寶座。
![]()
![]()
如今,這款歷經(jīng)9個(gè)月打磨,一夜成名的Agent,已在GitHub上狂攬66k星,F(xiàn)ork有8.8k。
由于項(xiàng)目太過(guò)爆火,提交Issues數(shù)量高達(dá)2.3k(最新)。
![]()
![]()
GitHub地址:https://github.com/nousresearch/hermes-agent
一時(shí)間,許多人直接棄掉了OpenClaw,紛紛轉(zhuǎn)戰(zhàn)Hermes了。
![]()
![]()
「愛(ài)馬仕」接入微信,掃個(gè)碼就行
憑借著「自我成長(zhǎng)型」Agent這個(gè)關(guān)鍵特質(zhì),整個(gè)硅谷爭(zhēng)相追捧的新寵,如今已經(jīng)從「龍蝦」換到了「愛(ài)馬仕」。
YC CEO Garry Tan直言,親自嘗試后,徹底回不去了。
![]()
最讓人上頭的是,這幾天,Nous Research官宣Hermes也可「原生」支持微信了。
公網(wǎng)服務(wù)器,不用webhook,掃個(gè)碼就完事。
![]()
官方文檔:https://hermes-agent.nousresearch.com/docs/user-guide/messaging/weixin
這個(gè)功能上線當(dāng)天,Nous Research官方賬號(hào)專門(mén)發(fā)了一條中文推,549.1K瀏覽,是這家美國(guó)實(shí)驗(yàn)室近期互動(dòng)最高的幾條之一。
![]()
一條評(píng)論挺戳人,在中國(guó)你能把微信搞定,你就起飛了。
值得拎出來(lái)說(shuō)一句的是,一家硅谷實(shí)驗(yàn)室在中文推下面用中文跟中國(guó)用戶互動(dòng),本身就不太常見(jiàn)。
至于中文寫(xiě)得為什么這么順,Nous自己揭了底,他們請(qǐng)Hermes幫忙潤(rùn)色過(guò)。
![]()
![]()
技術(shù)底色這邊Nous也交代了一句,用的是騰訊官方的iLink Bot API,不是第三方破解協(xié)議或非官方客戶端。
不過(guò),還是建議先用小號(hào)試一下,再?zèng)Q定要不要掛主號(hào)。
![]()
順帶提一句,國(guó)內(nèi)主流IM Hermes基本都接全了。
釘釘、飛書(shū)、企業(yè)微信、企業(yè)微信自建應(yīng)用回調(diào),加上這次新加的個(gè)人微信,一個(gè)不落。
挑哪個(gè)掛全看自己的工作流落在哪。
![]()
說(shuō)回到微信,具體配置流程如下。
先裝依賴
兩個(gè)包是硬要求,少一個(gè)都起不來(lái)。
pip install aiohttp cryptography想在終端里直接看到二維碼的,再加一個(gè)。
pip install qrcode掃碼登錄
一行命令拉起setup向?qū)А?/p>
hermes gateway setup選Weixin。接下來(lái)的事情向?qū)?huì)自己辦,拉二維碼、在終端里畫(huà)出來(lái)(或者給一個(gè)鏈接)、等手機(jī)掃、等手機(jī)上點(diǎn)確認(rèn),然后把賬號(hào)憑證寫(xiě)到~/.hermes/weixin/accounts/下面。
確認(rèn)成功后,終端會(huì)蹦出一句。
微信連接成功,account_id=your-account-idaccount_id、token、base_url這三樣向?qū)?huì)自動(dòng)落盤(pán),后面不用手動(dòng)填。
寫(xiě)一下環(huán)境變量
打開(kāi)~/.hermes/.env,最少把a(bǔ)ccount_id塞進(jìn)去。
WEIXIN_ACCOUNT_ID=your-account-id剩下的幾項(xiàng)按需打開(kāi)。想限定只有自己能給Bot發(fā)消息,加這兩行。
WEIXIN_ALLOWED_USERS=user_id_1,user_id_2群消息默認(rèn)是也關(guān)的。要在某個(gè)群里用,需手動(dòng)開(kāi)allowlist。
WEIXIN_GROUP_ALLOWED_USERS=group_id_1定時(shí)任務(wù)和通知想發(fā)到固定的某個(gè)聊天窗口,再加兩行。
WEIXIN_HOME_CHANNEL_NAME=Home起服務(wù)
到這一步,適配器會(huì)把剛才存下來(lái)的憑證撿回來(lái),連上iLink,開(kāi)始長(zhǎng)輪詢。
手機(jī)微信里隨便給Bot發(fā)一句話,幾秒鐘之內(nèi)就能看到回信,連「正在輸入」的狀態(tài)都能在對(duì)話框里看到。
hermes gateway幾個(gè)已經(jīng)被踩過(guò)的坑
一個(gè)翻車現(xiàn)場(chǎng)來(lái)自JamesweiymWei。他實(shí)測(cè)發(fā)現(xiàn),微信回復(fù)經(jīng)常一句話被切成好幾段發(fā)出去,很多時(shí)候一段回復(fù)還沒(méi)說(shuō)完就先被截?cái)唷?/p>
問(wèn)Hermes自己是怎么回事,得到的答復(fù)是,微信單條消息上限4000 token,超過(guò)就自動(dòng)chunking,暫時(shí)沒(méi)有更好的處理方案。截至發(fā)稿前這個(gè)問(wèn)題還掛在那里。這也是目前接微信最勸退的一點(diǎn),長(zhǎng)回復(fù)的體驗(yàn)不太行。
掉線最常見(jiàn)的原因是session過(guò)期,錯(cuò)誤碼-14。解法是,重新跑hermes gateway setup掃個(gè)新碼。
報(bào)Another local Hermes gateway is already using this Weixin token的,說(shuō)明有另一個(gè)gateway實(shí)例在用同一個(gè)token。一個(gè)token只能掛一個(gè)poller,把另一個(gè)先停掉。
媒體文件收發(fā)失敗,先確認(rèn)cryptography裝了。微信的CDN走的是AES-128-ECB加密,少了這個(gè)庫(kù)連圖片都拉不下來(lái)。
換掉OpenClaw,3.99美元上手
如今,全網(wǎng)都被Hermes Agent實(shí)力深深震撼。
![]()
一位開(kāi)發(fā)者同時(shí)深度評(píng)測(cè)了Hermes和OpenClaw兩大Agent,整體感受是——
OpenClaw系統(tǒng)容易出現(xiàn)太多可能崩潰的環(huán)節(jié),讓人心累;
Hermes才是真正讓他感受到「開(kāi)箱即用」的AI Agent,而且僅需3.99美元即可用上了。
![]()
還有國(guó)內(nèi)大佬體驗(yàn)后,一致認(rèn)為Hermes Agent把真正的「自我進(jìn)化」體現(xiàn)的淋漓盡致。
![]()
![]()
![]()
3.99美元的門(mén)檻,再加上足以撼動(dòng)OpenClaw的性能表現(xiàn)。
AI Agent的「平權(quán)時(shí)代」,或許就從這個(gè)被戲稱為「愛(ài)馬仕」的Agent開(kāi)始了。
![]()
Hermes署名首篇論文,曝大模型致命傷
就在今天,一篇由Hermes署名的「頂會(huì)級(jí)」水準(zhǔn)的論文誕生!
![]()
這篇論文提出了一個(gè)全新推理方法——Autoreason,正是受到Karpathy的AutoResearch的啟發(fā)。
一直以來(lái),在大模型日常使用中,人們通常有一種執(zhí)念——
讓它再改一版,效果肯定會(huì)更好。
![]()
然而,Hermes直接給這一執(zhí)念澆了一盆冷水,實(shí)驗(yàn)證明了:傳統(tǒng)的「自我優(yōu)化」(Self-Refinement)往往會(huì)讓結(jié)果變得更糟。
![]()
論文地址:https://github.com/NousResearch/autoreason/blob/main/paper/autoreason.pdf
他們發(fā)現(xiàn),無(wú)論提示詞寫(xiě)得多好,傳統(tǒng)的「批評(píng)-修改」模式普遍存在以下三大死穴:
幻覺(jué)瑕疵:為了滿足用戶的批評(píng)指令,模型會(huì)憑空捏造缺點(diǎn);
規(guī)模失控:每一次迭代都會(huì)導(dǎo)致內(nèi)容范圍不受控地?cái)U(kuò)張;
拒絕無(wú)能:即使原稿已經(jīng)非常出色,模型也幾乎從不拒絕修改建議,導(dǎo)致過(guò)度打磨。
Autoreason的核心邏輯不再是盲目的「改改改」,而是引入了嚴(yán)謹(jǐn)?shù)母?jìng)爭(zhēng)與收斂機(jī)制。
每一輪迭代都被設(shè)計(jì)成一場(chǎng)三方錦標(biāo)賽:選手A(維持現(xiàn)狀);選手B(對(duì)抗修改);選手AB(優(yōu)勢(shì)合成)。
這三個(gè)版本,會(huì)交由一組「盲評(píng)智能體」(Blind Agents)進(jìn)行評(píng)審,并采用Borda 計(jì)數(shù)法進(jìn)行投票。
![]()
Autoreason 引入了一個(gè)極具啟發(fā)性的停止邏輯:如果「維持現(xiàn)狀(選手A)」連續(xù)兩次勝出,系統(tǒng)將立即停止迭代。
這種機(jī)制確保了輸出的穩(wěn)定性——
只有當(dāng)修改確實(shí)帶來(lái)了價(jià)值,迭代才會(huì)繼續(xù);當(dāng)模型不再有建設(shè)性貢獻(xiàn)時(shí),它會(huì)自動(dòng)「收手」。
小模型逆襲
在涵蓋策略、系統(tǒng)設(shè)計(jì)、政策制定、競(jìng)爭(zhēng)定位及事故響應(yīng)的五項(xiàng)寫(xiě)作任務(wù)中,Autoreason展示了統(tǒng)治級(jí)的表現(xiàn)。
使用Haiku 3.5(成本僅Sonnet的十分之一)配合 Autoreason,產(chǎn)出質(zhì)量竟與Sonnet 4單次生成持平。
在三項(xiàng)任務(wù)的蒙特卡洛模擬中,無(wú)論路徑如何,最終都拿下了42/42的滿分評(píng)價(jià)。
![]()
經(jīng)過(guò)15輪優(yōu)化后,模型因無(wú)法區(qū)分「優(yōu)化」與「破壞」,硬生生地將345字的精華刪減到了102字(內(nèi)容暴減70%),內(nèi)容近乎崩毀。
而Autoreason的輸出卻每次都在增長(zhǎng),因?yàn)樗牟门袡C(jī)制直接攔截了任何「越改越爛」的情況。
![]()
在用Sonnet 4跑了五個(gè)寫(xiě)作任務(wù)后,結(jié)果顯示,Autoreason的Borda計(jì)分平均達(dá)到了27.8分,最差也沒(méi)掉出過(guò)前兩名。
在那種需要做實(shí)質(zhì)性權(quán)衡取舍的任務(wù)里,Autoreason的表現(xiàn)最好。
![]()
此外,在150個(gè)編程難題中,Autoreason的失敗恢復(fù)率達(dá)62%,遠(yuǎn)高于單次生成的43%。
強(qiáng)制性的結(jié)構(gòu)化分析讓模型在嘗試修復(fù)前,先學(xué)會(huì)了思考「為什么會(huì)失敗」。
![]()
Autoreason的誕生,標(biāo)志著AI推理正從「大力出奇跡」轉(zhuǎn)向「結(jié)構(gòu)出效率」。
值得一提的是,這篇論文最后還是由Autoreason進(jìn)行了潤(rùn)色優(yōu)化。
![]()
與此同時(shí),完整的Skill同步放出,想聯(lián)手Hermes搓出論文的可以上手了。
![]()
參考資料:
https://github.com/NousResearch/hermes-agent/releases
https://x.com/garrytan/status/2043016576568561829
https://x.com/garrytan/status/2042497872114090069
https://x.com/NousResearch/status/2042821620281053641
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.