一天僅需5毛錢，開源框架替你半夜跑實驗！7*24小時待命

2026-04-12 10:02:55　來源: 新智元

北京舉報

分享至

新智元報道

編輯：LRST

【新智元導(dǎo)讀】開源框架Deep Researcher Agent幫你全天候自動跑深度學(xué)習(xí)實驗，節(jié)省大量重復(fù)勞動。它通過自主循環(huán)完成想方案、執(zhí)行、監(jiān)控與反思，僅需每天五毛錢。不依賴LLM API，實現(xiàn)實時控制與手機端監(jiān)控，真正解放研究者精力，讓他們專注于思考。

做深度學(xué)習(xí)研究的朋友，誰沒經(jīng)歷過這種日子，改超參 → 跑訓(xùn)練 → 等 6 小時 → 看結(jié)果 → 再改 → 再跑 → 再等。

Deadline前這個循環(huán)要重復(fù)上百次。凌晨三點定鬧鐘爬起來，就為了瞄一眼loss有沒有降下去——降了，松一口氣繼續(xù)睡；沒降，眼淚都快下來了還得改一版重新提交。

而最讓人崩潰的不是辛苦，是這件事本質(zhì)上是機械的：你早就想好了要試什么，剩下的只是把它跑出來而已。這部分時間，本該屬于真正的思考。

有沒有可能，讓一個AI Agent替你把這部分跑掉？

GitHub上最近有一個開源項目叫Deep Researcher Agent的框架，正面回答了這個問題——你睡覺的時候，它在煉丹；你寫論文的時候，它已經(jīng)把 results table 準備好了。

項目鏈接：https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7

它是怎么工作的？

框架的核心，是一個THINK → EXECUTE → MONITOR → REFLECT的自主循環(huán)。

THINK（想方案）Agent 讀取項目說明 + 歷史實驗記憶，分析當(dāng)前最優(yōu)結(jié)果，決定下一步該試什么。注意——它不只是改超參，還能改模型代碼、換 loss 函數(shù)、加數(shù)據(jù)增強策略。

?? EXECUTE（寫代碼 + 起任務(wù)）Agent自動改代碼或config，先跑一個強制 dry-run（2 步前向反向）確認沒bug，然后才把真正的訓(xùn)練打到GPU上。

MONITOR（盯著，但不花錢）這里是整個項目最強的一招：訓(xùn)練期間，Agent完全不調(diào)用 LLM API。它只做三件事：

kill -0 $PID看進程還活著沒
nvidia-smi看 GPU 在不在干活
tail看日志最后幾行

這三個操作的API成本是零。

REFLECT（看結(jié)果 + 決定下一步）訓(xùn)練結(jié)束，Agent 解析日志、提取指標、跟歷史最優(yōu)對比、記錄里程碑，然后開下一輪。

整個循環(huán)24小時不間斷。你想介入？隨時可以——往項目目錄里扔一個指令文件就行，Agent下一輪自動讀到。

一天成本五毛錢，這是怎么做到的

24/7跑LLM Agent，聽起來不應(yīng)該很貴嗎？

關(guān)鍵就在前面那個「零成本 MONITOR」。

一天24小時里，90%以上的時間都在訓(xùn)練，這段時間 LLM 調(diào)用費 = 0。只有開頭「想方案」和結(jié)尾「看結(jié)果」才需要請大模型出馬，每次幾分鐘。

算下來：

一天五毛錢，夠你跑一整個禮拜也比一杯咖啡便宜。

跑半年內(nèi)存不漲：兩層「恒定記憶」

長時間運行的Agent有個經(jīng)典毛病：上下文越積越長，又慢又貴又蠢。

Deep Researcher Agent的解法是一個兩層記憶系統(tǒng)：

第一層：人類寫的項目說明（凍結(jié)不變，最大3000字符）——告訴Agent你想干什么、約束是什么
第二層：Agent自己維護的滾動日志——關(guān)鍵成果自動壓縮到 1200 字符以內(nèi)，最近決策只保留15條

總記憶量恒定在約5000字符。Agent 跑1天是這個數(shù)，跑6個月還是這個數(shù)。

不是demo

是真打過仗

這個框架不是放在paper里看看的玩具。它已經(jīng)在多個真實研究項目中連續(xù)跑了30多天：

自主完成500+輪實驗循環(huán)，單個項目指標比 baseline 提升52%（200+ 次全自動實驗跑出來的），同時管理4 個項目、4 臺 GPU 服務(wù)器，最長連續(xù)運行30+ 天，期間人類只介入了五六次

Claude和Codex都能用，配置一行切換

框架不綁定單一LLM：

Anthropic系：Claude Sonnet 4.6（快） / Claude Opus 4.6（最強）
OpenAI系：Codex 5.3（快） / GPT 5.4（最強）

config改一行就能切，誰強用誰。

躺床上也能煉丹：手機端實時監(jiān)控

配合Happy Coder App（iOS / Android），可以在手機上：實時查看實驗進度、接收訓(xùn)練完成 / 出 bug 推送、隨時給Agent下達「換個方向」的指令。

端到端加密，代碼和結(jié)果完全私密。

這意味著你真的可以在地鐵上、在咖啡館、在床上指揮一整套深度學(xué)習(xí)實驗流水線。

一鍵裝好，7 個斜杠命令

git clone之后跑一句python install.py，立刻獲得7個 Claude Code / Codex 斜杠命令：

完全不會用？倉庫里有個AI_GUIDE.md——把這個文件直接丟給任何 AI 助手，它會交互式地一步步帶你裝好、跑起第一個實驗。新手友好到這個地步。

AI科研工具對比

目前主流的AI研究工具——Claude Scholar、AI Scientist、SWE-Agent等——要么幫你寫論文，要么幫你寫代碼。但沒有一個能真正替你把實驗跑出來。

Deep Researcher Agent是第一個專門為「跑」深度學(xué)習(xí)實驗設(shè)計的開源 Agent 框架，而不是為「寫」。

?? 但是，請先看完這一段再去 Star

作者在 README 里掛了一段非常嚴肅的聲明，我覺得這一段比項目本身更值得放到這篇文章里：

本項目嚴禁用于學(xué)術(shù)造假與任何形式的科研不端行為。

這個框架被造出來，只有一個目的——把跑實驗里那些機械、重復(fù)的環(huán)節(jié)從研究者身上拿掉，讓大家把節(jié)省下來的時間，投入到真正重要的事情：思考上面。

idea必須由人來提供。請不要寄希望于用本項目進行學(xué)術(shù)不端，這不是我們的項目初衷，也不是這個社區(qū)歡迎的事情。

學(xué)術(shù)應(yīng)當(dāng)保持純粹。Agent可以替你跑實驗，但idea、判斷與責(zé)任必須由人來承擔(dān)。我們真誠地希望每一位使用者都能human in the loop地去思考，在自己的研究方向上做出屬于自己的、真實的貢獻。

在這個動輒「AI一鍵生成論文」的時代，看到一個開源作者主動給自己的工具立這樣的邊界，挺打動人的。

工具是中立的，但作者立場不必中立。

一個人的精力是有限的。研究者本該把時間花在讀論文、想 idea、解讀結(jié)果上，而不是花在凌晨三點爬起來看loss有沒有降。

Deep Researcher Agent想做的，就是把后者還給機器，把前者留給人。

如果你也是煉丹人，如果你也曾在deadline前哭著改config——

這一次，讓AI替你熬夜。你去睡覺。

參考資料：

https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.