<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      100行代碼打造迷你編程Agent:修復(fù)65%真項(xiàng)目bug,適配所有大模型

      0
      分享至

      只用100行代碼,打造最強(qiáng)輕量編程agent。

      SWE-bench、SWE-agent原班人馬再出手,推出全新開源項(xiàng)目——

      mini-SWE-agent



      不依賴任何額外插件,僅通過(guò)基礎(chǔ)命令即可運(yùn)行。而且對(duì)模型沒有限制,幾乎兼容所有主流語(yǔ)言模型,支持直接在本地終端中部署和使用。

      而在如此精簡(jiǎn)的架構(gòu)下,僅憑100行核心代碼輕松解決SWE-bench上65%的問(wèn)題。

      這個(gè)65%是啥水平呢?

      也就和原版差不多吧~(關(guān)鍵人家還輕量啊)



      網(wǎng)友:厲害



      百行代碼,實(shí)力不打折

      SWE-agent是一個(gè)開源項(xiàng)目(16.8k GitHub Star),它的目標(biāo)是讓agent自動(dòng)修復(fù)GitHub上真實(shí)項(xiàng)目中的代碼Bug



      不過(guò),原版的SWE-agent基于LangChain構(gòu)建,從接受issue、理解問(wèn)題、編輯代碼、到提交PR,涉及多工具、多輪對(duì)話管理,任務(wù)流程繁瑣。

      除此之外,開發(fā)者要跑通還需要安裝多個(gè)依賴,精調(diào)工具調(diào)用邏輯,而且項(xiàng)目代碼動(dòng)輒上千行,對(duì)模型、環(huán)境的耦合也比較強(qiáng)。

      而隨著語(yǔ)言模型性能越來(lái)越強(qiáng)大,構(gòu)建一個(gè)有用的代理已經(jīng)不再需要這些工具和接口了。

      由此,團(tuán)隊(duì)開始思考:能否讓SWE-agent小100倍,并保持原有的性能。

      mini-SWE-agent由此而來(lái)。



      那么,相較于SWE-agent,mini-SWE-agent有什么不同呢?

      極簡(jiǎn)代碼和依賴:mini-SWE-agent本身僅約100行Python代碼,加上環(huán)境、模型、腳本才共約200行,沒有復(fù)雜的依賴關(guān)系。

      取消工具調(diào)用接口:mini版本不集成專用的代碼編輯、搜索等工具;它只使用操作系統(tǒng)的Bash環(huán)境執(zhí)行命令。每一步由語(yǔ)言模型輸出一個(gè)完整的shell命令,不通過(guò)獨(dú)立的“tool call”協(xié)議,從而可兼容任何語(yǔ)言模型。

      線性歷史記錄:agent的每一步都只是附加到消息中。

      獨(dú)立單步執(zhí)行:每條命令通過(guò)Python獨(dú)立執(zhí)行,并非保持一個(gè)持續(xù)的shell會(huì)話,這使得在沙盒中執(zhí)行操作變得非常簡(jiǎn)單,并且可以輕松擴(kuò)展。

      簡(jiǎn)化配置與接口:取消了SWE-agent依賴的復(fù)雜YAML配置;mini-swe-agent采用代碼內(nèi)置模板,并提供直觀的命令行工具。用戶可以通過(guò)mini命令快速啟動(dòng)代理,或使用mini-v啟動(dòng)可視化界面。



      多樣的運(yùn)行環(huán)境支持:除了本地Shell,mini-swe-agent還內(nèi)置支持多種容器與虛擬化環(huán)境(如Docker、Podman、Singularity、Apptainer等),這意味著開發(fā)者可以在不同平臺(tái)和容器中輕松部署,而無(wú)需額外修改代碼。

      保留高性能和工具:雖然架構(gòu)極簡(jiǎn),mini-swe-agent在SWE-bench驗(yàn)證集上仍能解決約65%的問(wèn)題。同時(shí),它附帶批量推理(batchinference)、軌跡瀏覽器(trajectorybrowser)等工具,幫助用戶進(jìn)行大規(guī)模評(píng)測(cè)和決策分析。代理還提供可視化界面,方便開發(fā)者交互式地觀察執(zhí)行過(guò)程



      此外,對(duì)于應(yīng)在何種場(chǎng)景下使用 SWE-agent 或 mini-SWE-agent,團(tuán)隊(duì)也根據(jù)不同的需求給出了建議:

      mini-swe-agent更適合希望快速本地運(yùn)行、追求簡(jiǎn)潔控制流和更穩(wěn)定評(píng)估環(huán)境的用戶。它非常輕量,適合用于微調(diào)(FT)或強(qiáng)化學(xué)習(xí)(RL)等實(shí)驗(yàn),不容易陷入對(duì)復(fù)雜框架的過(guò)擬合。

      如果你需要高度可配置的工具鏈、更復(fù)雜的歷史狀態(tài)管理,或希望通過(guò)修改YAML文件自由切換組件而無(wú)需動(dòng)代碼,那么功能更豐富的SWE-agent會(huì)是更合適的選擇。

      總體而言,mini-swe-agent體現(xiàn)了可讀、方便、易擴(kuò)展的開發(fā)理念。

      對(duì)于日常開發(fā)者而言,它既可以作為簡(jiǎn)單的命令行工具使用。如在本地終端快速解決問(wèn)題),也可以作為庫(kù)被集成到其他Python應(yīng)用中。

      相比于重型框架,它降低了上手成本,讓開發(fā)者可以像使用腳本一樣靈活地“駕馭”智能代理。

      One more thing

      SWE-bench和SWE-agent是由John Yang、Carlos E. Jimenez、Alexander Wettig、Kilian Lieret、姚順雨(OpenAI研究員,2015年畢業(yè)清華姚班)、Karthik Narasimhan和Ofir Press于2024年在普林斯頓大學(xué)發(fā)起的開源項(xiàng)目。

      該項(xiàng)目推動(dòng)了基于大型語(yǔ)言模型的軟件工程代理(Software Engineering Agent)研究。

      其中,SWE-bench一經(jīng)發(fā)布后,就成為了評(píng)估大語(yǔ)言模型編程的經(jīng)典benchmark,伴隨SWE-agent一同提出的Agent?Computer-Interface(ACI)則進(jìn)一步定義了“智能體如何與計(jì)算機(jī)交互”的標(biāo)準(zhǔn)接口方式。

      而這一杰出的想法最初僅僅來(lái)自一次20多分鐘的討論。

      在Matthew Berman的播客節(jié)目上,Carlos E. Jimenez分享道:SWE-bench最初的想法源自他和John Yang在閑逛時(shí)的一次頭腦風(fēng)暴:



      他們意識(shí)到,GitHub不只是一個(gè)存儲(chǔ)代碼的地方,更是一個(gè)活躍的協(xié)作開發(fā)平臺(tái),充滿了真實(shí)的軟件工程過(guò)程:用戶報(bào)告bug,開發(fā)者提交修復(fù),社區(qū)公開審核和合入。

      相比傳統(tǒng)的編程競(jìng)賽,這些交互和修改才是真正代表“現(xiàn)實(shí)世界編程”的任務(wù)。于是他們?cè)O(shè)想,能否把這種開源協(xié)作的過(guò)程結(jié)構(gòu)化下來(lái),變成一種評(píng)估語(yǔ)言模型能力的標(biāo)準(zhǔn)流程?

      這便催生了SWE-bench,一個(gè)基于GitHub上真實(shí)Issue與PullRequest構(gòu)建的benchmark,用來(lái)測(cè)試LLM是否能像人類開發(fā)者一樣,理解bug報(bào)告并修復(fù)代碼。

      這個(gè)系統(tǒng)不僅更接近現(xiàn)實(shí),也讓模型的“開發(fā)能力”變得可觀察、可比較,而SWE-agent則是他們?yōu)檫@一評(píng)估任務(wù)設(shè)計(jì)的開源agent,目標(biāo)就是成為能在SWE-bench上“修最多bug”的AI程序員。

      項(xiàng)目主頁(yè):
      [1]https://github.com/SWE-agent/mini-swe-agent
      [2]https://github.com/SWE-agent/mini-swe-agent?tab=readme-ov-file

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      英國(guó)怒了,是可忍孰不可忍!特朗普太侮辱人,斯塔默在沉默中爆發(fā):應(yīng)道歉

      英國(guó)怒了,是可忍孰不可忍!特朗普太侮辱人,斯塔默在沉默中爆發(fā):應(yīng)道歉

      上觀新聞
      2026-01-24 14:17:04
      五五分流為什么分不下去了?背后的真相

      五五分流為什么分不下去了?背后的真相

      楓冷慕詩(shī)
      2026-01-24 13:09:19
      特朗普承認(rèn):美軍在委內(nèi)瑞拉使用“秘密聲波”武器,俄羅斯稱將調(diào)查搜集相關(guān)信息

      特朗普承認(rèn):美軍在委內(nèi)瑞拉使用“秘密聲波”武器,俄羅斯稱將調(diào)查搜集相關(guān)信息

      魯中晨報(bào)
      2026-01-24 14:03:03
      澤連斯基炮轟歐洲石破天驚,德國(guó)將從美國(guó)運(yùn)回1000噸黃金

      澤連斯基炮轟歐洲石破天驚,德國(guó)將從美國(guó)運(yùn)回1000噸黃金

      史政先鋒
      2026-01-23 22:41:06
      北京明天這場(chǎng)雪有多大?氣象首席解讀——

      北京明天這場(chǎng)雪有多大?氣象首席解讀——

      BRTV新聞
      2026-01-24 18:20:10
      廣州交警公布一起典型事故:電動(dòng)自行車駕駛?cè)诉`規(guī)被撞致死,其承擔(dān)事故全部責(zé)任,小車司機(jī)無(wú)責(zé)

      廣州交警公布一起典型事故:電動(dòng)自行車駕駛?cè)诉`規(guī)被撞致死,其承擔(dān)事故全部責(zé)任,小車司機(jī)無(wú)責(zé)

      大風(fēng)新聞
      2026-01-24 17:42:04
      羅永浩,人民日?qǐng)?bào)表?yè)P(yáng)你了!

      羅永浩,人民日?qǐng)?bào)表?yè)P(yáng)你了!

      不主流講話
      2026-01-24 13:59:20
      34國(guó)軍方高官被召集!美媒:美軍參聯(lián)會(huì)主席將舉行“罕見”會(huì)議

      34國(guó)軍方高官被召集!美媒:美軍參聯(lián)會(huì)主席將舉行“罕見”會(huì)議

      環(huán)球網(wǎng)資訊
      2026-01-24 17:46:50
      快報(bào)調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

      快報(bào)調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

      現(xiàn)代快報(bào)
      2026-01-24 18:53:06
      高市早苗選擇“政治豪賭”,在野政黨痛批“沒有大義”,日本迎來(lái)“最匆忙”大選

      高市早苗選擇“政治豪賭”,在野政黨痛批“沒有大義”,日本迎來(lái)“最匆忙”大選

      環(huán)球網(wǎng)資訊
      2026-01-24 06:51:18
      難以置信!女子十二樂(lè)坊成員直播養(yǎng)不活自己,一晚上打賞不到3000

      難以置信!女子十二樂(lè)坊成員直播養(yǎng)不活自己,一晚上打賞不到3000

      火山詩(shī)話
      2026-01-24 11:37:19
      平價(jià)白菜檢出劇毒農(nóng)藥 央視一曝光 買菜的人全慌了

      平價(jià)白菜檢出劇毒農(nóng)藥 央視一曝光 買菜的人全慌了

      墜入二次元的海洋
      2026-01-24 12:56:20
      內(nèi)蒙古赤峰一70歲老人走失近兩天在冰河下被發(fā)現(xiàn),救援隊(duì)午夜鑿破近10厘米冰層撈出遺體

      內(nèi)蒙古赤峰一70歲老人走失近兩天在冰河下被發(fā)現(xiàn),救援隊(duì)午夜鑿破近10厘米冰層撈出遺體

      極目新聞
      2026-01-24 16:17:17
      央視曝光!真別再吃了!頭皮發(fā)麻!市監(jiān)局通報(bào)40批食品抽檢不合格

      央視曝光!真別再吃了!頭皮發(fā)麻!市監(jiān)局通報(bào)40批食品抽檢不合格

      蜉蝣說(shuō)
      2026-01-24 12:45:07
      夢(mèng)回朱日和:張又俠掛帥,“多維偵察平臺(tái)”點(diǎn)亮演兵場(chǎng)!

      夢(mèng)回朱日和:張又俠掛帥,“多維偵察平臺(tái)”點(diǎn)亮演兵場(chǎng)!

      華山穹劍
      2025-12-02 20:31:08
      動(dòng)車組專家:我國(guó)旅客列車室內(nèi)二氧化碳濃度標(biāo)準(zhǔn)限值為2500ppm,限值內(nèi)濃度對(duì)健康無(wú)影響

      動(dòng)車組專家:我國(guó)旅客列車室內(nèi)二氧化碳濃度標(biāo)準(zhǔn)限值為2500ppm,限值內(nèi)濃度對(duì)健康無(wú)影響

      澎湃新聞
      2026-01-24 13:27:13
      李亞鵬比賈國(guó)龍高明太多了

      李亞鵬比賈國(guó)龍高明太多了

      智識(shí)漂流
      2026-01-24 19:27:57
      工廠停擺、門店撤退:理想汽車的“嚴(yán)冬”,比預(yù)想中來(lái)得更冷

      工廠停擺、門店撤退:理想汽車的“嚴(yán)冬”,比預(yù)想中來(lái)得更冷

      科技Nice
      2026-01-23 11:27:59
      停車11分鐘收費(fèi)16元,車主抱怨收費(fèi)太貴不合理;市監(jiān)部門回應(yīng):市場(chǎng)自由定價(jià),有公示不算違規(guī)

      停車11分鐘收費(fèi)16元,車主抱怨收費(fèi)太貴不合理;市監(jiān)部門回應(yīng):市場(chǎng)自由定價(jià),有公示不算違規(guī)

      大風(fēng)新聞
      2026-01-24 17:12:03
      有料財(cái)經(jīng):2026年有色金屬行業(yè)具有“十倍股”增長(zhǎng)潛力的上市公司

      有料財(cái)經(jīng):2026年有色金屬行業(yè)具有“十倍股”增長(zhǎng)潛力的上市公司

      有料財(cái)經(jīng)
      2026-01-24 17:26:50
      2026-01-24 23:31:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12056文章數(shù) 176362關(guān)注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      被雪豹咬傷女子從急診轉(zhuǎn)出 目擊者:她沒有去摸豹子

      頭條要聞

      被雪豹咬傷女子從急診轉(zhuǎn)出 目擊者:她沒有去摸豹子

      體育要聞

      當(dāng)家球星打替補(bǔ),他們?cè)诠室鈹[爛?

      娛樂(lè)要聞

      回歸還是頂流 鳳凰傳奇將現(xiàn)身馬年春晚

      財(cái)經(jīng)要聞

      “百年老字號(hào)”張小泉遭60億債務(wù)壓頂

      汽車要聞

      有增程和純電版可選 日產(chǎn)NX8或于3-4月間上市

      態(tài)度原創(chuàng)

      藝術(shù)
      本地
      數(shù)碼
      房產(chǎn)
      公開課

      藝術(shù)要聞

      303米!這座“涌泉”之樓,是綠地在濟(jì)南拿下的首個(gè)“第一高”

      本地新聞

      云游中國(guó)|格爾木的四季朋友圈,張張值得你點(diǎn)贊

      數(shù)碼要聞

      酷態(tài)科6號(hào)Ultra充電器曝光:雙Type-C接口均支持100W快充

      房產(chǎn)要聞

      正式官宣!三亞又一所名校要來(lái)了!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲男同志网站| 亚洲人妻在线一区二区| 把女邻居弄到潮喷的性经历| 人妻日韩精品中文字幕| 性交大片| 国产亚洲精品久久久久丝瓜| 大伊香蕉精品一区二区| 精品欧美h无遮挡在线看中文 | 亚洲综合社区| 精品久久久久久亚洲中文字幕| 永久免费无码网站在线观看| AV人摸人人人澡人人超碰下载| 国产老熟女狂叫对白| 伊人春色激情综合激情网| 亚洲国产精品一区二区久久hs | 成人做爰视频www网站小优视频| 老熟妇性老熟妇性色| 亚洲精品成人中文网| 精品99视频| 66久久| 亚洲在线人妻| 乱码午夜-极国产极内射| 91人妻熟妇在线视频| 鲁鲁夜夜天天综合视频| 图片区小说区视频区综合| 日韩欧美在线综合网另类| 亚洲人成网站观看在线观看| 无码人妻一区二区三区一| 亚洲无码成人电影| 六月婷婷久香在线视频| 成人视频在线观看18| 高清国产精品人妻一区二区| 最近免费中文字幕中文高清百度| 毛茸茸XXXX自慰| 国产欧美精品一区二区三区,| 久热中文| 波多野结衣三区| 人妻[21p]大胆| 国产在线中文字幕精品| 久久www免费人成—看片| 中日韩在线视频|