九坤投資旗下的至知?jiǎng)?chuàng)新研究院發(fā)布了開源編程Agent模型IQuest-Coder-V1。至知研究院在AI領(lǐng)域名氣不大,但這個(gè)模型的benchmark數(shù)據(jù)直接對(duì)標(biāo)了行業(yè)頂尖水平。
母公司是量化私募,發(fā)布時(shí)間是1月,這兩個(gè)特征組合在一起,很容易讓人想起去年同期的DeepSeek R1。
事實(shí)上,去年DeepSeek R1發(fā)布的時(shí)候也是相同的情況,一個(gè)知名度不高的公司,發(fā)布了一個(gè)行業(yè)頂尖的模型。
那么IQuest-Coder-V1會(huì)是下一個(gè)“DeepSeek時(shí)刻”嗎?
暫時(shí)還不好下結(jié)論。
根據(jù)JetBrains的《2025 開發(fā)者生態(tài)系統(tǒng)現(xiàn)狀報(bào)告》,全球85%的開發(fā)者已經(jīng)在使用AI工具,全球41%的代碼由AI生成,但這些工具大多停留在輔助層面。
從OpenAI到Anthropic,各家在2025年底密集推出的agent產(chǎn)品,都將代碼作為突破口。
所以至少可以肯定,編程Agent就是下一個(gè)風(fēng)口。
01
IQuest-Coder-V1不是一個(gè)簡(jiǎn)單的代碼補(bǔ)全工具,而是一個(gè)能夠自主完成軟件工程全流程的代碼大語言模型。
過去的AI編程助手的作用是自動(dòng)補(bǔ)全,你寫一半代碼,它幫你接下去。而IQuest-Coder-V1則是能夠從零開始理解需求、設(shè)計(jì)架構(gòu)、編寫代碼、測(cè)試調(diào)試,甚至進(jìn)行多輪迭代優(yōu)化。
IQuest-Coder-V1有三個(gè)很關(guān)鍵的技術(shù)點(diǎn)。
第一是40B的參數(shù)規(guī)模。相比GPT-5和Gemini 3等動(dòng)輒數(shù)千億參數(shù)的模型,40B只是它們的幾十分之一左右。
也就是說,IQuest-Coder-V1可以在性能稍好的消費(fèi)級(jí)硬件上運(yùn)行,而不需要專業(yè)的數(shù)據(jù)中心級(jí)別算力。
第二個(gè)特點(diǎn)是Loop架構(gòu)。
這個(gè)名字很直白,模型會(huì)循環(huán)迭代自己的輸出。就像程序員寫完代碼會(huì)回過頭檢查、修改、重構(gòu)一樣,Loop架構(gòu)讓模型在生成代碼后能夠反思和改進(jìn)。
但Loop架構(gòu)不是簡(jiǎn)單的多次調(diào)用,而是將迭代優(yōu)化的過程內(nèi)化到模型架構(gòu)中。簡(jiǎn)單概括就是IQuest-Coder-V1會(huì)超額完成任務(wù),以確保最終輸出的結(jié)果覆蓋用戶的需求。
Loop版本讓模型“走兩遍”相同的神經(jīng)網(wǎng)絡(luò),就像你讀文章時(shí)會(huì)回頭重讀關(guān)鍵段落,第二遍往往能發(fā)現(xiàn)第一遍沒注意到的問題。
第三個(gè)特點(diǎn)是code-flow訓(xùn)練范式。
傳統(tǒng)的代碼模型學(xué)習(xí)的是代碼片段,學(xué)習(xí)的是靜態(tài)的語法和API調(diào)用模式。用大白話來解釋,AI可以完美復(fù)刻它所學(xué)習(xí)的代碼,卻不理解為什么要這么寫。
但I(xiàn)Quest-Coder-V1學(xué)習(xí)的是軟件如何一步步演化出來的,學(xué)習(xí)的是動(dòng)態(tài)的邏輯演進(jìn)。這讓模型不僅理解“這段代碼是什么”,還理解“這段代碼為什么這樣寫”、“下一步應(yīng)該怎么改”。
IQuest-Coder-V1使用32k高質(zhì)量軌跡數(shù)據(jù)進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,這些軌跡通過multi-agent role-playing自動(dòng)生成。
系統(tǒng)會(huì)模擬用戶、Agent、Server三方交互,用戶提出需求,Agent編寫代碼,Server返回執(zhí)行結(jié)果,整個(gè)過程無需人工標(biāo)注。訓(xùn)練目標(biāo)不是單次代碼生成,而是完整的軟件演化過程。
這些技術(shù)設(shè)計(jì)在benchmark上得到了驗(yàn)證。在SWE-Bench Verified這個(gè)衡量真實(shí)軟件工程能力的測(cè)試中,IQuest-Coder-V1達(dá)到了81.4%的準(zhǔn)確率,超過了Claude Sonnet 4.5的77.2%。在LiveCodeBench v6上的表現(xiàn)是81.1%,在BigCodeBench上是49.9%。
![]()
IQuest-Coder-V1來自九坤投資創(chuàng)始團(tuán)隊(duì)發(fā)起設(shè)立的至知?jiǎng)?chuàng)新研究院。這個(gè)研究院獨(dú)立于九坤的量化投研體系,其職能是研究多個(gè)AI應(yīng)用方向。
九坤投資本身是中國(guó)最早一批量化私募之一,成立于2012年,目前管理規(guī)模超過600億人民幣,和明汯、幻方、靈均并稱量化“四大天王”。
創(chuàng)始人王琛擁有清華大學(xué)數(shù)學(xué)物理學(xué)士和計(jì)算機(jī)博士學(xué)位,師從圖靈獎(jiǎng)唯一華人得主姚期智院士。聯(lián)合創(chuàng)始人姚齊聰是北京大學(xué)數(shù)學(xué)學(xué)士、金融數(shù)學(xué)碩士。
兩人都來自華爾街頂級(jí)對(duì)沖基金千禧年(Millennium),2010年看準(zhǔn)中國(guó)股指期貨上市的機(jī)遇回國(guó)創(chuàng)業(yè)。
九坤從2020年開始建設(shè)名為"北溟"的超算集群,內(nèi)部設(shè)有AI Lab、Data Lab和水滴實(shí)驗(yàn)室。
這些基礎(chǔ)設(shè)施原本服務(wù)于量化投資業(yè)務(wù),現(xiàn)在也為大模型研發(fā)提供了算力支持。
量化機(jī)構(gòu)擁有大規(guī)模算力集群和數(shù)據(jù)處理能力,這與大模型訓(xùn)練的資源需求相匹配。同時(shí)在人才結(jié)構(gòu)上,量化投資和AI研究都需要數(shù)學(xué)、計(jì)算機(jī)背景的研究人員,這使得量化機(jī)構(gòu)進(jìn)入大模型領(lǐng)域時(shí)有一定的基礎(chǔ)。
從量化投資到開源大模型,這條路徑并不突兀。
量化機(jī)構(gòu)本身就擁有大規(guī)模算力集群和海量數(shù)據(jù)處理能力,這與大模型訓(xùn)練的需求高度契合。更重要的是,量化投資和AI研究在人才結(jié)構(gòu)上有很大重疊,都需要數(shù)學(xué)、計(jì)算機(jī)、物理背景的研究型人才。
因此從發(fā)展角度看,IQuest-Coder-V1更像是九坤在AI方面的自然延伸,并非簡(jiǎn)單跟風(fēng)。
02
但不可否認(rèn)的是,IQuest和DeepSeek,兩者有著驚人的相似性。
它們都來自中國(guó)量化基金,都展示了在資源受限情況下通過工程創(chuàng)新實(shí)現(xiàn)技術(shù)突破的能力。但仔細(xì)觀察會(huì)發(fā)現(xiàn),兩者選擇了完全相反的方向。
DeepSeek追求的是“廣度”。從DeepSeek-V3到R1,梁文鋒團(tuán)隊(duì)的目標(biāo)是打造通用對(duì)話能力,要做中國(guó)的GPT。
它要回答各種領(lǐng)域的問題,要能寫詩、講故事、分析時(shí)事、解決數(shù)學(xué)題。這是一個(gè)橫向擴(kuò)張的路徑,覆蓋盡可能多的應(yīng)用場(chǎng)景。
IQuest-Coder-V1追求的是“精度”。它專注在代碼這個(gè)垂直領(lǐng)域,在SWE-Bench這樣的專業(yè)測(cè)試上做到極致。它不關(guān)心能不能寫詩,只關(guān)心能不能像真正的程序員一樣理解需求、設(shè)計(jì)系統(tǒng)、解決bug。
有意思的是,就在IQuest-Coder-V1發(fā)布的同一天,DeepSeek團(tuán)隊(duì)也有新動(dòng)作。
包括創(chuàng)始人梁文鋒在內(nèi)的19位研究者發(fā)布了關(guān)于mHC(manifold-constrained hyperconnection,流形約束超連接)架構(gòu)的論文。這篇論文解決的是超連接網(wǎng)絡(luò)在大規(guī)模訓(xùn)練中的不穩(wěn)定性問題。
雖然DeepSeek團(tuán)隊(duì)在研究工作上保持一定的更新頻率,然而在產(chǎn)品方面,他們卻顯得有些落后,至今仍然沒有拿出R2和V4。
![]()
2025年,AI領(lǐng)域的競(jìng)爭(zhēng)焦點(diǎn)是對(duì)話能力和推理能力,各家比的是誰能更好地回答問題,誰的推理過程更清晰。到了2026年,這個(gè)焦點(diǎn)已經(jīng)轉(zhuǎn)向Agent能力,比的是AI能否自主完成復(fù)雜的多步驟任務(wù)。
Agent能力的核心是“執(zhí)行”,而不僅僅是“理解”和“回答”。
就拿代碼舉例,一個(gè)對(duì)話型AI可以告訴你如何修復(fù)代碼中的bug,但Agent能直接幫你改好代碼、運(yùn)行測(cè)試、提交修改。這是完全不同的能力層級(jí)。
DeepSeek團(tuán)隊(duì)在研究層面確實(shí)很活躍,不斷發(fā)表論文推進(jìn)底層技術(shù)。可一旦落實(shí)到產(chǎn)品就會(huì)發(fā)現(xiàn),DeepSeek仍然主要是一個(gè)對(duì)話型AI。用戶提問,它給答案,這是它的主要使用場(chǎng)景。
DeepSeek目前還沒有推出真正的Agent產(chǎn)品,沒有像IQuest-Coder那樣能自主完成整個(gè)軟件開發(fā)流程的能力。
誠(chéng)然,DeepSeek在Alpha Arena這樣的AI炒幣/炒股比賽中表現(xiàn)很亮眼,證明了量化基金訓(xùn)練出的模型“真的懂市場(chǎng)”,能讀懂K線、解析新聞、做出交易決策。
而量化投資的本質(zhì)是用算法理解市場(chǎng)規(guī)律,尋找價(jià)格波動(dòng)中的模式。進(jìn)一步說明DeepSeek具有“理解復(fù)雜系統(tǒng)”的能力。
但需要指出的是,即使在金融市場(chǎng)表現(xiàn)出色,這種能力仍停留在“理解”和“分析”層面。DeepSeek可以分析市場(chǎng)、給出建議,但它作為產(chǎn)品還沒有發(fā)展出完整的自主交易能力。
從炒股到寫代碼,幻方和九坤的AI都在展示同一種傾向,就是更強(qiáng)的執(zhí)行導(dǎo)向。這或許能解釋為什么量化基金能在AI領(lǐng)域做出成果,因?yàn)樗麄兊幕蚓褪恰白屗惴ㄗ灾鳑Q策”,而不是“讓算法回答問題”。
現(xiàn)在關(guān)于AI的競(jìng)爭(zhēng)不只是比誰的論文更多,更重要的是落地,是誰能把技術(shù)轉(zhuǎn)化成用戶可以直接使用的工具。
市場(chǎng)已經(jīng)等了太久,梁文鋒該發(fā)新產(chǎn)品了。
03
IQuest-Coder-V1對(duì)標(biāo)的是Claude Opus 4.5。這個(gè)定位很明確,81.4%對(duì)80.9%的benchmark數(shù)據(jù)也確實(shí)亮眼。
再加上Anthropic對(duì)華態(tài)度的強(qiáng)硬,也讓人們對(duì)Quest-Coder-V1投入了更多的希望。但“取代Claude Opus 4.5”這個(gè)問題需要更冷靜的分析。
Claude Opus 4.5的優(yōu)勢(shì)不只在模型能力,更在于完整的產(chǎn)品生態(tài)。它有原生的VS Code擴(kuò)展,有Claude Code這樣面向終端的交互式開發(fā)工具,支持MCP協(xié)議的工具生態(tài),有企業(yè)級(jí)的安全合規(guī)標(biāo)準(zhǔn),還有無數(shù)真實(shí)項(xiàng)目打磨出的用戶體驗(yàn)。這些都不是一個(gè)剛發(fā)布的模型能夠在短期內(nèi)復(fù)制的。
更重要的是用戶習(xí)慣。Claude發(fā)布得早,程序員群體已經(jīng)習(xí)慣了它的“工作方式”,知道什么時(shí)候該信任它,什么時(shí)候該介入,如何高效協(xié)作。
![]()
這種使用習(xí)慣的養(yǎng)成需要時(shí)間,需要在無數(shù)次試錯(cuò)中建立起來。一個(gè)新模型即使benchmark數(shù)據(jù)更好,也需要相當(dāng)長(zhǎng)的時(shí)間來培養(yǎng)用戶信任。
benchmark和實(shí)際應(yīng)用之間確實(shí)存在差距。
雖說SWE-Bench Verified測(cè)試的是在真實(shí)代碼倉庫中解決issue的能力,這比簡(jiǎn)單的代碼補(bǔ)全要復(fù)雜得多。然而即使在這樣的測(cè)試中表現(xiàn)出色,也不等于在日常開發(fā)中就能無縫替代人類程序員。
實(shí)際工作中的需求往往是模糊的,在產(chǎn)品經(jīng)理與開發(fā)者的溝通過程中,需求往往會(huì)改變很多,而這些都是benchmark上沒有的。
不過IQuest-Coder-V1的機(jī)遇在于另一些維度。它是開源的,這意味著企業(yè)可以自己部署,可以根據(jù)需要調(diào)整和優(yōu)化,不需要擔(dān)心數(shù)據(jù)被第三方服務(wù)商獲取。對(duì)于金融、醫(yī)療、國(guó)防等對(duì)數(shù)據(jù)安全有嚴(yán)格要求的行業(yè),這是實(shí)實(shí)在在的價(jià)值。
這種開源代碼大模型的體驗(yàn),完全區(qū)別于Claude用戶。Claude的用戶更多是習(xí)慣了云服務(wù)、愿意為便利性付費(fèi)、對(duì)數(shù)據(jù)隱私?jīng)]有極端要求的開發(fā)者。IQuest-Coder-V1的潛在用戶應(yīng)該是需要數(shù)據(jù)自主可控的企業(yè)、想要深度定制的技術(shù)團(tuán)隊(duì)、或者就是喜歡折騰開源工具的開發(fā)者。
就比如做像九坤和幻方這樣做量化的,他們的算法就是企業(yè)的命脈,不可能上傳到公有云。
當(dāng)然,開源也有開源的問題。沒有專門的產(chǎn)品團(tuán)隊(duì)來打磨用戶體驗(yàn),沒有客服來解決使用中的問題,遇到bug只能自己想辦法或者等社區(qū)修復(fù)。這些都是開源模型相比商業(yè)產(chǎn)品的劣勢(shì)。
有一種觀點(diǎn)認(rèn)為,像是IQuest-Coder-V1這樣帶有一定agent功能的代碼大模型,可能是通向通用agent以及AGI的第一步。
這個(gè)觀點(diǎn)的邏輯在于,代碼是結(jié)構(gòu)化的、邏輯清晰的任務(wù),相比其他開放性任務(wù)更容易驗(yàn)證對(duì)錯(cuò)。測(cè)試通過與否,這種二元反饋為agent提供了明確的學(xué)習(xí)信號(hào)。
更重要的是,編程任務(wù)本身需要的能力是通用agent所需的核心能力。
從SWE-Bench這樣的benchmark來看,它測(cè)試的不只是代碼生成,而是理解需求、規(guī)劃步驟、調(diào)試錯(cuò)誤、迭代改進(jìn)等能力。這個(gè)過程和解決其他復(fù)雜任務(wù)的模式是相通的。
代碼環(huán)境提供了一個(gè)相對(duì)可控的訓(xùn)練場(chǎng),一旦在這里證明了它的Agent能力,擴(kuò)展到其他領(lǐng)域的技術(shù)路徑就會(huì)更清晰。
所以,九坤可能也在下一盤大棋。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.