網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

又是量化基金，第二個(gè)DeepSeek時(shí)刻到來了？

2026-01-02 09:54:13　來源: 字母榜

北京舉報(bào)

分享至

九坤投資旗下的至知?jiǎng)?chuàng)新研究院發(fā)布了開源編程Agent模型IQuest-Coder-V1。至知研究院在AI領(lǐng)域名氣不大，但這個(gè)模型的benchmark數(shù)據(jù)直接對(duì)標(biāo)了行業(yè)頂尖水平。

母公司是量化私募，發(fā)布時(shí)間是1月，這兩個(gè)特征組合在一起，很容易讓人想起去年同期的DeepSeek R1。

事實(shí)上，去年DeepSeek R1發(fā)布的時(shí)候也是相同的情況，一個(gè)知名度不高的公司，發(fā)布了一個(gè)行業(yè)頂尖的模型。

那么IQuest-Coder-V1會(huì)是下一個(gè)“DeepSeek時(shí)刻”嗎？

暫時(shí)還不好下結(jié)論。

根據(jù)JetBrains的《2025 開發(fā)者生態(tài)系統(tǒng)現(xiàn)狀報(bào)告》，全球85%的開發(fā)者已經(jīng)在使用AI工具，全球41%的代碼由AI生成，但這些工具大多停留在輔助層面。

從OpenAI到Anthropic，各家在2025年底密集推出的agent產(chǎn)品，都將代碼作為突破口。

所以至少可以肯定，編程Agent就是下一個(gè)風(fēng)口。

IQuest-Coder-V1不是一個(gè)簡(jiǎn)單的代碼補(bǔ)全工具，而是一個(gè)能夠自主完成軟件工程全流程的代碼大語言模型。

過去的AI編程助手的作用是自動(dòng)補(bǔ)全，你寫一半代碼，它幫你接下去。而IQuest-Coder-V1則是能夠從零開始理解需求、設(shè)計(jì)架構(gòu)、編寫代碼、測(cè)試調(diào)試，甚至進(jìn)行多輪迭代優(yōu)化。

IQuest-Coder-V1有三個(gè)很關(guān)鍵的技術(shù)點(diǎn)。

第一是40B的參數(shù)規(guī)模。相比GPT-5和Gemini 3等動(dòng)輒數(shù)千億參數(shù)的模型，40B只是它們的幾十分之一左右。

也就是說，IQuest-Coder-V1可以在性能稍好的消費(fèi)級(jí)硬件上運(yùn)行，而不需要專業(yè)的數(shù)據(jù)中心級(jí)別算力。

第二個(gè)特點(diǎn)是Loop架構(gòu)。

這個(gè)名字很直白，模型會(huì)循環(huán)迭代自己的輸出。就像程序員寫完代碼會(huì)回過頭檢查、修改、重構(gòu)一樣，Loop架構(gòu)讓模型在生成代碼后能夠反思和改進(jìn)。

但Loop架構(gòu)不是簡(jiǎn)單的多次調(diào)用，而是將迭代優(yōu)化的過程內(nèi)化到模型架構(gòu)中。簡(jiǎn)單概括就是IQuest-Coder-V1會(huì)超額完成任務(wù)，以確保最終輸出的結(jié)果覆蓋用戶的需求。

Loop版本讓模型“走兩遍”相同的神經(jīng)網(wǎng)絡(luò)，就像你讀文章時(shí)會(huì)回頭重讀關(guān)鍵段落，第二遍往往能發(fā)現(xiàn)第一遍沒注意到的問題。

第三個(gè)特點(diǎn)是code-flow訓(xùn)練范式。

傳統(tǒng)的代碼模型學(xué)習(xí)的是代碼片段，學(xué)習(xí)的是靜態(tài)的語法和API調(diào)用模式。用大白話來解釋，AI可以完美復(fù)刻它所學(xué)習(xí)的代碼，卻不理解為什么要這么寫。

但I(xiàn)Quest-Coder-V1學(xué)習(xí)的是軟件如何一步步演化出來的，學(xué)習(xí)的是動(dòng)態(tài)的邏輯演進(jìn)。這讓模型不僅理解“這段代碼是什么”，還理解“這段代碼為什么這樣寫”、“下一步應(yīng)該怎么改”。

IQuest-Coder-V1使用32k高質(zhì)量軌跡數(shù)據(jù)進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練，這些軌跡通過multi-agent role-playing自動(dòng)生成。

系統(tǒng)會(huì)模擬用戶、Agent、Server三方交互，用戶提出需求，Agent編寫代碼，Server返回執(zhí)行結(jié)果，整個(gè)過程無需人工標(biāo)注。訓(xùn)練目標(biāo)不是單次代碼生成，而是完整的軟件演化過程。

這些技術(shù)設(shè)計(jì)在benchmark上得到了驗(yàn)證。在SWE-Bench Verified這個(gè)衡量真實(shí)軟件工程能力的測(cè)試中，IQuest-Coder-V1達(dá)到了81.4%的準(zhǔn)確率，超過了Claude Sonnet 4.5的77.2%。在LiveCodeBench v6上的表現(xiàn)是81.1%，在BigCodeBench上是49.9%。

IQuest-Coder-V1來自九坤投資創(chuàng)始團(tuán)隊(duì)發(fā)起設(shè)立的至知?jiǎng)?chuàng)新研究院。這個(gè)研究院獨(dú)立于九坤的量化投研體系，其職能是研究多個(gè)AI應(yīng)用方向。

九坤投資本身是中國(guó)最早一批量化私募之一，成立于2012年，目前管理規(guī)模超過600億人民幣，和明汯、幻方、靈均并稱量化“四大天王”。

創(chuàng)始人王琛擁有清華大學(xué)數(shù)學(xué)物理學(xué)士和計(jì)算機(jī)博士學(xué)位，師從圖靈獎(jiǎng)唯一華人得主姚期智院士。聯(lián)合創(chuàng)始人姚齊聰是北京大學(xué)數(shù)學(xué)學(xué)士、金融數(shù)學(xué)碩士。

兩人都來自華爾街頂級(jí)對(duì)沖基金千禧年(Millennium)，2010年看準(zhǔn)中國(guó)股指期貨上市的機(jī)遇回國(guó)創(chuàng)業(yè)。

九坤從2020年開始建設(shè)名為"北溟"的超算集群，內(nèi)部設(shè)有AI Lab、Data Lab和水滴實(shí)驗(yàn)室。

這些基礎(chǔ)設(shè)施原本服務(wù)于量化投資業(yè)務(wù)，現(xiàn)在也為大模型研發(fā)提供了算力支持。

量化機(jī)構(gòu)擁有大規(guī)模算力集群和數(shù)據(jù)處理能力，這與大模型訓(xùn)練的資源需求相匹配。同時(shí)在人才結(jié)構(gòu)上，量化投資和AI研究都需要數(shù)學(xué)、計(jì)算機(jī)背景的研究人員，這使得量化機(jī)構(gòu)進(jìn)入大模型領(lǐng)域時(shí)有一定的基礎(chǔ)。

從量化投資到開源大模型，這條路徑并不突兀。

量化機(jī)構(gòu)本身就擁有大規(guī)模算力集群和海量數(shù)據(jù)處理能力，這與大模型訓(xùn)練的需求高度契合。更重要的是，量化投資和AI研究在人才結(jié)構(gòu)上有很大重疊，都需要數(shù)學(xué)、計(jì)算機(jī)、物理背景的研究型人才。

因此從發(fā)展角度看，IQuest-Coder-V1更像是九坤在AI方面的自然延伸，并非簡(jiǎn)單跟風(fēng)。

但不可否認(rèn)的是，IQuest和DeepSeek，兩者有著驚人的相似性。

它們都來自中國(guó)量化基金，都展示了在資源受限情況下通過工程創(chuàng)新實(shí)現(xiàn)技術(shù)突破的能力。但仔細(xì)觀察會(huì)發(fā)現(xiàn)，兩者選擇了完全相反的方向。

DeepSeek追求的是“廣度”。從DeepSeek-V3到R1，梁文鋒團(tuán)隊(duì)的目標(biāo)是打造通用對(duì)話能力，要做中國(guó)的GPT。

它要回答各種領(lǐng)域的問題，要能寫詩、講故事、分析時(shí)事、解決數(shù)學(xué)題。這是一個(gè)橫向擴(kuò)張的路徑，覆蓋盡可能多的應(yīng)用場(chǎng)景。

IQuest-Coder-V1追求的是“精度”。它專注在代碼這個(gè)垂直領(lǐng)域，在SWE-Bench這樣的專業(yè)測(cè)試上做到極致。它不關(guān)心能不能寫詩，只關(guān)心能不能像真正的程序員一樣理解需求、設(shè)計(jì)系統(tǒng)、解決bug。

有意思的是，就在IQuest-Coder-V1發(fā)布的同一天，DeepSeek團(tuán)隊(duì)也有新動(dòng)作。

包括創(chuàng)始人梁文鋒在內(nèi)的19位研究者發(fā)布了關(guān)于mHC(manifold-constrained hyperconnection，流形約束超連接)架構(gòu)的論文。這篇論文解決的是超連接網(wǎng)絡(luò)在大規(guī)模訓(xùn)練中的不穩(wěn)定性問題。

雖然DeepSeek團(tuán)隊(duì)在研究工作上保持一定的更新頻率，然而在產(chǎn)品方面，他們卻顯得有些落后，至今仍然沒有拿出R2和V4。

2025年，AI領(lǐng)域的競(jìng)爭(zhēng)焦點(diǎn)是對(duì)話能力和推理能力，各家比的是誰能更好地回答問題，誰的推理過程更清晰。到了2026年，這個(gè)焦點(diǎn)已經(jīng)轉(zhuǎn)向Agent能力，比的是AI能否自主完成復(fù)雜的多步驟任務(wù)。

Agent能力的核心是“執(zhí)行”，而不僅僅是“理解”和“回答”。

就拿代碼舉例，一個(gè)對(duì)話型AI可以告訴你如何修復(fù)代碼中的bug，但Agent能直接幫你改好代碼、運(yùn)行測(cè)試、提交修改。這是完全不同的能力層級(jí)。

DeepSeek團(tuán)隊(duì)在研究層面確實(shí)很活躍，不斷發(fā)表論文推進(jìn)底層技術(shù)。可一旦落實(shí)到產(chǎn)品就會(huì)發(fā)現(xiàn)，DeepSeek仍然主要是一個(gè)對(duì)話型AI。用戶提問，它給答案，這是它的主要使用場(chǎng)景。

DeepSeek目前還沒有推出真正的Agent產(chǎn)品，沒有像IQuest-Coder那樣能自主完成整個(gè)軟件開發(fā)流程的能力。

誠(chéng)然，DeepSeek在Alpha Arena這樣的AI炒幣/炒股比賽中表現(xiàn)很亮眼，證明了量化基金訓(xùn)練出的模型“真的懂市場(chǎng)”，能讀懂K線、解析新聞、做出交易決策。

而量化投資的本質(zhì)是用算法理解市場(chǎng)規(guī)律，尋找價(jià)格波動(dòng)中的模式。進(jìn)一步說明DeepSeek具有“理解復(fù)雜系統(tǒng)”的能力。

但需要指出的是，即使在金融市場(chǎng)表現(xiàn)出色，這種能力仍停留在“理解”和“分析”層面。DeepSeek可以分析市場(chǎng)、給出建議，但它作為產(chǎn)品還沒有發(fā)展出完整的自主交易能力。

從炒股到寫代碼，幻方和九坤的AI都在展示同一種傾向，就是更強(qiáng)的執(zhí)行導(dǎo)向。這或許能解釋為什么量化基金能在AI領(lǐng)域做出成果，因?yàn)樗麄兊幕蚓褪恰白屗惴ㄗ灾鳑Q策”，而不是“讓算法回答問題”。

現(xiàn)在關(guān)于AI的競(jìng)爭(zhēng)不只是比誰的論文更多，更重要的是落地，是誰能把技術(shù)轉(zhuǎn)化成用戶可以直接使用的工具。

市場(chǎng)已經(jīng)等了太久，梁文鋒該發(fā)新產(chǎn)品了。

IQuest-Coder-V1對(duì)標(biāo)的是Claude Opus 4.5。這個(gè)定位很明確，81.4%對(duì)80.9%的benchmark數(shù)據(jù)也確實(shí)亮眼。

再加上Anthropic對(duì)華態(tài)度的強(qiáng)硬，也讓人們對(duì)Quest-Coder-V1投入了更多的希望。但“取代Claude Opus 4.5”這個(gè)問題需要更冷靜的分析。

Claude Opus 4.5的優(yōu)勢(shì)不只在模型能力，更在于完整的產(chǎn)品生態(tài)。它有原生的VS Code擴(kuò)展，有Claude Code這樣面向終端的交互式開發(fā)工具，支持MCP協(xié)議的工具生態(tài)，有企業(yè)級(jí)的安全合規(guī)標(biāo)準(zhǔn)，還有無數(shù)真實(shí)項(xiàng)目打磨出的用戶體驗(yàn)。這些都不是一個(gè)剛發(fā)布的模型能夠在短期內(nèi)復(fù)制的。

更重要的是用戶習(xí)慣。Claude發(fā)布得早，程序員群體已經(jīng)習(xí)慣了它的“工作方式”，知道什么時(shí)候該信任它，什么時(shí)候該介入，如何高效協(xié)作。

這種使用習(xí)慣的養(yǎng)成需要時(shí)間，需要在無數(shù)次試錯(cuò)中建立起來。一個(gè)新模型即使benchmark數(shù)據(jù)更好，也需要相當(dāng)長(zhǎng)的時(shí)間來培養(yǎng)用戶信任。

benchmark和實(shí)際應(yīng)用之間確實(shí)存在差距。

雖說SWE-Bench Verified測(cè)試的是在真實(shí)代碼倉庫中解決issue的能力，這比簡(jiǎn)單的代碼補(bǔ)全要復(fù)雜得多。然而即使在這樣的測(cè)試中表現(xiàn)出色，也不等于在日常開發(fā)中就能無縫替代人類程序員。

實(shí)際工作中的需求往往是模糊的，在產(chǎn)品經(jīng)理與開發(fā)者的溝通過程中，需求往往會(huì)改變很多，而這些都是benchmark上沒有的。

不過IQuest-Coder-V1的機(jī)遇在于另一些維度。它是開源的，這意味著企業(yè)可以自己部署，可以根據(jù)需要調(diào)整和優(yōu)化，不需要擔(dān)心數(shù)據(jù)被第三方服務(wù)商獲取。對(duì)于金融、醫(yī)療、國(guó)防等對(duì)數(shù)據(jù)安全有嚴(yán)格要求的行業(yè)，這是實(shí)實(shí)在在的價(jià)值。

這種開源代碼大模型的體驗(yàn)，完全區(qū)別于Claude用戶。Claude的用戶更多是習(xí)慣了云服務(wù)、愿意為便利性付費(fèi)、對(duì)數(shù)據(jù)隱私?jīng)]有極端要求的開發(fā)者。IQuest-Coder-V1的潛在用戶應(yīng)該是需要數(shù)據(jù)自主可控的企業(yè)、想要深度定制的技術(shù)團(tuán)隊(duì)、或者就是喜歡折騰開源工具的開發(fā)者。

就比如做像九坤和幻方這樣做量化的，他們的算法就是企業(yè)的命脈，不可能上傳到公有云。

當(dāng)然，開源也有開源的問題。沒有專門的產(chǎn)品團(tuán)隊(duì)來打磨用戶體驗(yàn)，沒有客服來解決使用中的問題，遇到bug只能自己想辦法或者等社區(qū)修復(fù)。這些都是開源模型相比商業(yè)產(chǎn)品的劣勢(shì)。

有一種觀點(diǎn)認(rèn)為，像是IQuest-Coder-V1這樣帶有一定agent功能的代碼大模型，可能是通向通用agent以及AGI的第一步。

這個(gè)觀點(diǎn)的邏輯在于，代碼是結(jié)構(gòu)化的、邏輯清晰的任務(wù)，相比其他開放性任務(wù)更容易驗(yàn)證對(duì)錯(cuò)。測(cè)試通過與否，這種二元反饋為agent提供了明確的學(xué)習(xí)信號(hào)。

更重要的是，編程任務(wù)本身需要的能力是通用agent所需的核心能力。

從SWE-Bench這樣的benchmark來看，它測(cè)試的不只是代碼生成，而是理解需求、規(guī)劃步驟、調(diào)試錯(cuò)誤、迭代改進(jìn)等能力。這個(gè)過程和解決其他復(fù)雜任務(wù)的模式是相通的。

代碼環(huán)境提供了一個(gè)相對(duì)可控的訓(xùn)練場(chǎng)，一旦在這里證明了它的Agent能力，擴(kuò)展到其他領(lǐng)域的技術(shù)路徑就會(huì)更清晰。

所以，九坤可能也在下一盤大棋。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.