![]()
最近科研圈出了個大新聞,美國華盛頓大學博士生邵如琳團隊搞出的DRTulu深度研究AI助手,直接把科研工具的成本拉到了地板價。
之前用一次OpenAI的深度研究服務要1.8美元,現(xiàn)在DRTulu不到0.002美元就能用,這差距說出來都讓人不敢信。
![]()
DRTulu最打動人的地方,就是它把高質(zhì)量AI研究服務的門檻拉低了。
以前不管是個人研究者還是高校小團隊,想用上靠譜的AI科研工具,每月的費用都是筆不小的負擔。
現(xiàn)在不一樣了,DRTulu單次使用成本連兩厘錢都不到。
![]()
更關(guān)鍵的是,它不是隨便給你列一堆網(wǎng)頁鏈接就完事。
這種體驗以前只有用頂級商用系統(tǒng)才能享受到,現(xiàn)在小團隊也能輕松擁有了。
DRTulu的性能也沒讓人失望,測試下來比所有公開的搜索型AI模型都強,就算跟OpenAI、谷歌的頂級商用系統(tǒng)比也不落下風。
![]()
本來想覺得小模型肯定不如大模型,但后來發(fā)現(xiàn)DRTulu完全打破了這個認知,“小模型+好方法”照樣能做出大成就。
DRTulu能有這么好的表現(xiàn),核心在于它的訓練方法很特別。
研究團隊沒讓它死記硬背一堆問題,而是用了“學徒式”的兩步訓練法。第一步是找名師帶。
團隊請了GPT-5這樣的頂級AI當老師,讓這些老師在回答問題時,把思考、搜索、組織答案的每一步都記下來。
![]()
這些記錄就成了DRTulu的學習教材,跟著頂級老師學,基本功自然扎得牢。
第二步是實戰(zhàn)中進化。光會模仿還不夠,研究團隊搞了個動態(tài)進化的評分標準。
不像傳統(tǒng)方法那樣用固定的評分表,DRTulu回答問題后,會有專門的AI評分官對比多個答案,動態(tài)發(fā)現(xiàn)優(yōu)缺點并更新評分標準。
如此看來,這種方式能讓評分更貼合真實水平,也能避免AI為了湊分數(shù)投機取巧。
![]()
這種AI與評估器協(xié)同進化的框架,還解決了行業(yè)內(nèi)一個大難題。
現(xiàn)在很多AI回答問題容易出現(xiàn)“幻覺”,也就是瞎編內(nèi)容。
對科研人員來說,這種靠譜的特質(zhì)比什么都重要。
![]()
光說不練假把式,DRTulu的實力在實戰(zhàn)中得到了充分驗證。
研究團隊在學術(shù)、醫(yī)療等四個領(lǐng)域的基準測試里,它都達到了當前最優(yōu)水平,和OpenAI的深度研究系統(tǒng)表現(xiàn)相當。
更厲害的是它的跨領(lǐng)域能力。
![]()
DRTulu之前沒專門學過這個領(lǐng)域,卻依然表現(xiàn)出很強的能力,能清晰解釋基因變異的致病機理。
雖然在最終答案的準確性上,比最強商用大模型系統(tǒng)略遜一籌,但它的證據(jù)支持做得更出色。
最讓人驚喜的是,研究團隊把DRTulu完全開放了。
![]()
這種開源精神,讓全球的科研人員都能用上這款工具,還能參與到它的優(yōu)化迭代中。
DRTulu的出現(xiàn),不僅是一款優(yōu)秀AI工具的誕生,更推動了科研普惠的進程。以前被成本和技術(shù)壁壘擋在門外的小團隊,現(xiàn)在有了平等的科研創(chuàng)新機會。
相信隨著這類開源AI工具的不斷發(fā)展,科研圈會出現(xiàn)更多創(chuàng)新成果,讓知識的探索變得更高效、更公平。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.