<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      RAG神話破滅?斯坦福頂尖團隊新研究:合成數據訓練效果反超,成本大降

      0
      分享至


      在大模型商業化落地的進程中,醫療、金融等高精尖垂直領域,始終面臨著一個核心難題:既要嚴控回答準確率、杜絕AI幻覺,又要控制部署成本,適配更多實際應用場景。長期以來,業內早已形成定論,檢索增強生成(RAG)是破解這一難題的最優方案,甚至成為行業默認的標準答案。

      直到2026年3月,一支集結了全球頂尖院校力量的科研團隊,用一項重磅研究成果,徹底打破了這一固化格局。

      斯坦福大學教授、NLP領域頂級學者、麥克阿瑟天才獎得主、大模型常識推理與對齊領域領軍人物Yejin Choi,聯合斯坦福大學副教授James Zou,帶領來自斯坦福大學的Seungju Han、Konwoo Kim、Suhas Kotha、麻省理工學院(MIT)的Chanwoo Park、華盛頓大學的Benjamin Newman、Jaehun Jung多位青年科研骨干,在arXiv平臺發布最新論文《Synthetic Mixed Training: Scaling Parametric Knowledge Acquisition Beyond RAG》,用嚴謹詳實的實驗數據,完成了一次對傳統技術路線的顛覆。

      這支科研夢之隊,在大量對照實驗中,揭開了一個被行業長期忽視的真相:

      傳統合成數據效果不及RAG,從來不是數據本身存在缺陷,而是使用方式存在誤區。

      該研究通過改良訓練模式、優化數據配比,團隊成功盤活合成數據潛力,實現了對主流RAG方案的反超,為大模型垂直領域適配,開辟了一條低成本、高效率的全新路徑。


      被低估的合成數據:常年淪為配角,并非能力不足

      談及大模型落地垂直領域,RAG技術早已占據不可撼動的地位。通俗來講,RAG就像是為大模型配備了一座隨身外部知識庫,遇到模糊不清的問題、專業性極強的知識點,模型無需依賴自身有限的預訓練記憶,而是實時檢索外部資料,邊查證邊作答,最大限度降低幻覺出錯率,這也是它能牢牢占據金融、醫療等高精準度賽道的核心原因。

      與之相對,合成數據訓練,一直被視作RAG的輔助手段。業內普遍認為,依靠合成數據微調的模型,知識儲備有限、性能提升存在天花板,即便大量堆砌數據、更換更強的生成模型,效果也始終無法趕超RAG,兩者之間仿佛存在一道難以逾越的鴻溝。

      這支頂尖團隊最初也遭遇了同樣的瓶頸。在多輪測試中,單純使用合成問答對、或是僅用合成文檔訓練模型,性能提升都極為緩慢,即便加大數據投放量,效果也會快速觸頂,甚至比成熟RAG方案低4.6%。

      經過反復復盤實驗,團隊終于找準了問題癥結:

      單一類型的合成數據訓練,只能讓模型習得片面能力,無法實現知識與能力的融合。 合成問答對擅長訓練模型的推理邏輯、知識調用技巧,卻無法讓模型牢牢掌握專業細節; 合成文檔能填充垂直領域干貨,卻難以教會模型靈活運用知識。二者單打獨斗,自然無法突破性能上限。

      針對這一核心短板,團隊徹底摒棄傳統單一訓練模式,提出兩大關鍵改良策略——合成混合訓練(SMT,Synthetic Mixed Training)聚焦重寫(Focal Rewriting),徹底釋放了合成數據的潛力。

      SMT實現破局:讓AI從“開卷查資料”轉向“閉卷記知識”

      如果把RAG比作開卷考試,允許隨時翻閱資料作答,那么SMT合成混合訓練,就是讓AI在訓練階段完成系統學習,把知識點內化成本身記憶,依靠自身實力應對各類問題。

      SMT的核心邏輯簡潔卻直擊要害:將合成問答對與合成文檔按1:1比例混合,共同用于模型微調訓練

      兩類數據形成完美互補,問答對負責錘煉模型的推理能力、解題思路,文檔負責灌輸專業領域知識,讓AI既懂邏輯方法,又有扎實儲備,擺脫片面學習的局限。

      為了進一步提升訓練效率,避免模型耗費精力在冗余、重復的無效信息上,團隊還配套推出聚焦重寫技術。這項技術相當于為AI劃定核心考點,引導生成的文檔緊扣關鍵問題展開,剔除無關內容,讓模型集中吸收高價值知識點,大幅提升學習效率。


      這套組合策略,交出了亮眼的成績單。論文實驗數據顯示,在長文本理解(QuALITY)、醫療專業問答(LongHealth)、金融分析研判(FinanceBench)三大權威測試場景中,通過SMT與Focal Rewriting組合策略微調的模型,實現了對傳統RAG的超越,在QuaLITY數據集上領先幅度高達4.4%。更具實用價值的是,將SMT訓練后的模型與RAG結合使用,性能可在原有基礎上再提升9.1%,實現雙重增效。



      該技術對中小參數模型格外友好,8B及以下的輕量模型,僅需少量高質量合成數據,就能達到甚至超越傳統RAG的效果,無需堆砌海量算力,不用搭建復雜的檢索系統,大幅降低了企業落地門檻,讓中小廠商也能輕松布局垂直領域AI。

      不止技術逆襲:改寫大模型行業競爭邏輯

      SMT的價值,遠不止實驗室里的性能突破,更攪動了整個大模型行業的發展格局,打破了行業多年來“唯參數論、唯算力論”的慣性思維。

      過去幾年,大模型行業陷入粗放式內卷,各大機構盲目比拼模型參數規模、投入算力大小,誤以為硬件越強,模型性能就越優。可隨著算力投入不斷加大,邊際效益持續遞減,這種野蠻生長的模式早已走到瓶頸。

      SMT用實踐證明,精細化的數據處理與科學訓練,遠比盲目擴張硬件更具價值。不必執著于超大參數模型,不必耗費巨額算力成本,只要用對合成數據、優化訓練方式,就能實現質的性能飛躍,為行業開辟了輕量化發展的新路線。


      與此同時,SMT進一步豐富了大模型落地體系。它并非要取代RAG,而是與RAG形成互補。RAG更適合知識需要實時更新的場景,SMT則適配離線環境、邊緣設備等無法聯網檢索的場景,二者靈活搭配,能覆蓋更多應用需求,適配更廣泛的行業場景。

      當然,這項新技術仍有完善空間。


      目前SMT在70B以上超大模型上的適配效果,還需更多實驗驗證,合成數據的質量管控、多樣性把控也有待進一步優化。但實驗中呈現的穩定增長趨勢,已經充分證明,合成數據訓練擁有巨大的挖掘空間與落地潛力。

      結語:大模型行業,邁入精細化發展新階段

      從RAG一家獨大,到合成數據成功逆襲,這場技術路線的革新,本質上是大模型行業從野蠻擴張走向深耕細作的重要標志。

      Yejin Choi團隊的這項研究,不僅推翻了“合成數據弱于RAG”的行業共識,更為行業指明了新方向:比起堆砌參數、比拼算力,打磨數據質量、優化訓練模式,才是未來競爭的核心著力點。

      對于企業而言,深耕高質量合成數據、布局高效訓練方法,將成為下一階段搶占市場的核心競爭力。對于整個行業來說,多元技術路線并行融合,將推動大模型落地更靈活、成本更親民、應用更廣泛,徹底告別粗放內卷,邁向效率與質量并重的高質量發展時代。

      (本文首發鈦媒體APP,作者 | 硅谷Tech-news,編輯 | 趙虹宇)

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      追求字母哥,5換1方案出爐,湖人也沒有想到,狀元郎淪為交易籌碼

      追求字母哥,5換1方案出爐,湖人也沒有想到,狀元郎淪為交易籌碼

      體育大朋說
      2026-03-28 21:19:11
      近期,一名中國男子去泰國玩,花6000泰銖找21歲女孩,悲劇發生了

      近期,一名中國男子去泰國玩,花6000泰銖找21歲女孩,悲劇發生了

      鯨探所長
      2026-03-01 14:38:25
      巴薩暴怒!拉菲尼亞重傷:休戰5周+無緣6場惡戰 弗里克批他太魯莽

      巴薩暴怒!拉菲尼亞重傷:休戰5周+無緣6場惡戰 弗里克批他太魯莽

      風過鄉
      2026-03-28 06:12:10
      根據俄領導人的提議,俄羅斯寡頭們“自愿”為特別軍事行動捐款

      根據俄領導人的提議,俄羅斯寡頭們“自愿”為特別軍事行動捐款

      山河路口
      2026-03-28 16:19:41
      英國一共搶了中國5塊領土,但只有香港還了,其他4個啥時候還?

      英國一共搶了中國5塊領土,但只有香港還了,其他4個啥時候還?

      全金貓眼
      2026-03-28 16:05:03
      48小時最后通牒變16日拉鋸戰 美國上演“狼來了”

      48小時最后通牒變16日拉鋸戰 美國上演“狼來了”

      中國能源網
      2026-03-28 12:16:02
      太離譜!機場安檢排隊4.5小時

      太離譜!機場安檢排隊4.5小時

      環球旅訊
      2026-03-28 11:06:44
      原來,這就是特朗普昏招迭出,一頭扎進中東泥潭的真正原因

      原來,這就是特朗普昏招迭出,一頭扎進中東泥潭的真正原因

      芊芊子吟
      2026-03-27 12:55:06
      河北“二婚黃花大閨女”的瓜

      河北“二婚黃花大閨女”的瓜

      皮蛋兒電影
      2026-02-28 13:45:08
      菲律賓艦艇發現中國054A艦,船長毫不猶豫下令:把舵打滿沖上去

      菲律賓艦艇發現中國054A艦,船長毫不猶豫下令:把舵打滿沖上去

      Ck的蜜糖
      2026-03-28 17:14:54
      網傳《雄獅少年》出品方倒閉,當年懟網友,終于為自己的行為買單

      網傳《雄獅少年》出品方倒閉,當年懟網友,終于為自己的行為買單

      八卦南風
      2026-03-27 17:17:39
      每體:拉菲尼亞的受傷引發巴薩高層強烈憤慨,弗里克也極為憤怒

      每體:拉菲尼亞的受傷引發巴薩高層強烈憤慨,弗里克也極為憤怒

      懂球帝
      2026-03-28 06:38:07
      青島膠州警方通報連環撞車事故:4車受損,2人受傷

      青島膠州警方通報連環撞車事故:4車受損,2人受傷

      界面新聞
      2026-03-28 14:00:04
      在快活林,蔣門神和武松打半天,為何在鴛鴦樓被秒殺?有三個原因

      在快活林,蔣門神和武松打半天,為何在鴛鴦樓被秒殺?有三個原因

      銘記歷史呀
      2026-03-27 11:29:29
      美“福特”號航母駛入克羅地亞港口

      美“福特”號航母駛入克羅地亞港口

      澎湃新聞
      2026-03-28 22:53:08
      胖東來創始人于東來:2025年普通員工每個月拿到手9400元

      胖東來創始人于東來:2025年普通員工每個月拿到手9400元

      總在茶余后
      2026-03-29 00:37:10
      哈哈哈!伊朗吹牛都不打草稿了

      哈哈哈!伊朗吹牛都不打草稿了

      廖保平
      2026-03-27 09:25:53
      美國不敢公布的馬航內幕:特工隨行,頂級專家失蹤,美女意外死亡

      美國不敢公布的馬航內幕:特工隨行,頂級專家失蹤,美女意外死亡

      可兒故事匯
      2024-09-16 01:53:56
      50歲教授上課突向19歲女學生表白 全班嘩然拿拖鞋追打

      50歲教授上課突向19歲女學生表白 全班嘩然拿拖鞋追打

      環球趣聞分享
      2026-03-28 14:00:09
      城投集團,當地“少爺,少奶奶”的專屬崗位?

      城投集團,當地“少爺,少奶奶”的專屬崗位?

      奇葩游戲醬
      2026-03-27 01:17:17
      2026-03-29 01:28:49
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      131483文章數 862024關注度
      往期回顧 全部

      科技要聞

      華為盤古大模型負責人王云鶴確認離職

      頭條要聞

      美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

      頭條要聞

      美媒:和歐盟"外長"發生激烈交鋒 魯比奧"顯然很惱火"

      體育要聞

      “我是全家最差勁的運動員”

      娛樂要聞

      陳牧馳陳冰官宣得子 曬一家三口握拳照

      財經要聞

      臥底"科技與狠活"培訓:化工調味劑泛濫

      汽車要聞

      置換補貼價4.28萬起 第五代宏光MINIEV正式上市

      態度原創

      健康
      旅游
      教育
      時尚
      軍事航空

      干細胞抗衰4大誤區,90%的人都中招

      旅游要聞

      泰安市岱岳區:賞梨花 看村晚 萬畝梨園迎客來

      教育要聞

      獨家!中招三大變化一文讀懂!2026北京中招政策出爐!

      和田曦薇一樣嫩嘟嘟,這3個變美技巧你一定不能錯過!

      軍事要聞

      美軍中東基地損失最新披露

      無障礙瀏覽 進入關懷版