<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

^{<blockquote id="4phea"></blockquote>}

<sub id="4phea"></sub>

<big id="4phea"></big><nav id="4phea"><strike id="4phea"><legend id="4phea"></legend></strike></nav>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

RAG 檢索模型如何學習：三種損失函數的機制解析

2026-01-22 22:56:43　來源: deephub

北京舉報

0

分享至

Agent 系統發展得這么快那么檢索模型還重要嗎？RAG 本身都已經衍生出 Agentic RAG和 Self-RAG（這些更復雜的變體了。

答案是肯定的，無論 Agent 方法在效率和推理上做了多少改進，底層還是離不開檢索。檢索模型越準，需要的迭代調用就越少，時間和成本都能省下來，所以訓練好的檢索模型依然關鍵。討論 RAG 怎么用的文章鋪天蓋地，但真正比較檢索模型學習方式的內容卻不多見。

檢索系統包含多個組件：檢索嵌入模型、索引算法（HNSW 之類）、向量搜索機制（余弦相似度等）以及重排序模型。這篇文章只聚焦檢索嵌入模型的學習方式。

本文將介紹我實驗過的三種方法：Pairwise cosine embedding loss（成對余弦嵌入損失）、Triplet margin loss（三元組邊距損失）、InfoNCE loss。

成對余弦嵌入損失

正樣本對示例

負樣本對示例

輸入是一對文本加一個標簽，標簽標明這對文本是正匹配還是負匹配。和 MNLI 數據集里的蘊含、矛盾關系類似。

損失函數用的是余弦嵌入損失，x 和 y 分別是文本對的嵌入向量。

三元組邊距損失

輸入變成三個文本：一個錨文本、一個正匹配、一個負匹配。

損失函數是 Triplet Margin Loss。公式里 a 代表錨文本嵌入，p 代表正樣本嵌入，n 代表負樣本嵌入。

InfoNCE 損失

輸入包括一個查詢、一個正匹配、一組負樣本列表。

損失函數采用 InfoNCE，靈感來自 M3-Embedding 論文（arxiv:2402.03216）。公式中 p* 是正樣本嵌入，P' 是負樣本嵌入列表，q 是查詢嵌入，s(.) 表示相似度函數，比如余弦相似度。

比較

哪種方法最好？要看具體場景、數據量和算力。從我的實驗來看，InfoNCE 覆蓋面最廣。但只要實驗做得夠充分、訓練數據比例調得夠細，余弦嵌入損失也能達到差不多的效果。三元組邊距損失我沒有深入探索，不過它可能是介于另外兩者之間的一個折中選項。

https://avoid.overfit.cn/post/7958652dd31e4cf5ace899b97e0eac27

作者：Jerald Teo

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

FlashAttention-4正式發布：算法流水線大改，矩陣乘法級速度

機器之心Pro 2026-03-06 14:48:35
0 跟貼 0
ICLR 2026 | PIL：基于線性代理的不可學習樣本生成方法

機器之心Pro 2026-02-24 19:36:33
0 跟貼 0

多模態檢索新突破，用軟標簽打破傳統剛性映射約束，全面超越CLIP

量子位 2025-11-15 13:18:07
0 跟貼 0

無需訓練、即插即用，這個解碼方法讓模型學會謹慎思考

DeepTech深科技 2026-02-23 20:21:48
0 跟貼 0
劍指世界模型！商湯發多模態理解生成一體化架構，無需編碼器“玩轉”圖像

智東西 2026-03-06 20:12:11
0 跟貼 0

GPT-5.4「原生操控電腦」實測封神！OpenClaw天選模型來了

新智元 2026-03-06 10:35:47
39 跟貼 39

海外華人團隊打造，統一理解與生成的圖像模型，超越Nano banana

機器之心Pro 2026-03-06 14:31:14
0 跟貼 0
MMLU已死？「人類最后考試」登Nature：全球AI模型集體不及格！

新智元 2026-03-07 09:06:10
0 跟貼 0

這些公式放在數學界也是相當炸裂的

挑燈剪輯 2026-03-06 16:08:56
1 跟貼 1
汽車行駛途中突然"斷電" 車輛瞬間失去動力一家人嚇傻

大風新聞 2026-03-06 13:45:07
7094 跟貼 7094
黑馬圖像模型被Nano Banana技術負責人點贊！

量子位 2026-03-06 22:34:17
0 跟貼 0
剛下飛機行李就沒了！杭州姑娘花10多萬去南極旅游卻崩潰：衣物全靠借

環球網資訊 2026-03-03 08:53:57
5886 跟貼 5886
以判別式監督學習強化推理LLM，解決難度偏差和熵崩塌難題

機器之心Pro 2025-10-28 11:14:55
0 跟貼 0
央行行長：中國股票市場在全球主要股市中表現較好

財聯社 2026-03-06 17:08:03
7609 跟貼 7609
機構：霍爾木茲海峽航運幾乎完全停滯

財聯社 2026-03-06 14:04:07
6664 跟貼 6664
發動機模型

制造科技 2026-03-04 18:55:15
0 跟貼 0
智利深山睜開“上帝之眼”，星空數據海嘯來襲

黑科技在身邊 2026-03-05 18:36:00
0 跟貼 0
小鵬加速沖向L4終局：對VLA架構「動刀」成關鍵一環

機器之心Pro 2026-03-06 21:05:29
0 跟貼 0
數據解讀其戰略意圖，深度解析

鄭凱倫倫倫 2026-03-06 10:00:50
0 跟貼 0
Energy Distance：度量兩個多元分布差異的統計方法

deephub 2026-03-06 20:59:28
6 跟貼 6
原來陳夢對誰都變線，這球技莎莎怎么贏，靠刷數據遲早要露餡！

鳳舞搞笑 2026-03-07 10:48:25
1 跟貼 1
又一推理新范式：將LLM自身視作改進操作符，突破長思維鏈極限

機器之心Pro 2025-10-04 18:35:49
0 跟貼 0
男子犯困開智駕，以100km/h速度扎進施工區：事故發生后未能及時接管車輛，連撞30米長水馬都沒停，視頻曝光

大風新聞 2026-03-07 10:05:02
102 跟貼 102
馬斯克都破防！王堅院士笑談美國電網：電的基礎設施制造業都在中國

界面新聞 2026-03-06 14:32:04
181 跟貼 181
租用無人機運棺材上山土葬，無人機運輸從業者：價格一萬出頭，一般運送的棺材約七八百斤，云貴川需求多

觀威海 2026-03-06 14:23:13
271 跟貼 271
中國女足3-0戰勝烏茲別克斯坦女足提前小組出線

央視新聞客戶端 2026-03-06 18:26:54
707 跟貼 707
蒙牛全資控股公司銷售"陰陽包裝"產品客服稱無法監管

大風新聞 2026-03-06 18:30:13
1492 跟貼 1492
100萬 Token + 接管鼠標：GPT-5.4 正把 AI 推向“數字員工”

鈦媒體APP 2026-03-06 09:15:15
1 跟貼 1
生存游戲大挑戰，沒有算法全憑運氣，活下來就能一夜暴富

胖魚看劇 2026-03-06 10:09:16
1 跟貼 1
山姆1.38公斤冰塊賣37.9元，消費者稱比冰塊融化速度慢，而且顏值高，門店工作人員：銷量不錯，現貨極少

觀威海 2026-03-04 10:39:05
1313 跟貼 1313
今年高校畢業生預計1270萬

人民網-人民日報 2026-03-07 10:36:14
1736 跟貼 1736
極目調查丨老板瘋狂搶人，一天500元難招技工，廣州“制衣村”工人為何如此緊俏？

極目新聞 2026-03-06 22:41:34
837 跟貼 837
男生用紙手搓槍械模型，具備“能上膛可出彈”的機械結構

新知速報 2026-03-04 13:48:32
1 跟貼 1
武船片打造向世界展示武漢的窗口

越喬 2026-03-07 08:46:49
0 跟貼 0
人社部：正研究措施發揮人工智能創造新崗位

新華社 2026-03-07 10:31:07
11 跟貼 11
DNA存儲重大突破：科學家首創無酶可重寫DNA硬盤

DeepTech深科技 2026-03-05 11:32:53
2 跟貼 2
二次函數壓軸題核心大總結思維導圖！

大鵬老師講數學 2026-03-06 05:07:00
0 跟貼 0
林徽因落選的國徽方案，網友看后感嘆：審美確實一絕，但真不合適

南書房 2026-03-05 07:00:05
1 跟貼 1
Nano Banana終于不是文盲了，但我可能會變「傻」

愛范兒 2025-11-24 14:33:39
0 跟貼 0
數學，幾乎是全世界最被誤解的東西之一，被徹底教錯了

心中的麥田 2026-03-06 19:29:02
4 跟貼 4

伊朗最大“內鬼”被抓？革命衛隊：勾結以色列，指揮官卡尼被拘！

伊朗最大“內鬼”被抓？革命衛隊：勾結以色列，指揮官卡尼被拘！

青青子衿

2026-03-05 11:57:03

打瘋了！東契奇首節狂轟22+5三分生涯30次單節20+升歷史第四

打瘋了！東契奇首節狂轟22+5三分生涯30次單節20+升歷史第四

醉臥浮生

2026-03-07 12:13:33

伊拉克庫爾德第一夫人宣言：我們不是任人驅使的炮灰！

伊拉克庫爾德第一夫人宣言：我們不是任人驅使的炮灰！

勝研集

2026-03-06 13:44:23

廣東一女子不愿上班常年坐街邊，因長得好看被路人投喂：又懶又饞

廣東一女子不愿上班常年坐街邊，因長得好看被路人投喂：又懶又饞

明智家庭教育

2026-03-06 17:19:16

美以伊軍事沖突最大副作用，是斬斷了俄羅斯的“救命稻草”

美以伊軍事沖突最大副作用，是斬斷了俄羅斯的“救命稻草”

廖保平

2026-03-05 12:08:52

“不想為以色列賣命”：帝國最后的遮羞布，美式民主終成笑話

“不想為以色列賣命”：帝國最后的遮羞布，美式民主終成笑話

怪口歷史的K先生

2026-03-06 15:22:51

為何關閉霍爾木茲海峽就能掐全球脖子？因為伊朗原油是全世界最好的

為何關閉霍爾木茲海峽就能掐全球脖子？因為伊朗原油是全世界最好的

風向觀察

2026-03-06 21:31:15

兩會不到3天，5大好消息傳來！老百姓暗暗叫好：希望國家盡快落實

兩會不到3天，5大好消息傳來！老百姓暗暗叫好：希望國家盡快落實

談史論天地

2026-03-07 06:54:29

1979年，張國燾凍死在養老院，許世友：除了主席，沒人是他的對手

1979年，張國燾凍死在養老院，許世友：除了主席，沒人是他的對手

文史季季紅

2026-03-05 13:35:03

寫入教科書的一天：F-35在德黑蘭完成全球首次實戰空對空擊殺

寫入教科書的一天：F-35在德黑蘭完成全球首次實戰空對空擊殺

斌聞天下

2026-03-06 07:30:03

伊方：因美以襲擊喪生的伊朗人三成為青少年

伊方：因美以襲擊喪生的伊朗人三成為青少年

環球網資訊

2026-03-07 06:39:29

為什么美國的華人華裔地位那么低網友從各方面分析真就那樣

為什么美國的華人華裔地位那么低網友從各方面分析真就那樣

侃神評故事

2026-03-06 07:10:03

我包養過一個女大學生，七年花了一千多萬

我包養過一個女大學生，七年花了一千多萬

煙火人間故事匯

2026-03-06 23:05:03

性壓抑已經變態至此了？

黯泉

2026-03-07 11:28:43

蘿莉島，是進入核心圈層的投名狀，你猜他們為什么都穿紅皮鞋

蘿莉島，是進入核心圈層的投名狀，你猜他們為什么都穿紅皮鞋

百曉生談歷史

2026-03-05 22:00:08

一份“煮熟的三文魚”火了，原來低認知的家長，真能搞出人命！

一份“煮熟的三文魚”火了，原來低認知的家長，真能搞出人命！

妍妍教育日記

2026-03-07 08:45:06

伊朗萬萬沒想到，自家王牌武器遭到破解，美軍多了一張底牌

伊朗萬萬沒想到，自家王牌武器遭到破解，美軍多了一張底牌

空天力量

2026-03-06 13:09:18

上次被發現還是1911年！上海寶山驚現1只，專家：可能是坐船來的

上次被發現還是1911年！上海寶山驚現1只，專家：可能是坐船來的

萬象硬核本尊

2026-03-06 23:54:22

女子實名舉報某團外賣：不上大額券就讓我變成“凌晨營業”，你們真黑！

女子實名舉報某團外賣：不上大額券就讓我變成“凌晨營業”，你們真黑！

回旋鏢

2026-03-06 21:13:59

塔圖姆復出15分12板7助攻凱爾特人大勝獨行俠，布朗24分7板7助

塔圖姆復出15分12板7助攻凱爾特人大勝獨行俠，布朗24分7板7助

湖人崛起

2026-03-07 10:25:09

CV NLP和數據挖掘知識

1940文章數 1456關注度

往期回顧全部

科技要聞

OpenClaw爆火，六位"養蝦人"自述與AI共生

頭條要聞

特朗普突然放話"先解決伊朗后解決古巴" 梅西聽懵了

頭條要聞

特朗普突然放話"先解決伊朗后解決古巴" 梅西聽懵了

體育要聞

塔圖姆歸來：凱爾特人的春之綠

娛樂要聞

周杰倫田馥甄的“JH戀” 被扒得底朝天

財經要聞

針對"不敢休、不讓休"怪圈國家出手了

汽車要聞

逃離ICU，上汽通用“止血”企穩

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

手機

房產

公開課

軍事航空

本地新聞

食味印象｜一口入魂！康樂烤肉串起千年絲路香

津南好·四時總相宜
妝藝大游行2026：愿
春花齊放2026：《駿馬奔騰迎新歲》

手機要聞

歐加驍龍8系小平板4月來襲，Find X9系列配件已備好！

房產要聞

傳統學區房熄火？2月海口二手房爆火的板塊竟然是…

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

軍事要聞

伊朗：使用無人機擊中美軍"林肯"號航母

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<s id="o3or6"><li id="o3or6"></li></s>

<sub id="o3or6"></sub>

^{<big id="o3or6"></big>}