<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      北大林宙辰團(tuán)隊(duì):從最優(yōu)傳輸角度訓(xùn)練時(shí)序預(yù)測模型 丨ICLR 2026

      0
      分享至


      DistDF:從點(diǎn)對(duì)點(diǎn)誤差轉(zhuǎn)向聯(lián)合分布對(duì)齊,重構(gòu)時(shí)間序列預(yù)測的損失函數(shù)。

      作者丨鄭佳美

      編輯丨岑 峰

      在時(shí)間序列預(yù)測研究中,一個(gè)耐人尋味的現(xiàn)象長期存在:

      一方面,模型結(jié)構(gòu)不斷演進(jìn),從循環(huán)網(wǎng)絡(luò)到 Transformer,再到頻域與混合結(jié)構(gòu);另一方面,幾乎所有方法在訓(xùn)練階段依賴同一類損失函數(shù),即以均方誤差(MSE)為代表的點(diǎn)對(duì)點(diǎn)誤差。

      這使得時(shí)間序列預(yù)測在方法論層面呈現(xiàn)出一種隱性的停滯,即研究重心持續(xù)向模型表達(dá)能力傾斜,而對(duì)損失函數(shù)所隱含的統(tǒng)計(jì)假設(shè)缺乏系統(tǒng)反思

      點(diǎn)對(duì)點(diǎn)誤差的核心假設(shè)在于,標(biāo)簽序列中的各時(shí)間步可被視為給定歷史條件下相互獨(dú)立的預(yù)測對(duì)象。然而,這一假設(shè)與時(shí)間序列數(shù)據(jù)的生成機(jī)制之間始終存在偏差。

      真實(shí)世界中的時(shí)間序列由隨機(jī)過程演化而來,不同時(shí)間點(diǎn)之間存在顯著的相關(guān)關(guān)系。將多步預(yù)測問題拆解為一組獨(dú)立的回歸任務(wù),不可避免地為損失函數(shù)引入了結(jié)構(gòu)性偏差,使模型難以學(xué)習(xí)標(biāo)簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系

      針對(duì)這一問題,北京大學(xué)林宙辰團(tuán)隊(duì)深入剖析了此類結(jié)構(gòu)性偏差的成因。在此基礎(chǔ)上,團(tuán)隊(duì)提出了 DistDF:一種通過聯(lián)合分布對(duì)齊訓(xùn)練預(yù)測模型的損失函數(shù)。DistDF 的提出不僅為時(shí)間序列預(yù)測提供了一種新的損失函數(shù)設(shè)計(jì)思路,也在更一般的意義上,對(duì)序列建模中“應(yīng)當(dāng)優(yōu)化什么”這一長期被忽視的問題給出了新的回答。


      論文地址:https://arxiv.org/pdf/2510.24574v1

      01


      當(dāng)獨(dú)立性假設(shè)被實(shí)驗(yàn)證偽之后

      當(dāng)前時(shí)間序列預(yù)測領(lǐng)域的主流方法普遍采用逐時(shí)間點(diǎn)的均方誤差(MSE)作為損失函數(shù):

      隱式地做了獨(dú)立性假設(shè):在給定歷史序列的條件下,標(biāo)簽序列各時(shí)間點(diǎn)的觀測相互獨(dú)立。然而,真實(shí)時(shí)間序列存在顯著的標(biāo)簽自相關(guān):標(biāo)簽序列各時(shí)間點(diǎn)的觀測往往存在顯著的相關(guān)性。因此,的獨(dú)立性假設(shè)與時(shí)間序列數(shù)據(jù)的生成機(jī)制相悖,導(dǎo)致其作為損失函數(shù)是有偏的(具體見定理1)。

      [定理1]考慮單變量標(biāo)簽序列 ,其條件自相關(guān)矩陣為 ,則標(biāo)簽序列的實(shí)用負(fù)對(duì)數(shù)似然可表示為: 。顯然,僅當(dāng)是單位陣,即標(biāo)簽自相關(guān)不存在時(shí),才有

      研究團(tuán)隊(duì)通過實(shí)證分析驗(yàn)證了這一矛盾:在給定歷史序列的條件下,標(biāo)簽序列仍呈現(xiàn)顯著的條件相關(guān)結(jié)構(gòu),從而在實(shí)證意義上證偽了獨(dú)立性假設(shè)。實(shí)驗(yàn)進(jìn)一步表明,即使采用頻域變換或主成分分解等標(biāo)簽變換方法,變換后的標(biāo)簽序列依然存在殘余相關(guān)性;因此,在變換后的標(biāo)簽應(yīng)用均方誤差作為損失函數(shù)仍會(huì)導(dǎo)致結(jié)構(gòu)性偏差。


      02


      DistDF:基于分布對(duì)齊的時(shí)間序列損失函數(shù)

      為規(guī)避傳統(tǒng)方法中的獨(dú)立性假設(shè),DistDF 提出直接對(duì)齊預(yù)測序列的條件分布與真實(shí)標(biāo)簽的條件分布 。直觀上,該目標(biāo)可通過最小化兩個(gè)條件分布間的距離 來實(shí)現(xiàn)。

      然而,直接將其作為損失函數(shù)面臨嚴(yán)重的樣本稀缺問題。對(duì)于給定的歷史序列 ,時(shí)間序列數(shù)據(jù)集通常僅包含唯一的標(biāo)簽序列 ,模型也僅產(chǎn)生單一預(yù)測 。這種“單樣本”情形導(dǎo)致直接估計(jì)條件分布距離 在統(tǒng)計(jì)上不可靠。

      為解決這一難題,我們利用概率恒等式 。因?yàn)檫吘壏植?是共享的,若聯(lián)合分布對(duì)齊,則條件分布必然對(duì)齊。基于此,我們將條件分布匹配問題轉(zhuǎn)化為聯(lián)合分布匹配問題。

      進(jìn)一步結(jié)合最優(yōu)傳輸理論,本文證明了聯(lián)合分布的 Wasserstein 距離構(gòu)成了條件分布 Wasserstein 距離期望的上界:

      因此,通過最小化歷史-預(yù)測聯(lián)合分布 與歷史-標(biāo)簽聯(lián)合分布 之間的 Wasserstein 距離,可有效實(shí)現(xiàn)條件分布對(duì)齊,進(jìn)一步實(shí)現(xiàn)預(yù)測模型的無偏訓(xùn)練。同時(shí),這一轉(zhuǎn)換允許利用整個(gè)數(shù)據(jù)集的樣本來估計(jì)聯(lián)合分布距離,顯著提升了分布距離估計(jì)的可靠性。

      DistDF 的實(shí)現(xiàn)流程如下:

      首先,構(gòu)造聯(lián)合序列: 和 ;

      接著,計(jì)算兩個(gè)聯(lián)合序列之間的Wasserstein距離: ,

      最后,與 MSE 損失加權(quán)融合:

      DistDF 作為模型無關(guān)的損失函數(shù),可適配各類預(yù)測模型架構(gòu)。

      03


      在大量實(shí)驗(yàn)中,一致驗(yàn)證優(yōu)勢

      論文首先將DistDF與現(xiàn)有損失函數(shù)進(jìn)行了比較,包括通過標(biāo)簽變換削弱標(biāo)簽相關(guān)性的 FreDF 和 Time-o1。結(jié)果表明,這些方法雖然減少了似然估計(jì)的偏差并提升了性能,但殘差偏差仍然存在,因此性能仍有改進(jìn)空間。而DistDF通過最小化條件分布之間的距離,實(shí)現(xiàn)了預(yù)測模型的無偏訓(xùn)練,取得了最佳的預(yù)測性能。


      其次,論文通過消融實(shí)驗(yàn)對(duì)兩個(gè)關(guān)鍵因素進(jìn)行了驗(yàn)證;分別考察在DF的基礎(chǔ)上,僅對(duì)齊均值、僅對(duì)齊協(xié)方差以及同時(shí)對(duì)齊二者的情形。結(jié)果表明,兩種因素單獨(dú)對(duì)齊時(shí)均能帶來性能提升,而二者同時(shí)對(duì)齊時(shí)效果最為顯著。


      接著,論文也對(duì)模型輸出的預(yù)測序列進(jìn)行了可視化分析。結(jié)果表明,采用 DistDF 訓(xùn)練的模型能夠較好地跟隨序列中的突發(fā)變化,使得預(yù)測序列在整體形態(tài)上更加接近真實(shí)數(shù)據(jù)。這進(jìn)一步表明,DistDF 的作用不僅體現(xiàn)在降低數(shù)值誤差上,更重要的是在訓(xùn)練過程中引導(dǎo)模型學(xué)習(xí)到了真實(shí)未來時(shí)間序列的整體分布形態(tài)。


      最后,論文對(duì)DistDF與不同預(yù)測模型的兼容性進(jìn)行了驗(yàn)證。結(jié)果表明,無論模型本身的復(fù)雜度和建模方式如何,引入 DistDF 訓(xùn)練策略后,模型預(yù)測性能幾乎都能夠獲得進(jìn)一步提升。這一結(jié)果表明,DistDF 的作用并非彌補(bǔ)模型結(jié)構(gòu)本身的不足,而是提供了更好的訓(xùn)練信號(hào)。


      04


      「多任務(wù)學(xué)習(xí)」需要分布對(duì)齊

      整體來看,這項(xiàng)研究重新審視了多任務(wù)學(xué)習(xí)場景中的損失函數(shù)設(shè)計(jì)。研究團(tuán)隊(duì)強(qiáng)調(diào):多任務(wù)學(xué)習(xí)的核心目標(biāo)不應(yīng)局限于對(duì) T個(gè)標(biāo)簽的逐點(diǎn)建模,而應(yīng)轉(zhuǎn)向?qū)σ粋€(gè)在任務(wù)維度上具有內(nèi)在相關(guān)結(jié)構(gòu)的隨機(jī)過程進(jìn)行整體建模。

      在這一視角下,傳統(tǒng)損失函數(shù)(如MSE)隱含了“給定輸入條件下各任務(wù)標(biāo)簽相互獨(dú)立”的假設(shè),從而將一個(gè)高維、相關(guān)的隨機(jī)過程建模任務(wù)退化為一組彼此獨(dú)立的標(biāo)量回歸任務(wù)。因該假設(shè)忽略標(biāo)簽序列的內(nèi)生結(jié)構(gòu),這些損失函數(shù)往往是有偏的

      DistDF 通過將預(yù)測序列與真標(biāo)簽建模為概率分布,實(shí)現(xiàn)對(duì)任務(wù)維度上相關(guān)結(jié)構(gòu)的整體建模。通過優(yōu)化基于分布對(duì)齊的損失函數(shù),模型能夠顯式學(xué)習(xí)標(biāo)簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系

      進(jìn)一步看,該研究揭示的問題具有廣泛的普適性。只要學(xué)習(xí)任務(wù)的輸出構(gòu)成具有顯著相關(guān)性的序列(如語音、圖像、文本或用戶行為),若仍沿用基于獨(dú)立性假設(shè)的損失函數(shù)(如 MSE),則必然會(huì)引入結(jié)構(gòu)性偏差。因此,DistDF 所倡導(dǎo)的聯(lián)合分布對(duì)齊思想,不僅適用于時(shí)間序列預(yù)測,也同樣適用于語音合成、軌跡預(yù)測等任務(wù)。它并非針對(duì)時(shí)間序列任務(wù)的特定技巧,而是為多任務(wù)學(xué)習(xí)問題提供了一種更為通用的損失函數(shù)構(gòu)造范式。

      05


      作者信息

      論文第一作者王浩,現(xiàn)為浙江大學(xué)控制學(xué)院博士研究生,研究方向聚焦于因果推斷、多任務(wù)學(xué)習(xí)技術(shù)及其在大語言模型中的應(yīng)用。2022 年- 2023 年,他曾在螞蟻金服、微軟亞洲研究院科研實(shí)習(xí),從事推薦系統(tǒng)理論研究。2025 年起,他在小紅書參加 RedStar 實(shí)習(xí)項(xiàng)目,進(jìn)行大語言模型、可信獎(jiǎng)勵(lì)模型領(lǐng)域的研究工作。


      論文通訊作者林宙辰,現(xiàn)任北京大學(xué)智能學(xué)院、通用人工智能全國重點(diǎn)實(shí)驗(yàn)室教授。他的研究領(lǐng)域包括機(jī)器學(xué)習(xí)和數(shù)值優(yōu)化。他已發(fā)表論文360余篇,谷歌學(xué)術(shù)引用超過42,000次。他是IAPR、IEEE、AAIA、CCF和CSIG會(huì)士,多次擔(dān)任CVPR、NeurIPS、ICML等會(huì)議的Senior Area Chair,現(xiàn)任ICML Board Member。


      參考鏈接:https://zhouchenlin.github.io/

      本工作得到了北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)的大力支持,在此深表感謝

      未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

      公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      突發(fā)訃告!蔣彥強(qiáng)不幸離世,年僅40歲

      突發(fā)訃告!蔣彥強(qiáng)不幸離世,年僅40歲

      南方都市報(bào)
      2026-03-27 15:53:39
      時(shí)代最令人失望者!加州州長怒批馬斯克:親手將美國電車王冠讓給了中國

      時(shí)代最令人失望者!加州州長怒批馬斯克:親手將美國電車王冠讓給了中國

      快科技
      2026-03-27 14:18:12
      蜜雪的零售邊界,不止于一杯杯奶茶、咖啡、或啤酒

      蜜雪的零售邊界,不止于一杯杯奶茶、咖啡、或啤酒

      晚點(diǎn)LatePost
      2026-03-26 18:50:35
      全球唯一雙座隱身戰(zhàn)機(jī)!殲-20S跨界作戰(zhàn)有多震撼?專家解析

      全球唯一雙座隱身戰(zhàn)機(jī)!殲-20S跨界作戰(zhàn)有多震撼?專家解析

      齊魯壹點(diǎn)
      2026-03-27 06:56:45
      部分娃哈哈宏勝工廠停產(chǎn),有工廠已放假

      部分娃哈哈宏勝工廠停產(chǎn),有工廠已放假

      界面新聞
      2026-03-27 14:59:14
      自戰(zhàn)事爆發(fā)以來 伊朗平均每天賣油能多賺1.7億

      自戰(zhàn)事爆發(fā)以來 伊朗平均每天賣油能多賺1.7億

      財(cái)聯(lián)社
      2026-03-27 11:05:06
      關(guān)于伊朗的十大虛假敘事——你是如何被網(wǎng)軍欺騙的?

      關(guān)于伊朗的十大虛假敘事——你是如何被網(wǎng)軍欺騙的?

      楓嶺社
      2026-03-27 10:49:09
      羅技:“我一降價(jià),你還不是像狗一樣跑過來”

      羅技:“我一降價(jià),你還不是像狗一樣跑過來”

      電腦吧評(píng)測室
      2026-03-26 22:05:58
      感冒三藥、失眠三藥、牙痛三藥......40種常見病的三藥配對(duì)一覽表!

      感冒三藥、失眠三藥、牙痛三藥......40種常見病的三藥配對(duì)一覽表!

      環(huán)京快爆
      2026-03-26 11:13:27
      充電9分鐘續(xù)航超千里:全新騰勢Z9GT開啟閃充時(shí)代

      充電9分鐘續(xù)航超千里:全新騰勢Z9GT開啟閃充時(shí)代

      大眾侃車
      2026-03-26 18:02:02
      張雪峰女兒親自辟謠!父母恩愛沒離婚,回應(yīng)三個(gè)問題,口才很意外

      張雪峰女兒親自辟謠!父母恩愛沒離婚,回應(yīng)三個(gè)問題,口才很意外

      離離言幾許
      2026-03-27 14:42:23
      張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

      張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

      娛樂圈圈圓
      2026-03-26 21:47:07
      中美俄石油儲(chǔ)量對(duì)比:俄800億桶,美國超700億桶,中國有多少?

      中美俄石油儲(chǔ)量對(duì)比:俄800億桶,美國超700億桶,中國有多少?

      福建平子
      2026-03-27 11:27:57
      “咬死”ASML,禁止維修光刻機(jī)只是開始,輪到中國工程師頭疼了!

      “咬死”ASML,禁止維修光刻機(jī)只是開始,輪到中國工程師頭疼了!

      流史歲月
      2026-03-27 12:05:09
      一女子在湖南省道縣人民醫(yī)院生產(chǎn)后,與新生兒不幸雙雙離世,多方回應(yīng)

      一女子在湖南省道縣人民醫(yī)院生產(chǎn)后,與新生兒不幸雙雙離世,多方回應(yīng)

      半島官網(wǎng)
      2026-03-27 15:13:26
      奇瑞犀牛電池能“抗造”到離譜?切角、穿刺、泡水不爆炸,甚至還能正常供電!

      奇瑞犀牛電池能“抗造”到離譜?切角、穿刺、泡水不爆炸,甚至還能正常供電!

      極果酷玩
      2026-03-27 14:58:30
      史上首次:特朗普簽名將印上美元紙幣,打破165年傳統(tǒng)

      史上首次:特朗普簽名將印上美元紙幣,打破165年傳統(tǒng)

      上觀新聞
      2026-03-27 12:58:08
      打虎!廣東省政協(xié)副主席郭永航被查

      打虎!廣東省政協(xié)副主席郭永航被查

      極目新聞
      2026-03-27 18:37:06
      再婚8年,丈夫老實(shí)憨厚,鄰居卻悄悄提醒:你男人全身都是秘密

      再婚8年,丈夫老實(shí)憨厚,鄰居卻悄悄提醒:你男人全身都是秘密

      烙任情感
      2026-03-26 16:32:02
      涉嫌嚴(yán)重違紀(jì)違法,張建生被查

      涉嫌嚴(yán)重違紀(jì)違法,張建生被查

      都市快報(bào)橙柿互動(dòng)
      2026-03-27 14:59:18
      2026-03-27 18:59:00
      AI科技評(píng)論 incentive-icons
      AI科技評(píng)論
      點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
      7151文章數(shù) 20742關(guān)注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價(jià)

      頭條要聞

      美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應(yīng)

      頭條要聞

      美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應(yīng)

      體育要聞

      邵佳一:足球就像一場馬拉松

      娛樂要聞

      張雪峰靈堂內(nèi)景曝光,四周擺滿了鮮花

      財(cái)經(jīng)要聞

      我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

      汽車要聞

      與眾08,金標(biāo)大眾不能輸?shù)囊粦?zhàn)

      態(tài)度原創(chuàng)

      教育
      時(shí)尚
      親子
      健康
      公開課

      教育要聞

      重拳出擊,整治教育內(nèi)卷,中考徹底變天了

      從50塊到5w,她們過去一年最愛的包是這些

      親子要聞

      廣東榕城區(qū)教育局通報(bào)幼兒園老師不當(dāng)對(duì)待幼兒

      干細(xì)胞抗衰4大誤區(qū),90%的人都中招

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版