<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      小模型大成果:通過分解方法實現卓越意圖提取

      0
      分享至


      隨著AI技術不斷進步,真正有用的智能體將能夠更好地預測用戶需求。為了讓移動設備上的體驗真正有幫助,底層模型需要理解用戶在與其交互時正在做什么(或試圖做什么)。一旦理解了當前和之前的任務,模型就有更多上下文來預測潛在的下一步操作。例如,如果用戶之前搜索過歐洲的音樂節,現在正在尋找飛往倫敦的航班,智能體可以主動提供在這些特定日期在倫敦舉辦的音樂節信息。

      大型多模態大語言模型已經能夠很好地從用戶界面(UI)軌跡中理解用戶意圖。但使用大語言模型執行這項任務通常需要將信息發送到服務器,這可能很慢、成本高昂,并且存在暴露敏感信息的潛在風險。

      我們在EMNLP 2025上發表的最新論文"小模型,大成果:通過分解實現卓越意圖提取",解決了如何使用小型多模態大語言模型來理解用戶在網頁和移動設備上的交互序列的問題,并且全部在設備上完成。通過將用戶意圖理解分為兩個階段——首先分別總結每個屏幕,然后從生成的摘要序列中提取意圖,我們使小模型更容易處理這項任務。我們還制定了評估模型性能的正式指標,并顯示我們的方法產生了與更大模型相當的結果,展示了其在設備上應用的潛力。

      分解式工作流程

      我們引入了一種用于從用戶交互中理解用戶意圖的分解工作流程。在推理時,模型執行兩個主要步驟。第一步,每個在單一屏幕和UI元素上的單獨交互都被獨立總結。接下來,這些摘要被用作一系列事件來預測整個UI軌跡的一般意圖。

      在第一階段,每個單獨的交互都由一個小型多模態大語言模型進行總結。給定三個屏幕的滑動窗口(上一個、當前、下一個),會詢問以下問題:屏幕上下文是什么?用戶采取了什么行動?用戶可能試圖實現什么?

      在這個階段,使用經過微調的小模型從屏幕摘要中提取一個句子。在第二階段的分解工作流程中,使用經過微調的模型,將第一階段生成的摘要作為輸入,輸出簡潔的意圖陳述。在這個階段,我們從摘要中刪除所有推測,并在訓練期間清理標簽,使其不鼓勵幻覺。

      評估方法

      我們使用Bi-Fact方法來評估預測意圖與參考意圖的質量。通過這種方法,我們使用單獨的大語言模型調用將參考意圖和預測意圖分解為不能進一步分解的意圖細節,我們稱之為"原子事實"。例如,"單程航班"將是一個原子事實,而"從倫敦到基加利的航班"將是兩個。然后我們計算預測意圖所包含的參考事實數量和參考意圖所包含的預測事實數量。這使我們能夠了解方法的精確度(有多少預測事實是正確的)和召回率(我們正確預測了多少真實事實),并計算F1分數。

      實驗結果

      當使用小模型時,分別總結每個屏幕然后從生成的摘要序列中提取意圖的分解方法是有幫助的。我們將其與標準方法(包括思維鏈提示(CoT)和端到端微調(E2E))進行比較,發現它超越了兩者。當我們在移動設備和網頁軌跡以及Gemini和Qwen2基礎模型上測試時,這個結果都成立。我們甚至發現,將分解方法應用于Gemini 1.5 Flash 8B模型可以實現與使用Gemini 1.5 Pro相當的結果,但成本和速度只是其一小部分。

      結論

      我們已經表明,軌跡總結的分解方法對于使用小模型進行意圖理解是有幫助的。最終,隨著模型性能的提高和移動設備獲得更多處理能力,我們希望設備上的意圖理解能夠成為未來移動設備上許多輔助功能的構建基塊。

      Q&A

      Q1:什么是分解式意圖提取方法?

      A:分解式意圖提取是一種將用戶意圖理解分為兩個階段的方法。第一階段使用小型多模態大語言模型分別總結每個屏幕上的用戶交互,第二階段使用經過微調的模型從這些摘要序列中提取整體意圖。這種方法讓小模型更容易處理復雜的用戶行為理解任務。

      Q2:為什么要使用小模型而不是大型語言模型?

      A:使用大語言模型通常需要將信息發送到服務器,這會導致延遲高、成本昂貴,并且存在暴露用戶敏感信息的風險。而小模型可以直接在設備上運行,保護用戶隱私,降低成本,提高響應速度,同時通過分解方法仍能達到與大模型相當的性能。

      Q3:Bi-Fact評估方法是如何工作的?

      A:Bi-Fact方法將預測意圖和參考意圖都分解為不可再分的"原子事實",然后計算預測意圖包含的參考事實數量和參考意圖包含的預測事實數量。通過這種方式可以得出精確度(預測事實的正確率)和召回率(真實事實的預測覆蓋率),進而計算F1分數來綜合評估模型性能。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      北京日報一針見血指出預制菜的主要矛盾,相較于某日報,高下立判

      北京日報一針見血指出預制菜的主要矛盾,相較于某日報,高下立判

      一拙見
      2026-01-24 16:51:53
      問題到底出在哪里?為什么那么多人不信官方說法…

      問題到底出在哪里?為什么那么多人不信官方說法…

      慧翔百科
      2026-01-10 13:44:32
      加倉433%!商業航天唯一低估真龍獲北向資金重倉鎖定

      加倉433%!商業航天唯一低估真龍獲北向資金重倉鎖定

      財報翻譯官
      2026-01-24 16:59:05
      萬萬沒想到!韓國破獲最大走私案,團伙偷偷運的卻是中國農產品?

      萬萬沒想到!韓國破獲最大走私案,團伙偷偷運的卻是中國農產品?

      溫讀史
      2026-01-25 01:36:55
      《人民日報》:70%的病跟情緒有關!很多人被親人給慢性折磨死的

      《人民日報》:70%的病跟情緒有關!很多人被親人給慢性折磨死的

      詩詞中國
      2026-01-23 18:47:36
      于文文這身材太絕了!露背吊帶裙殺瘋了,飽滿曲線誰頂得住?

      于文文這身材太絕了!露背吊帶裙殺瘋了,飽滿曲線誰頂得住?

      娛樂領航家
      2026-01-11 00:00:03
      胃癌傳聞真相大白半年,49歲趙薇再迎壞消息,連累的何止閨蜜李湘

      胃癌傳聞真相大白半年,49歲趙薇再迎壞消息,連累的何止閨蜜李湘

      可樂談情感
      2026-01-25 01:36:39
      破案了!看了牢A的直播后,終于知道宋祖兒為什么會被全網黑了!

      破案了!看了牢A的直播后,終于知道宋祖兒為什么會被全網黑了!

      樂悠悠娛樂
      2026-01-22 08:57:21
      預言成真?再對日本大動脈下死手,高市最不希望的事已發生

      預言成真?再對日本大動脈下死手,高市最不希望的事已發生

      谷盟a
      2026-01-24 15:24:56
      記住吧,歷史總要清算

      記住吧,歷史總要清算

      火事雜談
      2026-01-24 18:52:38
      澳網男單16強出爐:辛納阿卡德約茲維領銜,種子選手全包攬

      澳網男單16強出爐:辛納阿卡德約茲維領銜,種子選手全包攬

      全景體育V
      2026-01-24 21:31:34
      一夜之間全黑了!上海多家商鋪報警!網友目瞪口呆:真實的商戰……

      一夜之間全黑了!上海多家商鋪報警!網友目瞪口呆:真實的商戰……

      環球網資訊
      2026-01-24 07:05:16
      美元下跌,黃金狂漲!知名經濟學家:這像極了08年次貸危機前夜

      美元下跌,黃金狂漲!知名經濟學家:這像極了08年次貸危機前夜

      史行途
      2026-01-24 13:52:34
      和平委員會成立,中國加入42國行列

      和平委員會成立,中國加入42國行列

      李摻窮游天下
      2026-01-23 18:28:07
      人傻福多的3生肖,2026丙午馬年財源滾滾進賬,無比風光!有你嗎

      人傻福多的3生肖,2026丙午馬年財源滾滾進賬,無比風光!有你嗎

      人閒情事
      2026-01-24 12:31:40
      最大的成功,就是健康地活著

      最大的成功,就是健康地活著

      深度報
      2026-01-17 23:05:13
      在閑魚上買東西能有多離譜?網友:這哪是閑魚,這簡直是黑市

      在閑魚上買東西能有多離譜?網友:這哪是閑魚,這簡直是黑市

      夜深愛雜談
      2026-01-24 20:08:48
      牢A又抨擊女留學生,遭女留學生現身說法反駁,網友:徹底不裝了?

      牢A又抨擊女留學生,遭女留學生現身說法反駁,網友:徹底不裝了?

      趣筆談
      2026-01-24 09:10:48
      特朗普這是把國運送給了中國!美國徹底放棄發展新能源產業

      特朗普這是把國運送給了中國!美國徹底放棄發展新能源產業

      胖福的小木屋
      2026-01-24 00:06:29
      美國華人直言:中國手機掃碼支付是最不智能的發明!

      美國華人直言:中國手機掃碼支付是最不智能的發明!

      阿傖說事
      2026-01-20 12:53:01
      2026-01-25 03:31:00
      至頂頭條 incentive-icons
      至頂頭條
      記錄和推動數字化創新
      15659文章數 49687關注度
      往期回顧 全部

      科技要聞

      黃仁勛現身上海菜市場

      頭條要聞

      張又俠、劉振立被查 解放軍報發布社論

      頭條要聞

      張又俠、劉振立被查 解放軍報發布社論

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      回歸還是頂流 鳳凰傳奇將現身馬年春晚

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      教育
      時尚
      家居
      手機
      軍事航空

      教育要聞

      突發!南京這所公辦名校要更名!

      冬天最佳“顯瘦”公式:上短+下長

      家居要聞

      在家度假 160平南洋混搭宅

      手機要聞

      追覓首款手機狂攬億元訂單:自研芯片+模塊化影像,硬剛華為小米

      軍事要聞

      俄美烏首次三方會談在阿聯酋舉行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品jizz在线观看软件| 99精品国产中文字幕| 亚洲国产精品久久一线不卡| ,国产乱人伦无无码视频| 91中文字幕一区二区| 免费观看在线A级毛片| 少妇无码一区二区三区免费| 久久99国产亚洲高清观看首页| 色婷久久| 精品国产青草久久久久福利| 男人天堂中文字幕| 6699嫩草久久久精品影院 | 欧美丝袜另类| 好紧好爽午夜视频| 69精品人人人| 亚洲欧洲自拍自拍A| 成人午夜视频在线| 免费在线观看av毛片| 色色亚洲| 天天色天天综合网| 欧美超大胆裸体xx视频| 网友偷拍久久精品视频| 免费观看性行为视频的网站| 老王av| 隔壁老王国产在线精品| 998av资源影音先锋| 26uuu欧美日本| аⅴ天堂国产最新版在线中文| 久久欧美国产伦子伦精品| a毛片免费在线观看| 日本中文字幕久久网站| 无码不卡av东京热毛片| 日韩免费无码一区二区视频 | 爆乳熟妇一区二区三区| 极品人妻少妇一区二区三区| 亚洲av偷拍一区二区三区| 中文字幕 欧美日韩| 亚洲国产精品久久久久婷蜜芽| 亚洲精品无码永久在线观看性色| 国产精品私拍99pans大尺度| 久久人搡人人玩人妻精品首页|