<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      新研究讓大模型學會主動追問,人機協作效果大幅提升

      0
      分享至

      在寫作等開放性任務中,AI 能跳出現有信息框架,提出類似人類的、甚至人類沒有想到的建議嗎?

      在以往的研究中,AI 聊天機器人與用戶的對話一般是被動的事實性問答,即對已有信息進行相關澄清和梳理。盡管可直接通過指令讓 AI 提出解決方案,但其并不承擔創造性任務。

      在近期的一項研究中,研究人員為 AI 輸出創造性內容提供了一種可能的方案。美國南加州大學與微軟公司、加州大學戴維斯分校團隊合作,引入了一種主動信息收集的任務范式,通過強化學習訓練大語言模型,即便面對不完整或模糊的提示,大語言模型也可以主動識別信息缺口。

      并且,基于特定問題主動挖掘用戶隱含的信息或知識,通過提升模型在復雜、開放性任務中的協作能力,來更好地完成任務,特別是在社會科學、商業等深層次的上下文推理任務中具有優勢。

      可以這樣來理解:面試者需要通過面試官提出有啟發性的問題以及互動,才能更好地展示自身價值,讓 AI 解讀相對復雜文檔的原理亦是如此。


      圖丨左至右依次是楊瓏頎、黃騰昊、周沛和陳斯昊(來源:該團隊)

      相關論文以《教會語言模型主動收集信息》(Teaching Language Models To Gather Information Proactively)為題,已經被 EMNLP-Findings 2025 接收 [1]。南加州大學博士生黃騰昊(目前在微軟實習)是第一作者,微軟公司資深研究科學家周沛和陳斯昊擔任共同通訊作者。


      圖丨相關論文(來源:EMNLP)

      為確保模擬的模糊性既真實又可學習,研究團隊基于涵蓋 25 個專業領域、1,000 多條數據的 DOLOMITES 數據集進行測試,并設計了掩蓋關鍵信息并模擬真實的模糊性的機制。

      據介紹,在強化學習的獎勵設計中,研究人員希望獎勵機制更專注于“提出創造性問題”這一行為本身,而非具體問題的內容。重點在于鼓勵模型提出在已有數據中不存在的新問題,并以此作為強化獎勵的依據。


      圖丨主動澄清有助于實現最佳的大模型響應(來源:EMNLP)

      陳斯昊指出,如果針對其中一個答案去做特定訓練,并不會得到很好的泛化性。“我們的做法是將最終輸出的評估作為獎勵信號,相當于在機器學習時專門去學習怎樣生成和人類標注出來的答案一樣。最后,生成符合獎勵模式的答案?!?/p>

      研究人員將已有的數據轉化成獎勵信號,通過設計對話模擬引擎,把用來做監督學習的任務轉變成對話形式。相當于兩個 AI 之間通過互動的方式,一個 AI 提出澄清問題,另一個 AI 基于問題質量/回答有效性打分,進而獲得獎勵信號。


      圖丨評估框架下的實驗結果(來源:EMNLP)

      研究結果顯示,經過該方法微調的 Qwen-2.5-7B 模型,在自動評估指標上比基線模型 o3-mini 提高了 18%;而在人類評估中,基于該方法生成的澄清問題以及最終大綱分別獲得 42% 和 28% 的偏好率。


      (來源:EMNLP)

      該研究并不是簡單地訓練模型完成任務,而是通過獎勵機制,讓模型微調后提出建設性、啟發性觀點或前瞻性建議,進而展現出類人的系統性思考方式。

      周沛對 DeepTech 解釋道:“它具有很好的泛化性,相當于‘授人以魚不如授人以漁’,即不是直接教 AI 該提什么問題、該給什么答案,而是教它主動發現信息缺口、提出創造性澄清問題的思考方式,從而靠自身的互動能力獲得最優解?!?/p>

      此外,基于該方法微調的模型不只是給出一個答案,它可能需要提出需要澄清問題,也有可能需要多核協作,甚至還可能需要質疑之前提出的假設是否有問題。

      研究團隊認為,這項研究本質上是在進行用戶與 AI 之間的深度研究,通過對話同步上下文、縮小信息差。因為當 AI 和用戶都更清楚最終輸出的目標時,有利于后續的人機協作,從而創造性地完成更深度的任務。

      這種主動信息收集的方法適用于開放性任務,例如包括文獻綜述和報告的寫作任務,或布置畫廊展覽在內的場景。黃騰昊解釋說道:“AI 本身可能在這些方面沒有太多知識,需要和用戶進行多輪對話和互動來獲取新知識,再用這些新知識來解決新任務。”

      此外,該方法還有可能推動人類和智能體互動的形式。例如,在 AI+教育場景應用中發揮作用,讓 AI 在用戶沒有表達信息的情況下,主動引導學生向某個方向學習。

      在人與 AI 互動中,補充信息差的方式有多種:一是讓 AI 通過提出好問題來主動獲取缺失信息;另一種是,在同步或非同步的場景下,模型可以通過給出提示協助獲取其他信息。這也是研究團隊未來將繼續探索的方向之一。

      參考資料:

      1.https://arxiv.org/abs/2507.21389v1

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      聊聊TCL和索尼這檔子事!輸家是誰不知道,但TCL一定是贏家

      聊聊TCL和索尼這檔子事!輸家是誰不知道,但TCL一定是贏家

      杰夫視點
      2026-01-23 13:13:32
      達沃斯現場,特朗普瘋狂污蔑我國,不到24小時,我外交部回應亮了

      達沃斯現場,特朗普瘋狂污蔑我國,不到24小時,我外交部回應亮了

      梁訊
      2026-01-24 05:55:46
      3個月的小黑貓卻只有一斤多,被救后變成了奶fufu的小帥哥!

      3個月的小黑貓卻只有一斤多,被救后變成了奶fufu的小帥哥!

      拜見喵主子
      2026-01-23 12:23:49
      澤連斯基炮轟歐洲石破天驚,德國將從美國運回1000噸黃金

      澤連斯基炮轟歐洲石破天驚,德國將從美國運回1000噸黃金

      史政先鋒
      2026-01-23 22:41:06
      特朗普,會在春天來訪嗎?

      特朗普,會在春天來訪嗎?

      中國新聞周刊
      2026-01-24 10:51:34
      半場0板+全場1板!申京再被火蜜瘋狂炮轟:軟弱無能 空有2.11米

      半場0板+全場1板!申京再被火蜜瘋狂炮轟:軟弱無能 空有2.11米

      顏小白的籃球夢
      2026-01-24 10:59:14
      突發!菲律賓宣布封鎖黃巖島空域,將連續軍演70天

      突發!菲律賓宣布封鎖黃巖島空域,將連續軍演70天

      頭條爆料007
      2026-01-24 06:17:26
      央媒對李亞鵬的稱呼變了,兩字之差釋放強烈信號,向華強全說對了

      央媒對李亞鵬的稱呼變了,兩字之差釋放強烈信號,向華強全說對了

      阿纂看事
      2026-01-23 19:25:11
      工廠停擺、門店撤退:理想汽車的“嚴冬”,比預想中來得更冷

      工廠停擺、門店撤退:理想汽車的“嚴冬”,比預想中來得更冷

      科技Nice
      2026-01-23 11:27:59
      理想汽車突然大降價

      理想汽車突然大降價

      科技頭版Pro
      2026-01-22 16:02:52
      基金圈爆大瓜!美女分析師被搞大肚子,公開喊話手握290億的經理

      基金圈爆大瓜!美女分析師被搞大肚子,公開喊話手握290億的經理

      社會醬
      2026-01-23 17:53:48
      女留學生回國就診“肛裂”!網友:公司現招聘海龜要體檢生殖系統

      女留學生回國就診“肛裂”!網友:公司現招聘海龜要體檢生殖系統

      火山詩話
      2026-01-24 07:32:05
      江蘇昆山一工廠春節提前離崗或延遲到崗的均按自動離職處理

      江蘇昆山一工廠春節提前離崗或延遲到崗的均按自動離職處理

      搗蛋窩
      2026-01-23 08:44:18
      伊朗官員:伊朗軍隊已做好應對最壞情況的準備

      伊朗官員:伊朗軍隊已做好應對最壞情況的準備

      環球網資訊
      2026-01-24 11:06:18
      【解局】國會例會開幕日解散眾議院,高市早苗的反常操作藏著何種算計?

      【解局】國會例會開幕日解散眾議院,高市早苗的反常操作藏著何種算計?

      環球網資訊
      2026-01-23 21:55:45
      曝2026央視春晚彩排!看完到場明星,網友哭了:今年的電費又省了

      曝2026央視春晚彩排!看完到場明星,網友哭了:今年的電費又省了

      小熊侃史
      2026-01-22 07:40:06
      楊瀚森替補3籃板開拓者不敵猛龍結束4連勝,霍勒迪21分7助攻

      楊瀚森替補3籃板開拓者不敵猛龍結束4連勝,霍勒迪21分7助攻

      湖人崛起
      2026-01-24 13:21:48
      今年,可能是史上最冷清的春節。

      今年,可能是史上最冷清的春節。

      詩詞中國
      2026-01-23 19:24:10
      曹軼歐回憶:1933年,康生親手用斧子劈死了顧順章的家人

      曹軼歐回憶:1933年,康生親手用斧子劈死了顧順章的家人

      文史季季紅
      2026-01-23 13:00:02
      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      巢客HOME
      2026-01-24 08:15:03
      2026-01-24 14:48:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16169文章數 514533關注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      專家:特朗普或在春天訪問中國 其被認為是"對華鴿派"

      頭條要聞

      專家:特朗普或在春天訪問中國 其被認為是"對華鴿派"

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      李微漪更新:狼王格林去世,3字淚目

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      藝術
      親子
      時尚
      旅游
      公開課

      藝術要聞

      色彩之巔!法國蓬皮杜中心館藏藝術大師特展”在北京民生現代美術館開幕

      親子要聞

      女性骨盆持續縮小——我們正在“進化”出更多剖宮產嗎?

      不一定能掀桌男主,但一定是個好演員!

      旅游要聞

      晨霧鎏金 茶山生香——云南普洱萬畝茶園迎冬日限定景致

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: H无码| 亚洲av中文| 亚洲成在人线视av| 伊人在线| 91国内视频在线观看| 亚洲综合av一区二区三区| 田阳县| 国产精品麻豆成人av电影艾秋| 在线精品熟女AV播放| 夜夜嗨av| 深夜福利啪啪片| 国产拍拍拍无码视频免费| 国产精品第一页中文字幕| 欧美中文字幕无线码视频| 日本理伦片午夜理伦片| 日本欧美视频在线观看三区| 浮妇高潮喷白浆视频| 狠狠干2019| 成人h动漫精品一区二区无码 | 成人欧美日韩一区二区三区| 久久精品人成免费| 免费VA国产高清大片在线| 西西人体大胆瓣开下部自慰 | 亚洲第一成年免费网站| julia无码中文字幕一区| 亚洲成年网站| 亚洲成av人片在www鸭子| 亚洲人妻久久| 国产精品久久久久野外| 宁强县| 欲香欲色天天天综合和网| 成人网站18禁| 男人的天堂av网站| 色墦五月丁香| 成人综合网址| 美女一区二区三区在线观看视频| 精品中文字幕一区在线| 国内精品久久久久影视| 国产成人精品一区二区不卡| 国产美女白丝袜精品_a不卡| 日韩亚洲欧美中文高清在线|