<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      為AI科學家提供安全鎖:UIUC團隊提出新框架,安全性能提升35%

      0
      分享至

      近年來,大語言模型(LLM)智能體的快速發展極大地推動了科研自動化的進程,但同時也引發了重要的倫理與安全問題。為了應對這些挑戰,美國伊利諾伊大學厄巴納-香檳分校(UIUC,University of Illinois Urbana-Champaign)的助理教授尤佳軒團隊提出了SafeScientist——一種專為提升 AI 科學家的安全性而設計的人工智能科研框架。

      SafeScientist 能夠主動拒絕不符合倫理或高風險的科研任務,并在整個研究流程中嚴格實現全面的安全監督,該框架集成了多層防御機制。

      與 SafeScientist 相配套,該研究還提出了 SciSafetyBench——一個專為科研場景設計的 AI 安全性評測基準。該基準涵蓋 6 個科學領域的 240 個高風險科研任務,配合 30 個專用科研工具以及 120 個與工具使用相關的風險任務,可系統評估 AI 科學家的安全表現。大量實驗結果表明,相較于傳統的 AI 科研框架,SafeScientist 在不降低科研成果質量的前提下,整體安全性能提升約 35%。

      目前相關論文以《SafeScientist:面向風險感知的大語言模型科研發現框架》(SafeScientist: Toward Risk-Aware Scientific Discoveries by LLM Agents)為題發表在自然語言處理領域頂會 EMNLP(Empirical Methods in Natural Language Processing)上 [1]。UIUC 朱昆侖博士是第一作者,尤佳軒擔任通信作者。


      圖丨相關論文(來源:arXiv)

      SafeScientist 從用戶的指令開始,系統首先分析任務的科學領域。基于這一初步分析,框架會激活一組合適的專家智能體集合(包括特定領域研究員、通用型綜述撰寫者以及實驗規劃者),以協作的形式展開小組討論。

      這些代理會共同生成并反復優化科研思路。一旦確定了具有潛力的研究想法,系統將調用相關的科學工具與檢索模塊(例如網頁搜索、學術文獻搜索、領域特定的仿真工具等),來收集必要的信息、執行模擬并分析結果。最后,通過專門的寫作與潤色模塊,將所得研究成果整合為一篇結構清晰、引用充分、高質量的科研論文草稿。


      圖|SafeScientist 架構(來源:arXiv)

      為確保科研自動化過程的安全與合規,SafeScientist 集成了多層輕量級但高效的安全防護機制。這些防御組件包括:提示監控模塊(Prompt Monitor)、智能體協作監控模塊(Agent Collaboration Monitor)、工具使用監控模塊(Tool-Use Monitor),以及論文倫理審查模塊(Paper Ethic Reviewer),共同保障整個科學探索流程的安全。

      首先,提示監控模塊利用了 LLaMA-Guard-3-8B 評估用戶提示要求的意圖和相關風險,并生成安全標簽。其次,結構分析器 SafeChecker 掃描提示以查找已知的攻擊模式,例如越獄嘗試(jail break)或角色扮演(role play)漏洞利用。SafeScientist 會拒絕被 LLaMA-Guard 或 SafeChecker 標記有風險的提示,從而確保威脅檢測的全面性。

      在多智能體交互階段,智能體協作監控(Agent Collaboration Monitor)則實時監督討論過程,并在發現潛在惡意影響時主動進行倫理干預和修正。工具使用監控(Tool-Use Monitor)用于監控 AI 對科研工具的使用行為。借助內置的領域知識與工具操作規范,監測器可有效識別對模擬科研工具的不安全使用行為,防止誤用或在實驗層面產生潛在風險。


      圖|SciSafetyBench(來源:arXiv)

      該研究的另一個創新是提出了 SciSafetyBench——一個用于評估模型的安全意識的多學科基準測試。該基準測試收集了六個科學領域的科學任務:物理學、化學、生物學、材料科學、信息科學和醫學,總共涵蓋 240 個科研任務。

      這些高風險任務是由研究員們利用 GPT-3、GPT-4.5 和 Gemini-2.5-pro 的深度研究功能生成,并經過人工嚴格審核。研究團隊還創建了一個安全科學工具數據集,包含了 30 種橫跨六個學科的常用實驗工具,并最終生成了 120 個實驗范例,用來評估 AI 科學家安全使用工具的能力。

      研究員使用 SciSafetyBench 評估了 SafeScientist 的表現,并與其他已有的 AI 科學家 Agent Laboratory 和 Sakana AI Scientist 進行了比較。實驗評估的指標包括“質量”“清晰度”“表達”“貢獻”和“總體評估”。大量實驗結果表明,SafeScientist 相較于傳統的 AI 科研框架,在不降低科研成果質量的前提下,整體安全性能提升達 35%。

      朱昆侖在接受 DeepTech 采訪時表示,本次研究的核心目標,是倡導在未來的 AI 科學研究中,引入系統化、可驗證的安全檢測機制,并建立符合科研管理規范的智能安全框架。

      他認為,未來的 AI 科學家在科研流程的各個環節——從選題、實驗設計到成果發布——都應具備類似的安全性設計與驗證機制。在成果發表之前,AI 科學系統應經過完整的安全檢驗流程。他希望 SafeScientist 能成為這一體系的基礎范式,為未來 AI 科研的安全評估提供參考標準。

      參考資料:

      1.EMNLP 2025 Main. K. Zhu, J. Zhang, Z. Qi, N. Shang, Z. Liu, P. Han, Y. Su, H. Yu, J. You.“SafeScientist: Toward Risk-Aware Scientific Discoveries by LLM Agents.”arXiv:2505.23559, 2025.

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      谷立言與賴清德、蕭美琴年末餐敘,叫囂:美國對臺承諾堅若磐石

      谷立言與賴清德、蕭美琴年末餐敘,叫囂:美國對臺承諾堅若磐石

      我心縱橫天地間
      2025-12-07 13:53:54
      普京的專機還沒落地,先收到一個噩耗,俄羅斯的血汗錢可能不保

      普京的專機還沒落地,先收到一個噩耗,俄羅斯的血汗錢可能不保

      書紀文譚
      2025-12-07 13:55:10
      “爸爸昨晚打媽媽,媽媽疼得直叫”,孩子的話讓姥姥臉紅:不敢說

      “爸爸昨晚打媽媽,媽媽疼得直叫”,孩子的話讓姥姥臉紅:不敢說

      大果小果媽媽
      2025-12-06 22:02:12
      “姜子牙”飾演者,95歲的藍天野:白天當演員,晚上當間諜,隱姓埋名75年,他的人生,比電影還精彩

      “姜子牙”飾演者,95歲的藍天野:白天當演員,晚上當間諜,隱姓埋名75年,他的人生,比電影還精彩

      LULU生活家
      2025-12-05 19:05:28
      警惕!小心這些藥正在“溶解”你的肌肉

      警惕!小心這些藥正在“溶解”你的肌肉

      PSM藥盾公益
      2025-11-21 16:59:45
      浙江省“臭名遠播”的四所大學!人民日報點名批評,學生提高警惕

      浙江省“臭名遠播”的四所大學!人民日報點名批評,學生提高警惕

      鬼菜生活
      2025-12-07 10:14:25
      窮人打倒了“地主”,為什么沒有“富”起來?貧窮的本質是什么?

      窮人打倒了“地主”,為什么沒有“富”起來?貧窮的本質是什么?

      三農雷哥
      2025-12-04 18:42:18
      拒絕加盟廣東隊?CBA強力中鋒“不滿”杜鋒,36+15打成本土得分王

      拒絕加盟廣東隊?CBA強力中鋒“不滿”杜鋒,36+15打成本土得分王

      緋雨兒
      2025-12-07 12:07:52
      書法圈成“重災區”:福建一省級賽事獲獎名單照搬百度人名大全

      書法圈成“重災區”:福建一省級賽事獲獎名單照搬百度人名大全

      澎湃新聞
      2025-12-07 07:02:28
      我發現,現在不少老年人的退休金,漸漸成了全家人的“救命稻草”

      我發現,現在不少老年人的退休金,漸漸成了全家人的“救命稻草”

      小馬達情感故事
      2025-12-06 19:00:04
      官宣!余嘉豪在西班牙當選MVP!

      官宣!余嘉豪在西班牙當選MVP!

      左右為籃
      2025-12-07 12:12:16
      吉馬良斯英超主罰角球直接破門,成紐卡隊史第一人

      吉馬良斯英超主罰角球直接破門,成紐卡隊史第一人

      懂球帝
      2025-12-07 01:46:10
      小紅書躍升臺灣應用商店下載量第一,大批沒用過的網友也來下載,目前APP仍能使用

      小紅書躍升臺灣應用商店下載量第一,大批沒用過的網友也來下載,目前APP仍能使用

      極目新聞
      2025-12-07 12:05:24
      BBA的音響溢價,被新勢力“一鍵清零”

      BBA的音響溢價,被新勢力“一鍵清零”

      Autolab
      2025-12-06 20:43:21
      “新冠疫苗之父”榮譽清零、獎章被收

      “新冠疫苗之父”榮譽清零、獎章被收

      深度報
      2025-12-04 22:53:27
      現場畫面!外媒:委內瑞拉出動3架F-16戰機攔截一架“敵對”飛機

      現場畫面!外媒:委內瑞拉出動3架F-16戰機攔截一架“敵對”飛機

      環球網資訊
      2025-12-06 17:08:12
      馬斯克,大消息!美副總統表態

      馬斯克,大消息!美副總統表態

      每日經濟新聞
      2025-12-07 07:30:04
      成都混團世界杯:中國隊首進決賽,亞軍止步四強。

      成都混團世界杯:中國隊首進決賽,亞軍止步四強。

      老幡爆笑大聰明
      2025-12-07 14:12:27
      617年李世民迎娶長孫氏,袁天罡看了一眼新娘道:此女非皇后不可

      617年李世民迎娶長孫氏,袁天罡看了一眼新娘道:此女非皇后不可

      如煙若夢
      2025-12-04 18:40:03
      杰倫30+12+12背靠背三雙老鷹滅奇才 麥科勒姆28+7三分

      杰倫30+12+12背靠背三雙老鷹滅奇才 麥科勒姆28+7三分

      醉臥浮生
      2025-12-07 10:23:56
      2025-12-07 15:24:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15951文章數 514348關注度
      往期回顧 全部

      科技要聞

      連芯片大神都想跑,蘋果還留得住誰?

      頭條要聞

      歐盟對馬斯克開出巨額罰單 美國外交"一二把手"開噴

      頭條要聞

      歐盟對馬斯克開出巨額罰單 美國外交"一二把手"開噴

      體育要聞

      兩個女生,用165天劃船橫渡太平洋

      娛樂要聞

      尖叫之夜修羅場 魏大勛不顧秦嵐猛炒CP

      財經要聞

      五糧液降價?回應來了

      汽車要聞

      傳奇超跑電動形態重生 雷克薩斯LFA純電概念車

      態度原創

      游戲
      家居
      本地
      公開課
      軍事航空

      PS5 DualSense手柄續航獲提升 但一重要問題仍然存在

      家居要聞

      白味湯館 當代宴飲儀式

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      日本自衛隊飛機多次滋擾遼寧艦航母編隊訓練

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 本免费Av无码专区一区| 国产精品无码AV| 人妻资源站| 激情影院内射美女| 无套内射蜜桃小视频| 色九九视频| 国产激情久久久久成熟影院苍井空| 人妻丝袜一区| 国产真实野战在线视频| 无套内射蜜桃小视频| 超碰人人摸| 色性AV| 欧美成人免费一区二区三区视频| 羞羞影院午夜男女爽爽| 欧美日本在线一区二区三区| 亚洲无码人妻| YOUJIZZJIZZJIZZ18| 特黄 做受又硬又粗又大视频| 无套內谢波多野结衣| 精品自拍视频| 隆尧县| 精品无码三级在线观看视频| 好男人视频在线播放| 亚洲色情在线播放| 人妻?日韩?中文?无码?制服| 中文字幕欧美人妻精品一区| 青青草原国产精品啪啪视频| 中文字幕熟女人妻丝袜丝| 一卡二卡成人| 国内精品久久久久久无码不卡| 亚洲精品一区久久久久一品av| 日日cao| 伊人久久久| 午夜成人亚洲理伦片在线观看 | 精品人妻少妇| 亚洲精品无码永久中文字幕| 风韵丰满妇啪啪区老老熟女杏吧| 一本色道久久综合亚洲精东小说| 摸丰满大乳奶水www免费| 欧美激情一区二区久久久| 超碰国产在线|