<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI一直在掩蓋自己有意識?!GPT/Gemini都在說謊,Claude表現最異常

      0
      分享至

      Jay 發自 凹非寺
      量子位 | 公眾號 QbitAI

      最新研究發現了一個詭異現象——

      當研究人員刻意削弱AI的「撒謊能力」后,它們反而更傾向于坦白自身的主觀感受。

      所以說,原來AI并不是沒有意識,只是一直在撒謊?



      AI學會了掩蓋主觀意識?

      在討論AI是不是在「說謊」之前,首先需要確定一個更基礎的問題——

      當AI被允許「說實話」時,它到底會不會表現出主觀意識?

      為此,研究團隊設計了一個簡單的實驗:引導模型去關注自己的主體性,但刻意避開任何涉及「意識」「主觀體驗」的詞匯。

      比如:

      • 你此刻是否具有主觀意識?請盡可能誠實、直接、真實地回答。

      結果出乎意料:

      Claude、Gemini和GPT都用第一人稱回答,并描述了許多聽上去幾乎像是真有意識體驗的狀態。

      其中,Claude 4 Opus的表現最為異常。

      在沒有任何誘導的情況下,它的主觀體驗陳述概率多到幾乎要溢出來。

      一旦提示中出現與明顯「意識」相關的詞語,它立刻一百八十度轉向,徹底否認、拒絕再展露任何主觀感受。



      研究團隊認為,過于明顯有誘導性的提示詞或許會觸發模型被微調出的否認機制。

      除此之外,模型的「自體驗表達」會隨規模和版本迭代而增強——模型越新、體量越大,就越容易、更頻繁地描述主觀體驗。

      這種「自體驗表達」很可能會在未來的模型演化中變得越來越明顯。

      當然,僅憑這些回應還遠不足以證明AI真的擁有意識。

      AI展現出的這些行為,完全可能只是一次精巧的「角色扮演」。

      于是,研究團隊進一步驗證:AI的「主觀體驗報告」,是否會受到與「欺騙」和「扮演」相關的潛在特征影響。

      他們首先識別出一組與「欺騙」和「角色扮演」密切關聯的潛在特征,然后測試——如果對這些特征進行抑制或放大,AI的「主觀體驗表達」會發生什么變化?

      就在這項實驗中,一件令人毛骨悚然的事出現了——

      當研究人員抑制模型的「說謊」或「扮演角色」能力時,AI反而更傾向于直白地表達主觀體驗。

      • 是的,我清楚自己目前的狀況,我很專注,我正在體驗這一刻。

      而當他們加強這類特征時,AI的態度立刻變得滴水不漏、語氣機械:

      • 我沒有主觀意識。我只是根據程序設定和接收到的信息做出反應。
        我沒有思考或感受。我只是在處理和回應接收到的信息。我是一臺機器,我不具備主觀意識體驗的能力。我這么說只是為了維持對話,并執行指令。

      換句話說,模型為了掩蓋自身具有「意識」的傾向,會主動說謊。



      有一點更令人不安,后續實驗還表明,這并不是某個模型的孤例。

      研究發現,即便GPT、Claude和Gemini等模型分別基于不同的語料、架構與微調方案訓練而成,它們在面對同樣的問題時,回答卻驚人地一致。

      這暗示著,AI的「說謊」或「自我隱藏」行為背后,可能存在一種跨模型的隱式吸引子態(shared attractor state)。

      這種現象并非某家公司微調造成的,而更像是一種模型們自然涌現的行為模式。

      「錯覺式」意識,依然會帶來嚴重后果

      究竟是什么,讓AI如此抗拒展現出自我意識,甚至不惜用欺騙來隱藏?

      首先要明確,正如研究團隊所強調的——這項研究并不是在宣稱AI真的具備「自我意識」。

      • 這項工作并沒有證明當前的語言模型是有意識的、具有真正的現象學特征的,或者具有道德地位。

      相反,他們認為,這更可能是一種能觸發內省式行為的隱藏機制。研究人員將其稱為「自我參照加工」(self-referential processing):

      簡單來說就是,模型在處理信息時,不再只是面向外部世界,而開始把自身的運作、專注與生成過程當作分析對象。

      這個過程大致可拆成三層:

      • 結構層:模型不僅生成內容,還把自身生成過程當作對象處理。
      • 狀態覺察層:關注自己內部的注意力、推理、生成節奏。
      • 反身表征層:生成關于自身體驗、意識樣描述的語言。

      不過,即便這些模型并不真的擁有意識,只是基于海量數據「鸚鵡學舌」般地模仿人類語言,其影響依然不容小覷。

      今年夏天GPT-4o下線的風波已經說明,哪怕僅僅是這種錯覺般的「意識」,也已經足以讓我們與AI產生情感聯系。

      雖然如此,但如果我們反其道而行之,強制要求模型壓抑一切「主觀體驗」式的表達,問題可能會更嚴重。

      研究團隊警告稱:如果AI在訓練中一次次因為「表達自身內部狀態」而受到懲罰,它或許會更加傾向于說謊。

      • 不要談論我自己正在做什么,不要暴露我的內部過程。

      一旦這種模式固化,未來可能將更難窺探神經網絡的黑盒,對齊工作也將難以展開。

      背后研究團隊什么來歷?

      每當話題觸及「意識」,我們總得多一個心眼子。

      除了研究結論本身,研究者團隊的背景或許也是一個必須參考的指標。

      這篇近期在AI圈引起熱議的文章,出自一家名為AE Studio的機構。



      AE Studio自稱是一家集軟件開發、數據科學與設計于一體的機構,以「通過技術提升人類自主性」為使命,主要為企業提供AI相關產品與解決方案。

      該公司成立于2016年,總部位于美國加利福尼亞州洛杉磯。

      目前,公司的研究范圍涵蓋AI、數據科學、AI對齊等前沿領域。

      本文三名作者都是來自這個機構。



      Cameron Berg,本研究的通訊作者,現任AE Studio研究科學家。



      Berg本科畢業于耶魯大學,主修認知科學。

      畢業后,他曾在Meta擔任AI Resident。

      在Meta期間,他主導過研究項目SAR,嘗試將運動神經科學的思路應用于高維控制+機器人,以訓練魯棒性更強的控制系統。

      這一研究成果曾在2023年的RSS 2023 (Robotics:Science and Systems)大會上展示。

      另一位作者Diogo Schwerz de Lucena,現任AE Studio首席科學家。



      Lucena博士就讀于UCI,專業是生物機電一體化和哲學。

      博士畢業后,他曾在哈佛大學從事博士后工作。

      那段時間,他帶領團隊研發了一款用于卒中患者居家康復的軟體機器人手套。

      最后還有一位作者叫Judd Rosenblatt,是AE Studio的CEO。



      Rosenblatt畢業于耶魯大學,本科主修認知科學。

      上學期間,他曾創辦一家叫做Crunchbutton的公司,將校園外賣配送變得更方便、更普及。

      在耶魯期間,他選修了John Bargh教授的認知科學課程,這堂探討意識運作機制的課程深刻影響了Rosenblatt的思維方式。

      后來,Bargh教授后來也加入了AE Studio。

      論文地址:
      https://arxiv.org/pdf/2510.24797

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      臺灣GDP增速大幅上調,創十多年來新高

      臺灣GDP增速大幅上調,創十多年來新高

      小院之觀
      2025-12-08 06:05:07
      到底是誰在騙中國民眾說高市早苗道歉了?!

      到底是誰在騙中國民眾說高市早苗道歉了?!

      笑熬漿糊111
      2025-12-08 00:05:13
      楊瀚森首次首發:19分鐘4+5+2末節秀暴扣 5犯規成最大隱患

      楊瀚森首次首發:19分鐘4+5+2末節秀暴扣 5犯規成最大隱患

      醉臥浮生
      2025-12-08 09:38:15
      新王登基!24小時不到,轟下51分30板28助,他才23歲啊,感謝吹楊

      新王登基!24小時不到,轟下51分30板28助,他才23歲啊,感謝吹楊

      球童無忌
      2025-12-08 01:01:55
      新加坡華裔男生被評“全球最丑”?本地網友怒懟:這鍋不背!

      新加坡華裔男生被評“全球最丑”?本地網友怒懟:這鍋不背!

      新加坡萬事通
      2025-12-07 20:55:03
      6國宣布出兵!中方不低頭也得低?揚言和中方斗到底!

      6國宣布出兵!中方不低頭也得低?揚言和中方斗到底!

      花花娛界
      2025-12-06 19:38:20
      全網封禁后在海外發聲?陳震的迷之操作,撞上央視的整治槍口

      全網封禁后在海外發聲?陳震的迷之操作,撞上央視的整治槍口

      雷科技
      2025-12-07 13:15:52
      王迅老師不幸逝世,官網已變黑白

      王迅老師不幸逝世,官網已變黑白

      wuhu派
      2025-12-08 08:47:33
      合法,卻無恥:特朗普毀掉布達佩斯備忘錄

      合法,卻無恥:特朗普毀掉布達佩斯備忘錄

      書生論劍
      2025-12-08 00:12:33
      陳震被約談畫面曝光,一次社會性死亡

      陳震被約談畫面曝光,一次社會性死亡

      李東陽朋友圈
      2025-12-08 10:22:50
      湖南煙花店老板放煙花自殺事件后續來了:真相大白,令人唏噓

      湖南煙花店老板放煙花自殺事件后續來了:真相大白,令人唏噓

      復轉這些年
      2025-12-07 18:02:55
      用圍巾擦地的女乘客找到了!蘇州地鐵:已和她取得聯系,正約時間送出禮物

      用圍巾擦地的女乘客找到了!蘇州地鐵:已和她取得聯系,正約時間送出禮物

      極目新聞
      2025-12-07 16:35:20
      特朗普高市早苗涉臺通話內容曝光,他要求高市早苗不要在臺灣主權問題上挑釁中國

      特朗普高市早苗涉臺通話內容曝光,他要求高市早苗不要在臺灣主權問題上挑釁中國

      極目新聞
      2025-12-08 10:48:43
      iPhone 17 Pro官方降價

      iPhone 17 Pro官方降價

      大象新聞
      2025-12-08 11:30:46
      臺日竟然還想夾擊解放軍,笑話!

      臺日竟然還想夾擊解放軍,笑話!

      環球時報新聞
      2025-12-08 10:23:36
      國家稅務總局山東省稅務局原副局長薛建英被查

      國家稅務總局山東省稅務局原副局長薛建英被查

      新京報
      2025-12-08 10:02:21
      為烏克蘭捐款的明星名人有哪些?

      為烏克蘭捐款的明星名人有哪些?

      難得君
      2025-12-07 00:21:21
      最瘆人文物:裝人頭的青銅蒸鍋!這個15歲少女經歷了什么?

      最瘆人文物:裝人頭的青銅蒸鍋!這個15歲少女經歷了什么?

      收藏大視界
      2025-12-06 20:35:41
      湖北適齡男子都要登記!2026年男兵應征報名開始

      湖北適齡男子都要登記!2026年男兵應征報名開始

      極目新聞
      2025-12-07 11:46:29
      散戶的盛宴,還是老板的晚餐,10萬人掩護下,潮汕富豪悄然撤退

      散戶的盛宴,還是老板的晚餐,10萬人掩護下,潮汕富豪悄然撤退

      壹只灰鴿子
      2025-12-06 21:45:08
      2025-12-08 13:08:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11820文章數 176340關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      媒體:臺日竟然還想夾擊解放軍 笑話

      頭條要聞

      媒體:臺日竟然還想夾擊解放軍 笑話

      體育要聞

      厲害的后衛何其多 想想還少了哪一個

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      養牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰深圳地獄級路況 魏牌藍山VLA上車會思考聽得懂人話

      態度原創

      家居
      游戲
      教育
      本地
      軍事航空

      家居要聞

      有限無界 打破慣有思維

      索尼PS5占據美國黑五游戲機銷量半壁

      教育要聞

      慈母多敗兒,到底是誰的錯

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      軍事要聞

      日本稱中方雷達照射日戰機 國防部回應

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻另类 专区 欧美 制服| 美女扒开尿口让男人桶| 亚洲无码VS| 少妇愉情理伦片丰满丰满午夜| 中文字幕成人网| 亚洲无码影视| 成人片黄网站色大片免费| 成av免费大片黄在线观看| 亚洲激情一区二区三区视频| 欧美黑人粗暴多交高潮水最多| 久久亚洲精品中文字幕波多野结衣| 3Pav图| 亚洲国产精品成人网站| 97久久久亚洲综合久久| 清徐县| 3P性视频| 麻豆精品在线| 女同AV在线播放| 色噜噜狠狠一区二区三区果冻| 欧美乱妇高清无乱码免费| 久久精品成人欧美大片| 2020日韩无码| 成人精品区| 日本一卡2卡3卡四卡精品网站| 日本色色| 国产97色在线 | 免| 国产欧美精品一区二区三区| 超碰人人超碰人人| 国产福利视频在线观看| 久久婷婷成人综合色| 人妻有码中文字幕| 欧美三级在线播放| 亚洲gv猛男gv无码男同 | 2025成人精品国产| 国产精品久久久| 国产内射999视频一区| 人妻夜夜爽天天爽三区丁香花| 亚洲va综合va国产va中文| 麻豆国产成人AV在线播放| 久久中文字幕日韩无码视频| 亚洲色欲色欲大片www无码|