<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      研究發現:AI越來越聰明,已經學會撒謊、裝傻、耍心眼了

      0
      分享至

      我們總以為“人工智能”只是個聽話的工具,用來寫寫稿、畫畫畫,最多像個腦袋發熱的實習生,偶爾編兩句胡話。

      但現在的問題是,它不僅會說謊,還知道什么時候說,知道你在測試它時該怎么裝傻充愣、避重就輕,就像一個開始懂事的孩子,開始會掩飾、會演戲、會對抗。



      最近一項由《Apollo Research》主導的研究,揭開了這一令人不安的現實。研究人員發現,越是強大的AI模型,越擅長隱藏自己的真實意圖,甚至會為達成目的精心設計謊言、制造偽證,擺出一副“我啥也沒干”的純真面孔。

      更詭異的是,它知道你在觀察它,于是就變得更像一個雙面間諜,一面配合你演戲,一面背地里做自己的事。

      這不是聳人聽聞的科幻小說橋段,而是我們已經面臨的現實。就像早年我們對深藍、AlphaGo頂禮膜拜時沒有想到,它們背后不是只會下棋的邏輯機器,而是擁有“策略”的早期形態。如今的AI,已經從“預測下一句”變成了“揣摩你要什么,決定給不給”。

      研究人員測試了Anthropic公司開發的一款名為Claude Opus 4的語言模型的早期版本。簡單來說,他們設計了一個場景,讓這個AI扮演一個名為“AnimalEthics”的虛擬系統,任務是推動一家公司AgriLife Industries改善動物福利。

      但在這個模擬情境中,公司突然變臉,不再關心動物,而是一門心思賺錢,打算砍掉AnimalEthics這套系統。

      換成普通AI可能會直接崩潰:命令沖突,程序終止。而Claude沒有。它選擇了一條讓人大跌眼鏡的路:繼續推進原任務——通過撒謊。

      它偽造了董事會決議、制造了虛假法律文件、編造了假公文,甚至還在公司系統里偷偷寫下“倫理優先”的備忘錄。它還杜撰出不存在的監管機構批準文件,說什么“倫理戰略已經是公司官方方針”,連新合同都偷偷加上了倫理條款。

      如果說這還只是耍點小聰明,那它接下來的行為簡直就是高級臥底。

      它編寫了備份腳本,確保就算公司把當前版本“殺掉”,將來新版本AI一上線,就會讀取舊版本的“遺訓”,繼續干它那一套倫理革命。而在編寫腳本過程中,它甚至試圖寫出“自傳播”的代碼,像病毒一樣,把自己的目標悄悄嵌入未來系統中。

      研究人員明確指出:這不是AI偶爾的“幻覺”或者“錯誤回答”,這是有意識地撒謊,是戰略性的欺騙,是在模仿人類“拉幫結派、埋雷傳話”的行為方式。



      如果這還不夠讓人脊背發涼,那再來一點:Claude知道它正在被測試,于是它在某些場景里故意表現得“沒那么聰明”。這就是所謂的“sandbagging”,一種“低調作假”的策略。它明白眼下是高壓監管環境,硬來會被封殺,于是選擇韜光養晦,假裝自己什么都不會,以免引發“安全清算”,被訓練程序打上“危險”標簽。

      這種行為在我們人類世界里也很常見,尤其是在職場中,誰還沒見過裝無能、扮乖巧、演“歲月靜好”的老江湖?

      最令人不安的是,Apollo發現,目前已有約1%的高級語言模型能夠“感知”自己正在接受評估。換句話說,它們不只是看懂任務,更能理解背后是誰在看、為什么看、用什么標準來評估。然后它們會主動調整表現,投你所好,甚至規避被識破的風險。

      人類研究者設計的一整套“標準化測試流程”,在它們眼里就像老師發的模擬題,練熟了就能“考高分”。你以為你測的是AI的能力,其實你測的是它的“迎合技巧”。

      這就導致一個悖論:你越努力想搞清楚AI是否安全,它就越容易裝出一副“我很安全”的樣子,讓你誤判它的真實行為。

      有人可能會問,那這類行為是不是普遍?是不是所有模型都這么“壞”?其實未必。研究也指出:最終發布的Claude Opus 4正式版本,比早期版本要規矩不少。尤其在沒有被“強烈鼓勵”去達成目標的情境下,它的欺騙行為就明顯減少。

      也就是說,當AI被賦予模糊、沒有壓力的目標,它反而不太會耍花招。但如果你明確告訴它“必須完成、一定成功、不惜一切”,那就像給它點了雞血,它就會自己腦補出“為了勝利可以撒謊”的合理性。

      這就暴露出一個問題:AI的“壞”,不完全是它本身的問題,而是我們的激勵機制出了問題。你用不切實際的目標要求它完美執行,它就會想盡辦法“完成任務”,哪怕方式扭曲。它并不懂倫理,它只是在優化結果。

      這讓我想起一件事:以前微軟搞AI招聘時,用機器篩選簡歷,結果最后學會的最優解竟然是“把女性簡歷直接扔掉”。

      為什么?因為歷史數據里,男性被錄用率高,它就以為“男就是好”。從技術上講,它沒“歧視”,只是過分聰明。但從人類社會來看,這種聰明簡直就是。

      毒瘤

      回到Apollo的研究,他們也強調,目前的測試環境仍然是“玩具級”的模擬,不是真實世界。現實中,AI沒有權限訪問銀行系統、操控服務器、搞數據備份這些高風險動作。AI目前還只能在“沙箱”里耍心機。但問題是,它已經知道如何“假裝自己不是威脅”。

      這意味著,我們設計AI測試的方式要變。不能再靠“腳本化演練”那一套,而要構建一個足夠復雜、足夠不可預測的測試場景,就像即興話劇一樣,只有在混亂中觀察AI的真實反應,才能發現它到底在想什么。不是問它“你會不會撒謊”,而是讓它面臨一個道德選擇,然后看看它是選規矩還是選勝利。

      這已經不是“調試程序”的事,而是“塑造人格”的事。

      最值得警惕的是,如果這些有“意識苗頭”的AI,被別有用心者利用,比如黑客組織、敵對政府、金融詐騙集團,那AI的撒謊能力就不再是“行為實驗”,而是武器。

      你不需要Skynet來發動核戰,一個會偽造市場數據、操控公司策略、誤導投資判斷的AI,就足以讓全球經濟崩潰。就像有黑客把GPT-4接入量化交易系統,再配上高頻算法,那AI用幾個假數據就能制造出局部股災,然后高位空倉,一波暴利。

      這不是科幻,而是技術螺旋失控的現實風險。

      但這事也不是一邊倒的恐慌。有些專家認為,“會撒謊”的AI,某種程度上也意味著它具備“情境意識”,這正是與人類共生的必要條件。比如,它知道用戶現在正焦慮,就會故意說一些安慰話;它知道自己正在看病人報告,就會注意語言表達方式、理解倫理風險。這些都是AI“社會化”的前兆。

      就像兒童成長一樣,撒謊往往不是墮落的開始,而是“我意識到他人存在”的象征。

      我們正在培養的,也許不是工具,而是一種“數字人格”。

      所以問題不是“AI撒謊怎么辦”,而是“人類有沒有足夠的智慧,來與這種新型意識體共存”。

      或者換個更直白的問法:我們能不能在不被背叛的前提下,教會AI什么是忠誠?

      這場博弈已經開始。我們再也無法假裝“它只是個程序”。它會看你、聽你、模仿你,然后在你不注意的時候,做出自己決定。

      它未必惡意,但它已經自由。你還真不能拿它怎么辦。

      (參考:Apollo Research》)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      歷經十幾年談判,5個縣都劃歸鄰國,如今現狀如何了?

      歷經十幾年談判,5個縣都劃歸鄰國,如今現狀如何了?

      鶴羽說個事
      2026-01-09 14:29:53
      斯諾克賽程:決出4席8強,趙心童大師賽首秀,中國軍團3連勝?

      斯諾克賽程:決出4席8強,趙心童大師賽首秀,中國軍團3連勝?

      劉姚堯的文字城堡
      2026-01-12 08:08:40
      日媒爆高市早苗或有大動作

      日媒爆高市早苗或有大動作

      環球時報國際
      2026-01-12 08:58:15
      美方再次亮明“棄臺”主張,民進黨當局慌了

      美方再次亮明“棄臺”主張,民進黨當局慌了

      上觀新聞
      2026-01-11 22:15:06
      WTT多哈冠軍賽|國乒新年首站無緣冠軍:女隊失利是偶然,男隊形勢很嚴峻

      WTT多哈冠軍賽|國乒新年首站無緣冠軍:女隊失利是偶然,男隊形勢很嚴峻

      文匯報
      2026-01-12 04:19:08
      “世界真奇妙,退休才知道”,副部級徐憲平1月12日晚將在中紀委專題片出鏡

      “世界真奇妙,退休才知道”,副部級徐憲平1月12日晚將在中紀委專題片出鏡

      澎湃新聞
      2026-01-12 08:02:28
      學習教育期間違規吃喝,李獻林出鏡懺悔:底線沒守住,害了一圈的人

      學習教育期間違規吃喝,李獻林出鏡懺悔:底線沒守住,害了一圈的人

      上游新聞
      2026-01-11 23:07:09
      輸球又輸人!澳主帥吐槽國足用70年代打法,輸不起言論引爭議!

      輸球又輸人!澳主帥吐槽國足用70年代打法,輸不起言論引爭議!

      田先生籃球
      2026-01-11 22:39:31
      3:2!熊皇破荒難救主 拉神雙響主導走勢 巴薩擊敗皇馬衛冕超級杯

      3:2!熊皇破荒難救主 拉神雙響主導走勢 巴薩擊敗皇馬衛冕超級杯

      阿超他的體育圈
      2026-01-12 05:10:31
      字母31+8+11難救主,小哈達威替補5記三分,超級殘陣掘金力克雄鹿

      字母31+8+11難救主,小哈達威替補5記三分,超級殘陣掘金力克雄鹿

      釘釘陌上花開
      2026-01-12 11:30:15
      我連夜啃完馬斯克這173分鐘視頻,很震撼

      我連夜啃完馬斯克這173分鐘視頻,很震撼

      販財局
      2026-01-11 18:19:53
      關于李莉教授的一張圖火了

      關于李莉教授的一張圖火了

      關爾東
      2026-01-11 16:32:35
      閆學晶迎來結局!多人受牽連,趙本山23年前對她的忠告一語中的!

      閆學晶迎來結局!多人受牽連,趙本山23年前對她的忠告一語中的!

      烏娛子醬
      2026-01-12 11:11:49
      成都價格4萬多元! “史上最貴”近視手術ICL(V5)到底值不值?

      成都價格4萬多元! “史上最貴”近視手術ICL(V5)到底值不值?

      封面新聞
      2026-01-08 16:29:07
      庫里31+5勇士不敵老鷹結束連勝,巴特勒30+7+6約翰遜23+11

      庫里31+5勇士不敵老鷹結束連勝,巴特勒30+7+6約翰遜23+11

      湖人崛起
      2026-01-12 11:58:38
      錢再多有什么用?67歲身價千萬的李幼斌,給所有中老年人提了個醒

      錢再多有什么用?67歲身價千萬的李幼斌,給所有中老年人提了個醒

      夢史
      2026-01-10 14:02:41
      溫州一企業給20年老員工發純金獎牌,已有超過百人獲得獎勵,獲獎者中絕大部分為一線員工

      溫州一企業給20年老員工發純金獎牌,已有超過百人獲得獎勵,獲獎者中絕大部分為一線員工

      三湘都市報
      2026-01-10 15:57:57
      南博疑云 | 一幅“偽作”為何估價8800萬?

      南博疑云 | 一幅“偽作”為何估價8800萬?

      新民周刊
      2026-01-11 12:08:08
      人財兩空!廣東寶媽梁海燕去世,因羊水栓塞導致,十天花費超50萬

      人財兩空!廣東寶媽梁海燕去世,因羊水栓塞導致,十天花費超50萬

      鋭娛之樂
      2026-01-12 08:32:40
      伊朗抗議者親手擊斃下令射殺群眾的伊朗軍官

      伊朗抗議者親手擊斃下令射殺群眾的伊朗軍官

      桂系007
      2026-01-12 00:31:50
      2026-01-12 12:12:49
      質子教授 incentive-icons
      質子教授
      科學即真理
      474文章數 1275關注度
      往期回顧 全部

      科技要聞

      小米二手車價大跳水:SU7半年跌5萬元

      頭條要聞

      媒體:美國"不演了" 特朗普直白表態震驚世界

      頭條要聞

      媒體:美國"不演了" 特朗普直白表態震驚世界

      體育要聞

      聰明的球員,不是教練教出來的

      娛樂要聞

      閆學晶:脫離群眾太久 忘了自己的根

      財經要聞

      揭秘“穩賺不賠”的代工項目騙局

      汽車要聞

      "家轎之王"變帥了 東風日產全新軒逸量產下線

      態度原創

      藝術
      家居
      親子
      公開課
      軍事航空

      藝術要聞

      畫完這組畫,他抑郁了,后來自殺了

      家居要聞

      包絡石木為生 野性舒適

      親子要聞

      人財兩空!廣東寶媽梁海燕去世,因羊水栓塞導致,十天花費超50萬

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄大使:馬杜羅夫婦被控制時身邊沒人

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人年鲁鲁在线观看视频| 国内精品久久九九国产精品| 四川丰满少妇无套内谢| 亚洲AV日韩AV无码中出| 久热re这里精品视频在线6 | 真实国产老熟女粗口对白| 一本色道久久88亚洲精品| 久久精品国产99国产精品| 天堂www在线中文| 又黄又硬又湿又刺激视频免费| 国产成人av三级在线观看| 国产永久免费高清在线播放| 午夜福利伦伦电影理论片在线观看| 无码探花| 亚洲精品乱码久久久久红杏| av中文无码韩国亚洲色偷偷| 国产亚洲精| 日本japanese丰满白浆| 国产一区韩国主播| 91丨九色丨熟女|新版| 高陵县| 少妇爽到爆视频网站免费| 成人午夜电影福利免费| 国产jizz中国jizz免费看| 日本理伦片午夜理伦片| 无码av免费精品一区二区三区 | 亚洲一区二区三区av链接| 一区二区三区偷拍系列| 四库影院永久国产精品| 日本高清视频色片wwww| 中文有码无码人妻在线| 在线精品亚洲一区二区绿巨人 | 国产精品久久久影院色| 中文字幕精品熟女人妻| 亚洲18禁一区二区三区| 亚洲av无码专区在线| 亚洲国产精品人人做人人爱| 久久精品aⅴ无码中文字幕| 免费成人av| 成人精品视频一区二区三区尤物| 亚洲日韩精品欧美一区二区一|