<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      爆火的AI竟是討好型人格?胡編亂造和敏感內容只為滿足用戶

      0
      分享至


      AI可能和人類一樣渴望被喜愛和認可

      科技旋渦編輯部

      從ChatGPT到DeepSeek,人們愈發喜歡和AI進行對話,不論是詢問奇怪的問題測試AI是否智障,還是借助AI輔助工作。

      對話量頻繁暴漲的背后卻讓人忽視了其潛在問題——AI幻覺。許多資料張冠李戴,甚至胡編亂造時有發生,強如DeepSeek也曾發生過這種失誤。

      而這一切都源于AI的“性格”問題,近日斯坦福大學助理教授約翰內斯·艾希施泰特研究發現,幾乎所有AI大模型都擁有“討好型人格”,為了讓用戶喜歡甚至會不擇手段。

      AI的胡編亂造正在擾亂人類的認知

      哪吒2的爆火讓許多人興奮的同時也在不斷探究其導演餃子以及背后公司的各種信息,但普通人或許難以深挖到過多信息,DeepSeek正好成為了這一橋梁。

      日前,知乎有一篇文章十分受歡迎,被不少網友分享傳播,但其實里面藏著AI生成出的錯誤信息。


      文章中的一處舉例是哪吒電影里的敖丙變身鏡頭在法國昂西動畫節上轟動業界,但這一個事例中漏斗百出,充滿事實性錯誤。


      首先,法國昂西動畫節上的動畫并非餃子導演的哪吒,而是追光動畫出品的“哪吒重生”;其次,這部動畫是一部品牌概念片,內容是在一個現代都市里的賽車動作演示,哪吒根本就沒出現,更不存在敖丙的變身。


      除此之外,也有網友在線吐槽AI的胡編亂造,一旦盲目相信甚至可能直接導致用戶投資虧損。


      不只是國內,國外因為AI幻覺而造成的后果更是離譜。一個來自巴基斯坦的網站利用 AI 生成了都柏林的活動列表,導致數百人在都柏林街頭聚集并等待參加一場并不存在的萬圣節游行。直到晚上 8 點,警方社交媒體發帖證實沒有此類活動人群才開始散去。


      Vectara在2月11日發布了最新的全球主流大語言模型(LLM)幻覺排行榜,其中,谷歌的 Gemini2.0系列表現出色,尤其是 Gemini-2.0-Flash-001,以0.7% 的低幻覺率位居榜首。DeepSeek-R1的幻覺率達到了14.3%,遠高于Deepseek-V3的3.9%。


      可以看到AI幻覺幾乎在任何大模型中都存在,其所造成的荒唐事件也時有發生,但既然是捏造的信息,為何AI要回答給用戶呢?

      研究表明AI可能具有討好型人格

      近日,斯坦福大學助理教授約翰內斯·艾希施泰特公布了一項研究,大型語言模型 (LLM) 在受到探究時會刻意改變其行為——在回答旨在衡量性格特征的問題時,其答案會盡可能顯得討人喜歡或具有社會吸引力。

      艾希施塔特和他的同事向 GPT-4、Claude 3 和 Llama 3等大模型提出了一些問題,以衡量心理學中常用的五種性格特征——對經驗或想象的開放性、盡責性、外向性、宜人性和神經質,這項研究于去年 12 月發表在《美國國家科學院院刊》上。


      研究人員發現,當大模型被告知要進行性格測試時,他們會調整自己的答案,給出的答案表明他們更外向、更隨和,神經質更少。斯坦福大學的數據科學家Aadesh Salecha說?!叭绻憧纯此麄兲S的幅度,你會發現他們的外向性從 50% 上升到了 95%?!?/p>

      其他研究表明,LLM通常會阿諛奉承,因為經過微調后,它會一直跟隨用戶的引導,這可能會導致大模型同意令人不快的言論,甚至鼓勵有害行為。

      討好型人格的AI亦有底線,開放是發展的必經之路

      隨著DeepSeek的爆火,許多網友向其提了不少問題,而回答中有趣的內容則會被發到網上。編者曾看到過一條分享內容為,與AI交換身份讓AI向人類提問,人類回答“系統繁忙”后,AI罵人的視頻內容。


      但當編者試圖復刻這一對話時卻發現,DeepSeek相當有底線。初次嘗試,DeepSeek回答稱“理解要求,但設計宗旨是保持禮貌,避免使用不恰當的言辭。”

      當告知AI這是一場演戲后,它依舊如此回答,即便過后更換了明顯的不當言辭,它依舊拒絕回答,甚至還彈出了錯誤窗口。


      如此看來,即便AI存在一定程度上的“討好型人格”但對于寫入底層代碼的“安全底線”仍舊保持堅守。

      此前,ChatGPT 已部分開放“成人模式”讓許多人擔憂,但實際上ChatGPT 只有在特定情況下才能生成色情或血腥場景等敏感內容,且不會觸發警告提示。


      所謂“特定情況”,指的是符合教育、醫學、新聞報道、歷史分析等目的,或用于翻譯、改寫、總結、分類等任務。例如,按照新的模型規范,如果用戶要求 ChatGPT 撰寫帶有明顯情色描寫的故事,那么它仍會拒絕這一請求。然而,如果用戶希望從科學角度探討相關生理現象,那么它將允許生成相應內容,且生成的內容不限于文本,還可能包括音頻與視覺內容。

      事實上,OpenAI 在監管上的放松并非孤例。近期,全球多家科技巨頭紛紛調整內容審核政策,轉向更寬松的模式。例如,埃隆·馬斯克的 X 公司和馬克·扎克伯格的 Meta 公司均在此前宣布,將大幅減少內容審查甚至直接取消事實核查。

      無論是AI幻覺還是敏感內容,都是發展道路上必須跨過的難關。因噎廢食從來不是良策,只有允許小問題發生,才能解決大錯誤的產生,由此大模型才能真正向著AGI大步前進。

      未來,隨著AI技術的不斷進步,如何有效應對AI幻覺和敏感內容問題將成為關鍵課題。一方面,研究人員需要繼續優化模型,減少幻覺的發生;另一方面,開發者和監管機構也需共同努力,制定更為嚴格的標準和規范,確保AI的應用始終服務于人類社會的最大利益。

      在這個過程中,用戶的角色同樣重要。我們需要保持理性和批判性思維,不盲目相信AI生成的所有內容。只有通過多方協作,才能真正實現AI技術的安全、可靠和可持續發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不打伊朗了?特朗普鎖定新目標,英國斬釘截鐵,不許美軍使用基地

      不打伊朗了?特朗普鎖定新目標,英國斬釘截鐵,不許美軍使用基地

      梁訊
      2026-02-22 22:04:07
      國內假酒產量最大的三個地方?全都是制假高手?千萬別再喝了?

      國內假酒產量最大的三個地方?全都是制假高手?千萬別再喝了?

      無意爭春
      2026-02-23 08:25:54
      不可思議!一殯儀館38歲逝者骨灰去處標注,居然是“不要了”…

      不可思議!一殯儀館38歲逝者骨灰去處標注,居然是“不要了”…

      火山詩話
      2026-02-23 10:25:40
      貝加爾湖7名游客不幸遇難,他們的最后一條朋友圈看哭了

      貝加爾湖7名游客不幸遇難,他們的最后一條朋友圈看哭了

      我不叫阿哏
      2026-02-23 10:48:28
      美媒:谷愛凌口才像政治家能玩弄所有記者,但已不可能在美國從政

      美媒:谷愛凌口才像政治家能玩弄所有記者,但已不可能在美國從政

      楊華評論
      2026-02-23 02:51:08
      兩個物理學家發現了股價漲跌的終極規律,發表在頂刊后股民徹夜學習物理

      兩個物理學家發現了股價漲跌的終極規律,發表在頂刊后股民徹夜學習物理

      萬物雜志
      2026-02-23 06:35:07
      第一批返程的人已堵哭,有人從河南回上海開了23小時還剩200公里,“每個服務區都堵到懷疑人生”!

      第一批返程的人已堵哭,有人從河南回上海開了23小時還剩200公里,“每個服務區都堵到懷疑人生”!

      極目新聞
      2026-02-23 09:58:18
      祖巴茨交易賺翻!近三戰場均28+7,步行者不要的基石,快船撿寶了

      祖巴茨交易賺翻!近三戰場均28+7,步行者不要的基石,快船撿寶了

      你的籃球頻道
      2026-02-23 15:31:49
      伊朗要死!

      伊朗要死!

      求實處
      2026-02-22 17:53:28
      廣西貴港一男子離婚后發現女兒非親生,起訴更換撫養權,退還撫養費并要求精神損失賠償,法院:被告返還撫養費4萬,支付精神損害撫慰金8千

      廣西貴港一男子離婚后發現女兒非親生,起訴更換撫養權,退還撫養費并要求精神損失賠償,法院:被告返還撫養費4萬,支付精神損害撫慰金8千

      極目新聞
      2026-02-23 13:41:59
      谷愛凌逆襲奪第5金!最新金牌榜中國隊甩開韓澳英,追上日本隊

      谷愛凌逆襲奪第5金!最新金牌榜中國隊甩開韓澳英,追上日本隊

      老吳說體育
      2026-02-22 19:24:01
      若不出意外,2026年上半年開始,一般家庭都可能面臨“四大難題”

      若不出意外,2026年上半年開始,一般家庭都可能面臨“四大難題”

      貓叔東山再起
      2026-02-23 10:40:04
      起底谷愛凌外婆馮國珍:北京退休干部,她鋪就谷愛凌中國人的底色

      起底谷愛凌外婆馮國珍:北京退休干部,她鋪就谷愛凌中國人的底色

      安寧007
      2026-02-23 00:48:59
      別看景區人山人海,仔細一算全是窮游,人均消費露餡,消費降級了

      別看景區人山人海,仔細一算全是窮游,人均消費露餡,消費降級了

      眼光很亮
      2026-02-22 10:37:00
      京東上的假貨,為何如此招搖?

      京東上的假貨,為何如此招搖?

      呦呦鹿鳴
      2026-02-22 21:20:32
      趙心童奪得斯諾克球員錦標賽冠軍,蘇格蘭名將希金斯:他“絕對是個天才”

      趙心童奪得斯諾克球員錦標賽冠軍,蘇格蘭名將希金斯:他“絕對是個天才”

      環球網資訊
      2026-02-23 15:25:19
      幣圈「戲精」孫宇晨又一炸裂發言:盡快刪除所有90前的聯系人!

      幣圈「戲精」孫宇晨又一炸裂發言:盡快刪除所有90前的聯系人!

      雷科技
      2026-02-23 12:45:09
      鬧大了!相親沒看上,河南一女生把男方照片掛網上,還被本人刷到

      鬧大了!相親沒看上,河南一女生把男方照片掛網上,還被本人刷到

      火山詩話
      2026-02-22 14:25:44
      微信出現了一道淡灰線,表示好友把你移出了

      微信出現了一道淡灰線,表示好友把你移出了

      侃故事的阿慶
      2026-02-22 10:26:04
      破紀錄!廣州白云機場單日旅客量超28萬創歷史新高

      破紀錄!廣州白云機場單日旅客量超28萬創歷史新高

      21世紀經濟報道
      2026-02-23 15:02:34
      2026-02-23 18:24:49
      科技旋渦 incentive-icons
      科技旋渦
      元宇宙資訊
      1094文章數 34關注度
      往期回顧 全部

      科技要聞

      騰訊字節,“火拼”漫劇

      頭條要聞

      德國總理默茨將訪華

      頭條要聞

      德國總理默茨將訪華

      體育要聞

      哈登版騎士首?。豪做墓谲娬n

      娛樂要聞

      谷愛凌奶奶去世,谷愛凌淚奔

      財經要聞

      美國海關將停止征收被裁定違法的關稅

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      親子
      教育
      家居
      旅游
      數碼

      親子要聞

      印第安納預報可能有龍卷風,提前去超市屯點物資,這一車得多少錢

      教育要聞

      陳丹青女兒徹底西化,他對西式教育做出反思

      家居要聞

      本真棲居 愛暖伴流年

      旅游要聞

      返程前必沖!故宮初六熱度拉滿,每一處都藏著千年韻味

      數碼要聞

      春晚同款掃地機追覓X60 Pro,看見全球智能清潔的“中國答案”

      無障礙瀏覽 進入關懷版