<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      NHB重磅研究:人類和大語言模型,誰的創(chuàng)造力更強?

      0
      分享至

      PsyBrain 腦心前沿 | 公眾號 PSY-Brain_Frontier

      一鍵關注,點亮星標 ??

      不錯過每日前沿資訊

      認知神經科學前沿文獻分享


      基本信息

      Title:A large-scale comparison of divergent creativity in humans and large language models

      發(fā)表時間:2025.12.23

      發(fā)表期刊:Nature Human Behaviour

      影響因子:16.0

      獲取原文:

      1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



      研究背景

      從愛因斯坦重構時空概念,到嬰兒將熟悉的物體重新組合,創(chuàng)造力一直是人類智慧皇冠上的明珠,也是推動科學、商業(yè)和藝術進步的根本動力。隨著人工智能(AI)和自然語言處理(NLP)技術的飛速發(fā)展,特別是生成式預訓練變換器(GPT)等大語言模型(LLM)的出現,我們似乎站在了一個新的歷史轉折點:機器是否已經具備了媲美甚至超越人類的創(chuàng)造力?


      目前的初步研究顯示,LLM在某些創(chuàng)造力測試(如替代用途任務,AUT)中似乎能與人類平分秋色,甚至略勝一籌。然而,這些結論往往依賴于人類評分員的主觀判斷,且難以在大規(guī)模樣本上復現。更重要的是,我們尚不清楚LLM的“創(chuàng)造力”究竟是源于對語義的深刻理解,還是僅僅依賴于概率性的詞匯拼接

      當前領域亟待解決的一個核心爭議在于:LLM生成的“新穎性”是否具有真正的分布多樣性?為了回答這一問題,本研究跳出了傳統的小樣本、主觀評分范式,利用發(fā)散聯想任務(Divergent Association Task, DAT),對近1萬名人類被試和包含GPT-4、Claude 3、DeepSeek-R1在內的9種主流LLM(共計超過21萬次觀測)進行了前所未有的大規(guī)模比較。這不僅是一場人機算力的較量,更是一次對創(chuàng)造力本質的深度認知科學探索。


      研究核心總結

      本研究 2025年12月23日 發(fā)表于Nature Human Behaviour,通過嚴謹的計算模型和大規(guī)模數據分析,揭示了人類與LLM在發(fā)散性創(chuàng)造力上的本質差異。


      Fig. 1 | Comparison of the divergent creativity scores between humans and LLMs.

      核心發(fā)現一:均值相似,但人類在“極端卓越性”上完勝

      研究結果顯示,在整體平均分上,人類(Mean=78.26)略高于LLM(Mean=77.90),差異雖有統計學意義但效應量較小。然而,真正的差異體現在分布形態(tài)上(Second-order statistics):人類表現出的方差(Variance)顯著高于LLM。這意味著LLM的輸出高度趨同,表現出一種“平庸的穩(wěn)定性”;而人類數據的分布則具有極長的右尾(Right-hand tail)。頂尖的人類被試(Top 10%)在創(chuàng)造力得分上顯著碾壓了包括GPT-4 Turbo在內的所有頂級模型。這一結果有力地反駁了“AI已全面超越人類創(chuàng)造力”的論調,表明在極具挑戰(zhàn)性的高水平創(chuàng)造力任務中,人類的認知優(yōu)勢依然不可撼動。


      Fig. 2 | Comparison of divergent creativity scores across different temperature values for LLMs.

      核心發(fā)現二:LLM的語義同質性與詞匯循環(huán)

      通過詞袋模型(Bag of Words)分析,研究者發(fā)現LLM雖然生成的有效詞匯量更多,但其唯一詞(Unique words)的比例顯著低于人類。LLM傾向于在不同的對話中重復使用相同的詞匯組合(例如反復生成“蘋果、云、椅子”的不同排列),顯示出其缺乏真正的詞匯多樣性。相比之下,人類基于豐富的生活經驗和情感體驗,能夠調動更廣泛的語義網絡,產生更具異質性的聯想。


      Fig. 3 | Comparison of divergent creativity scores across different perspective prompts for LLMs.

      核心發(fā)現三:提示工程(Prompt Engineering)的局限與反直覺效應

      研究進一步探索了提升LLM表現的邊界條件

      1. 溫度參數(Temperature):提高模型的隨機性參數(Temperature > 0.5)雖然能提升DAT得分,但會導致輸出質量急劇下降,出現大量無意義的亂碼或不存在的詞匯(Garbled responses)。這說明LLM所謂的“高創(chuàng)造力”在極端參數下往往是以犧牲語義連貫性為代價的統計噪聲。

      2. 角色扮演失效:當要求LLM扮演具有高創(chuàng)造力的歷史人物(如“像愛因斯坦一樣思考”)時,其表現反而不如基線水平。

      3. 人口學模擬偏差:當要求LLM模擬不同年齡或性別的人群時,其表現未能復現人類真實的人口學差異模式,甚至呈現出相反的趨勢 。


      Fig. 4 | Comparison of divergent creativity scores across different celebrity prompts for LLMs.

      關鍵意義與理論貢獻

      本研究不僅確立了人類在頂尖創(chuàng)造力(Expert-level creativity)上的獨特優(yōu)勢,還揭示了LLM作為“輔助工具”的最佳定位:LLM能夠有效提升創(chuàng)造力的基線水平(Floor-raiser),適合處理常規(guī)性的發(fā)散任務;但在需要深度語義理解和突破性思維的領域,人類的直覺與經驗仍不可替代。未來的認知神經科學研究應關注這種“人機協作”模式下的認知負荷分配,即如何利用LLM的系統性探索能力來增強人類的直覺創(chuàng)造力。


      Fig. 5 | Comparison of divergent creativity scores across different demographic prompts for LLMs.


      Abstract

      Human–machine partnerships are increasingly used to address grand societal challenges, yet knowledge of the comparative strengths of humans and machines to innovate is nascent. Here we compare the ability of humans (N?=?9,198) and large language models (LLMs, N?=?215,542 observations) to generate novel ideas in an established creativity task. We present three key results. First, human creativity on average is slightly higher than that of LLMs. Second, creativity differences are pronounced at the extremes of the distribution, with humans exhibiting greater variability and higher levels of creativity in the right-hand tail of the distribution. Third, attempts to increase the creativity of LLMs through instructing LLMs to take on genius personas or different demographic roles lifted performance up to a threshold beyond which the output became opposite real-life patterns, whereas strategic prompt-engineering efforts yielded mixed to negative results. We discuss the implications of our findings for human–machine collaboration and problem solving.


      請打分

      這篇剛剛登上Nature Human Behaviour的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區(qū)分享您的深度見解。

      前沿交流|歡迎加入認知神經科學前沿交流群!


      核心圖表、方法細節(jié)、統計結果與討論見原文及其拓展數據。

      分享人:飯哥

      審核:PsyBrain 腦心前沿編輯部

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      后人哀之而不鑒之——寫在摩爾線程4000億市值之時

      后人哀之而不鑒之——寫在摩爾線程4000億市值之時

      債市邦
      2025-12-11 12:13:14
      俄羅斯“戰(zhàn)神”斯特列爾科夫不想再踩縫紉機,提交“最后的子彈”

      俄羅斯“戰(zhàn)神”斯特列爾科夫不想再踩縫紉機,提交“最后的子彈”

      暮色史觀
      2026-01-25 01:44:26
      預言成真?再對日本大動脈下死手,高市最不希望的事已發(fā)生

      預言成真?再對日本大動脈下死手,高市最不希望的事已發(fā)生

      谷盟a
      2026-01-24 15:24:56
      炸鍋!馬斯克當眾自曝:我就是外星人!9000顆衛(wèi)星佐證,真相曝光

      炸鍋!馬斯克當眾自曝:我就是外星人!9000顆衛(wèi)星佐證,真相曝光

      丁丁鯉史紀
      2026-01-23 16:30:04
      特朗普暴跳如雷,短短兩天他領教了:歐俄的精明、中國的頂級陽謀

      特朗普暴跳如雷,短短兩天他領教了:歐俄的精明、中國的頂級陽謀

      娛樂督察中
      2026-01-24 05:54:28
      消費者投訴稱限量發(fā)售的6.68萬元“一口價”飛度要加價3000元購買,廣汽本田回應:已啟動專項調查

      消費者投訴稱限量發(fā)售的6.68萬元“一口價”飛度要加價3000元購買,廣汽本田回應:已啟動專項調查

      魯中晨報
      2026-01-22 17:23:31
      泡臘八蒜時,最忌直接加醋泡!大廚:牢記3要3不要,大蒜1天變綠

      泡臘八蒜時,最忌直接加醋泡!大廚:牢記3要3不要,大蒜1天變綠

      阿龍美食記
      2026-01-23 14:20:06
      最新任命!江蘇海洋大學黨委書記許峰轉任省教育廳副廳長(正廳級)!曾任河海大學黨委常委、副校長

      最新任命!江蘇海洋大學黨委書記許峰轉任省教育廳副廳長(正廳級)!曾任河海大學黨委常委、副校長

      海洋知圈
      2026-01-24 21:30:01
      大坂直美退賽引外界猜測,媒體稱其對上輪爭議帶來的網暴不堪其擾

      大坂直美退賽引外界猜測,媒體稱其對上輪爭議帶來的網暴不堪其擾

      網球之家
      2026-01-24 22:50:58
      在閑魚上買東西能有多離譜?網友:這哪是閑魚,這簡直是黑市

      在閑魚上買東西能有多離譜?網友:這哪是閑魚,這簡直是黑市

      夜深愛雜談
      2026-01-24 20:08:48
      你們可能被特朗普騙了,特朗普有可能真的是美國最偉大的總統

      你們可能被特朗普騙了,特朗普有可能真的是美國最偉大的總統

      流蘇晚晴
      2026-01-10 16:24:45
      玩命!曾凡博腰傷沒好吃止疼藥強撐比賽,砍20分難阻失利太絕望

      玩命!曾凡博腰傷沒好吃止疼藥強撐比賽,砍20分難阻失利太絕望

      林小湜體育頻道
      2026-01-25 02:20:39
      學費暴跌15萬,招生難了?

      學費暴跌15萬,招生難了?

      中國新聞周刊
      2026-01-23 07:28:04
      炸裂!中糧集團春招公告,學歷從大專起步,外語水平居然不設限…

      炸裂!中糧集團春招公告,學歷從大專起步,外語水平居然不設限…

      火山詩話
      2026-01-22 10:40:46
      云南省公安廳情報指揮中心合成作戰(zhàn)支隊支隊長袁滿榮接受紀律審查和監(jiān)察調查

      云南省公安廳情報指揮中心合成作戰(zhàn)支隊支隊長袁滿榮接受紀律審查和監(jiān)察調查

      昆明信息港
      2026-01-24 14:55:58
      公司裁員能多隨便?網友:西安一家電纜公司才是裁員天花板

      公司裁員能多隨便?網友:西安一家電纜公司才是裁員天花板

      帶你感受人間冷暖
      2026-01-25 00:05:08
      國外留子的生活有多炸裂?網友:給我這個農村人看笑了

      國外留子的生活有多炸裂?網友:給我這個農村人看笑了

      帶你感受人間冷暖
      2026-01-25 00:20:06
      這下不吹了,俄烏兩軍連續(xù)大戰(zhàn),打破一個又一個“無敵”武器神話

      這下不吹了,俄烏兩軍連續(xù)大戰(zhàn),打破一個又一個“無敵”武器神話

      策略述
      2025-11-12 18:42:46
      方媛三胎后回安徽老家,穿小香外套披長大衣很霸氣,小臉高級耐看

      方媛三胎后回安徽老家,穿小香外套披長大衣很霸氣,小臉高級耐看

      鋒哥與八卦哥
      2026-01-21 12:31:49
      馬斯克最新震撼發(fā)言:人類終有一天將找到逆轉衰老之法

      馬斯克最新震撼發(fā)言:人類終有一天將找到逆轉衰老之法

      閃電新聞
      2026-01-24 08:51:22
      2026-01-25 02:59:00
      PsyBrain腦心前沿
      PsyBrain腦心前沿
      追蹤腦科學新動態(tài),聚焦認知與神經新研究
      129文章數 10關注度
      往期回顧 全部

      科技要聞

      黃仁勛現身上海菜市場

      頭條要聞

      張又俠、劉振立被查 解放軍報發(fā)布社論

      頭條要聞

      張又俠、劉振立被查 解放軍報發(fā)布社論

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      回歸還是頂流 鳳凰傳奇將現身馬年春晚

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態(tài)度原創(chuàng)

      家居
      旅游
      數碼
      手機
      公開課

      家居要聞

      在家度假 160平南洋混搭宅

      旅游要聞

      2026重慶園博園大型水上燈會沖刺布展,新春光影盛宴即將啟幕!

      數碼要聞

      UnifyDrive UC250/450 Pro家庭存儲NAS發(fā)布,配置與價格曝光

      手機要聞

      追覓首款手機狂攬億元訂單:自研芯片+模塊化影像,硬剛華為小米

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 老司机午夜免费精品视频| 精品久久久中文字幕一区| 亚洲国产日韩视频观看| 狠狠色狠狠色综合| 亚洲1234区| 欧美成人17| 婷婷丁香五月深爱憿情网| 色在线网站免费观看| 性人久久久久| 井研县| 国产成人精品免费视频大全| 成人伊人网| 遵义市| 久久夜色撩人精品国产小说| 欧美A片在线观看| 日本少妇| 国产精品无码免费播放| 无遮挡1000部拍拍拍免费| 乱码午夜-极品国产内射| 2022Av天堂在线无码| 人人爽人人爽人人片av| 亚洲av综合色一区二区| √天堂资源地址在线官网| 苍井空亚洲精品AA片在线播放| 国产又爽又黄又刺激的视频| 一本加勒比HEZYO黑人| 国产大屁股视频免费区| 欧美日本精品一本二本三区| 国产成人午夜精品福利| 欧美国产日韩久久mv| 国产999视频| 亚洲成av人片在www鸭子| 日韩乱码人妻无码中文字幕| 老司机午夜精品99久久免费| 亚洲色婷婷| 亚洲一卡二卡| 制服丝袜人妻中出第一页| 欧美freesex黑人又粗又大| 久久亚洲色www成人| 亚洲成a人片77777kkkk| 喀喇|