![]()
生成式人工智能系統(tǒng)能夠?qū)崿F(xiàn)真正的創(chuàng)造力嗎?由蒙特利爾大學(xué)心理學(xué)系的卡里姆·杰爾比教授領(lǐng)導(dǎo)的一項(xiàng)大型新研究,旨在解答這個(gè)問題。研究團(tuán)隊(duì)還包括蒙特利爾大學(xué)的人工智能先驅(qū)、教授約書亞·本吉奧。他們共同進(jìn)行了迄今為止最廣泛的人類創(chuàng)造力與大型語言模型創(chuàng)造能力的比較。
這些發(fā)表在《科學(xué)報(bào)告》上的發(fā)現(xiàn),顯示出一個(gè)重大轉(zhuǎn)變。生成式人工智能系統(tǒng)現(xiàn)在已經(jīng)達(dá)到了某些創(chuàng)造力指標(biāo)上能夠超越普通人類的水平。與此同時(shí),研究明確指出,最具創(chuàng)造力的人仍能超越最強(qiáng)AI模型的性能。
人工智能達(dá)到了人類平均創(chuàng)造力水平
研究人員評(píng)估了多個(gè)主要大型語言模型,包括ChatGPT、Claude、Gemini等,并將結(jié)果與10萬名人類參與者的數(shù)據(jù)進(jìn)行了比較。這一結(jié)果標(biāo)志著一個(gè)明確的轉(zhuǎn)折點(diǎn)。包括GPT-4在內(nèi)的一些人工智能系統(tǒng)在測量發(fā)散性語言創(chuàng)造力的任務(wù)中得分高于普通人類。
團(tuán)隊(duì)的研究表明,基于大型語言模型的一些人工智能系統(tǒng)現(xiàn)在可以在明確定義的任務(wù)中表現(xiàn)優(yōu)于普通人類的創(chuàng)造力。這一結(jié)果可能令人驚訝——甚至令人不安。但他們的研究也凸顯了一個(gè)同樣重要的觀點(diǎn):即使是最好的人工智能系統(tǒng),也未能達(dá)到最有創(chuàng)造力的人類水平。雖然一些AI模型現(xiàn)在表現(xiàn)優(yōu)于普通人,但最高層次的創(chuàng)造力人類依然是獨(dú)一無二。
研究人員更仔細(xì)地觀察時(shí)發(fā)現(xiàn),最具創(chuàng)造力的一半人類參與者的平均得分高于所有測試過的人工智能系統(tǒng)。在最有創(chuàng)造力的前10%人群中,這種差異更為明顯。
人類與人工智能如何衡量創(chuàng)造力
為了公平地比較人與機(jī)器,研究團(tuán)隊(duì)采用了多種方法。主要工具是發(fā)散聯(lián)想任務(wù)(DAT),這是一項(xiàng)心理測試,旨在測量發(fā)散性創(chuàng)造力,即從單一提示中產(chǎn)生多原創(chuàng)且多樣想法的能力。
該DAT由研究合著者Jay Olson創(chuàng)建,要求參與者(無論是人類還是人工智能)生成十個(gè)詞,這些詞語的含義盡可能不同。一個(gè)高度創(chuàng)意的回應(yīng)可能會(huì)包括諸如“銀河系、叉形、自由、藻類、口琴、量子、懷舊、天鵝絨、颶風(fēng)、光合作用”這樣的詞匯。
人類在該任務(wù)中的表現(xiàn)與其他用于創(chuàng)意生成、寫作和創(chuàng)造性問題解決的成熟創(chuàng)造力測試結(jié)果非常相似。雖然該任務(wù)基于語言,但不僅僅是測試詞匯量。相反,它觸及了創(chuàng)造性思維中涉及的更廣泛認(rèn)知過程,跨越多個(gè)領(lǐng)域。DAT的另一個(gè)優(yōu)勢是速度快且易于獲取,完成只需兩到四分鐘,且面向公眾在線訪問。
從簡單的文字測試到創(chuàng)意寫作
基于這些結(jié)果,研究人員考察了人工智能在這一基本詞聯(lián)想任務(wù)上的表現(xiàn)是否能轉(zhuǎn)化為更復(fù)雜的創(chuàng)造性活動(dòng)。為了測試這一點(diǎn),他們直接比較了人工智能系統(tǒng)與人類參與者在創(chuàng)意寫作任務(wù)中的表現(xiàn)。
這些包括寫俳句(一種三行短詩體)、制作電影劇情摘要以及創(chuàng)作短篇故事。同樣,這種模式顯而易見。雖然人工智能有時(shí)表現(xiàn)優(yōu)于普通人類參與者,但最有技能的人類創(chuàng)作者依然展現(xiàn)出明顯優(yōu)勢。
人工智能的創(chuàng)造力可以被調(diào)整嗎?
這些發(fā)現(xiàn)引發(fā)了一個(gè)重要的后續(xù)問題。人工智能的創(chuàng)造力可以被塑造或控制嗎?根據(jù)研究,確實(shí)可以。一個(gè)關(guān)鍵因素是模型的溫度,這是一種技術(shù)設(shè)置,影響了AI反應(yīng)的可預(yù)測性和冒險(xiǎn)性。
在較低溫度設(shè)置下,AI系統(tǒng)往往能產(chǎn)生更安全、更可預(yù)測的輸出。在較高溫度下,反應(yīng)變得更加多樣且不受限制,鼓勵(lì)冒險(xiǎn)和更具原創(chuàng)性的聯(lián)想。
研究人員還發(fā)現(xiàn),提示的寫作方式起著重要作用。例如,鼓勵(lì)A(yù)I模型利用詞源學(xué)考慮詞源和結(jié)構(gòu)的指令,會(huì)帶來更多意想不到的想法和更高的創(chuàng)造力分?jǐn)?shù)。這些結(jié)果共同表明,人工智能創(chuàng)造力高度依賴人類輸入和指導(dǎo),使人與機(jī)器的互動(dòng)成為創(chuàng)造過程的核心部分。
人工智能會(huì)取代人類創(chuàng)造者嗎?
該研究為人們對人工智能可能取代創(chuàng)意專業(yè)人士的擔(dān)憂提供了平衡的視角。雖然一些人工智能系統(tǒng)現(xiàn)在可以在特定任務(wù)上與人類的創(chuàng)造力媲美,但研究也凸顯了其明顯局限性以及人類創(chuàng)造力持續(xù)的重要性。
盡管人工智能現(xiàn)在可以在某些測試中達(dá)到人類水平的創(chuàng)造力,但我們需要超越這種誤導(dǎo)性的競爭感。生成式人工智能首先已成為服務(wù)于人類創(chuàng)造力的極其強(qiáng)大的工具:它不會(huì)取代創(chuàng)作者,而是深刻改變他們想象、探索和創(chuàng)作的方式——為那些選擇使用它的人服務(wù)。
這些發(fā)現(xiàn)并沒有預(yù)測創(chuàng)意職業(yè)的終結(jié),而是鼓勵(lì)人們以新的方式思考人工智能。這項(xiàng)技術(shù)可以作為創(chuàng)意助手,拓展探索和靈感的可能性。創(chuàng)造力的未來可能不再依賴于人類對抗機(jī)器,而更多依賴于新型協(xié)作形式,其中人工智能支持并增強(qiáng)人類的想象力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.