<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      牛津大學教你AI也能懂美丑:讓機器學會"看出"照片的情感溫度

      0
      分享至


      這項由牛津大學陳藝銘、韓俊林等研究者領導的研究發表于2025年11月的arXiv預印本,論文編號為2511.22805v1。研究團隊還包括來自香港科技大學、倫敦大學學院和紐約大學的學者。有興趣深入了解的讀者可以通過該論文編號查詢完整研究內容。

      當我們看到一張照片時,會自然而然地產生各種感受——這張風景照很美、那張搞笑圖片讓人發笑、某張照片看起來很悲傷,或者有些畫面特別難忘。但對于人工智能來說,這些看似簡單的感知能力卻是一個巨大的挑戰。就像一個天生色盲的人很難理解紅色和綠色的區別,現有的AI視覺模型雖然能準確識別照片中的物體和場景,卻無法真正"感受"圖像所傳達的情感和美感。

      想象一下,如果你的朋友只能告訴你"這張照片里有一只貓坐在沙發上",卻永遠無法理解為什么這張照片讓你覺得溫馨可愛,那種交流會多么局限。這正是當前多模態大語言模型面臨的困境——它們就像一個只會客觀描述卻沒有情感共鳴的觀察者。

      研究團隊決定改變這種狀況。他們發現,要讓AI真正理解人類的視覺認知,就必須教會它四個關鍵的"情感維度":美感認知(能判斷什么是美的)、幽默感知(知道什么是好笑的)、情感識別(理解照片傳達的情緒)以及記憶深度(判斷什么樣的圖像更容易被記住)。這就像教一個孩子欣賞藝術作品一樣,不僅要告訴他畫面內容,更要培養他對美、對情感、對印象深刻事物的敏感度。

      為了解決這個問題,研究團隊做了兩件開創性的工作。首先,他們建立了一個叫做CogIP-Bench的測試標準,這就像給AI設計了一套"情商考試",專門測試機器是否能像人類一樣感知圖像的主觀特質。接著,他們開發了一套訓練方法,通過大量的圖像和人類評分數據,教會AI模型更好地理解這些微妙的情感特征。

      更令人驚喜的是,經過這種"情感教育"的AI不僅能更準確地評判圖像的美感和情感,還能反過來指導圖像生成,創造出更符合人類審美和情感需求的圖片。這就像一個學會了藝術欣賞的學生,不僅能評價別人的作品,還能創作出更打動人心的藝術品。

      一、當前AI的"情感盲區"——看得見卻感受不到

      在我們的日常生活中,觀看照片絕不僅僅是識別其中的物體那么簡單。當你翻閱手機相冊時,某張夕陽下的風景照可能讓你感到寧靜美好,一張朋友聚會的照片讓你忍俊不禁,而另一張雨中街景可能喚起你內心深處的憂郁情緒。這些情感反應是人類視覺體驗中最珍貴的部分,它們讓觀看圖像成為一種豐富的心理體驗。

      然而,當前最先進的多模態大語言模型——那些能夠同時處理文字和圖像的AI系統——在這方面表現得就像情感上的"色盲患者"。它們能夠準確地告訴你照片中有什么:一座橋、幾只鳥、一個微笑的女孩,甚至能詳細描述天空的顏色和建筑的風格。但當你問它們這張照片美不美、有趣不有趣,或者是否讓人印象深刻時,它們的回答往往與人類的感受相去甚遠。

      牛津大學的研究團隊通過大規模實驗發現了這個問題的嚴重程度。他們測試了包括GPT-4、Gemini等知名AI模型,發現幾乎所有模型在判斷圖像記憶度方面的表現接近于零,這意味著它們對"什么樣的圖像更容易被人記住"這個問題幾乎沒有任何理解。在美感、幽默感和情感識別方面,這些模型與人類判斷的相關性也普遍低于0.5,這個數字意味著它們的判斷與隨機猜測相差無幾。

      這種"情感盲區"的存在并非偶然。現有的AI模型主要基于客觀的描述性數據進行訓練,就像一個只學過詞典卻從未讀過詩歌的學生,雖然能準確理解每個詞匯的字面含義,卻無法體會語言的韻味和情感。這些模型被設計來回答"圖像中有什么"這類客觀問題,而非"這張圖像給人什么感受"這類主觀問題。

      更深層的問題在于,美感、幽默、情感和記憶度這些特質本身就具有高度的主觀性和文化相關性。一張在某種文化背景下被認為美麗的圖像,在另一種文化中可能被視為平凡。一個讓成年人會心一笑的視覺笑話,對兒童來說可能毫無意義。這種復雜性要求AI系統不僅要處理視覺信息,還要理解人類認知和情感的微妙之處。

      研究團隊意識到,如果不解決這個根本問題,AI就永遠無法真正理解人類的視覺體驗,也就無法在創意設計、藝術創作、情感計算等需要深度人機交互的領域發揮真正的價值。這就像試圖讓一個從未體驗過音樂之美的機器來作曲一樣,技術上可能可行,但作品必然缺乏感動人心的力量。

      二、四個維度構建"情感羅盤"——教AI學會感受

      為了讓AI獲得類似人類的視覺情感認知能力,研究團隊精心選擇了四個核心維度來構建他們的"情感羅盤"。每一個維度都代表了人類觀看圖像時的一種重要感受,這些感受共同構成了我們對視覺世界的完整理解。

      美感認知這個維度關注的是圖像的視覺吸引力和藝術價值。就像品鑒一杯好酒時我們會關注其色澤、香氣和口感的和諧統一,美感認知要求AI學會欣賞圖像中的色彩搭配、構圖平衡和整體視覺效果。研究團隊使用了專門的美學數據集,其中包含了大量經過人類評估的圖像以及它們的美感評分。這些評分基于廣泛的人群調查,反映了普遍的審美偏好。通過學習這些數據,AI開始理解什么樣的日落更加壯麗,什么樣的建筑攝影更具視覺沖擊力,什么樣的人像攝影更能展現主體的美感。

      幽默感知這個維度可能是最具挑戰性的,因為幽默往往涉及意外性、反差和文化內涵的復雜交織。當我們看到一張貓咪做出人類姿勢的照片時會發笑,這種反應源于對常規期待的打破。研究團隊使用了專門的幽默圖像數據庫,其中包含了各種類型的視覺幽默:從簡單的動物搞笑照片到復雜的視覺雙關,從意外的場景組合到夸張的表情捕捉。通過學習這些案例,AI開始掌握什么樣的視覺元素能夠觸發人類的笑點,以及不同類型的幽默如何產生不同程度的趣味效果。

      情感識別維度專注于圖像所傳達的情緒色彩。一張雨天街頭的照片可能傳達憂郁,一張孩子們奔跑的照片可能充滿歡樂,一張空曠教堂內部的照片可能營造出莊嚴肅穆的氛圍。這種情感識別超越了簡單的面部表情識別,而是要求AI理解整個視覺場景所營造的情感氛圍。研究團隊通過大量標注了情感價值的圖像數據訓練模型,讓它學會識別從強烈負面到強烈正面的各種情感層次,以及介于兩者之間的中性狀態。

      記憶度評估這個維度探索的是什么樣的圖像更容易在觀看后被長期記住。心理學研究表明,包含人臉、動物、鮮明顏色對比或者獨特場景的圖像通常具有更高的記憶度,而普通的自然風景或建筑照片則相對容易被遺忘。這種記憶度的差異反映了人類大腦處理和存儲視覺信息的內在機制。通過學習大規模的記憶度實驗數據,AI開始理解什么樣的視覺特征能夠在人類的記憶中留下更深的印象。

      為了確保訓練數據的質量和代表性,研究團隊對每個維度都采用了平衡采樣的策略。他們將評分范圍分為幾個等級,并在每個等級中均勻采樣相同數量的圖像。這就像在調配顏料時確保每種色調都有足夠的代表性,避免某種極端情況主導整個學習過程。同時,他們還精心設計了專門的提示語,幫助AI理解每個維度的具體含義和評判標準。

      這四個維度的結合創造了一個完整的"情感坐標系",讓AI能夠從多個角度理解圖像的主觀特質。就像人類在欣賞一幅畫作時會同時考慮其美感、趣味性、情感表達和印象深度一樣,經過訓練的AI也開始具備了這種多維度的感知能力。

      三、CogIP-Bench:給AI設計的"情商測試"

      為了準確評估AI在圖像情感認知方面的能力,研究團隊開發了CogIP-Bench這個綜合性測試平臺。這就像為AI設計了一套專門的"情商測試",用來衡量機器對圖像主觀特質的理解程度。與傳統的AI評測主要關注客觀任務(如物體識別準確率)不同,CogIP-Bench專門測試那些需要主觀判斷和情感理解的能力。

      這個測試平臺的設計理念類似于心理學中的標準化測試。每個測試項目都包含一張精心選擇的圖像、一個清晰的詢問指令,以及通過人類評估得出的標準答案。就像智商測試中的每道題目都有其特定的認知要求,CogIP-Bench中的每張圖像都代表了某種特定的情感認知挑戰。

      測試的過程設計得既嚴謹又簡潔。AI模型會看到一張圖像,然后被要求對該圖像在特定維度上給出評分。比如,當測試美感認知時,AI需要判斷這張照片的視覺吸引力如何,并給出0到10分的評分。這種評分方式模擬了人類的直覺判斷過程,因為我們在日常生活中也經常會對看到的圖像產生類似的主觀評價。

      為了確保測試的公平性和準確性,每個認知維度的測試都包含120個測試樣本和800個訓練樣本。這個樣本量經過精心計算,既能提供足夠的統計顯著性,又不會因為數據過多而導致評估過程過于復雜。測試圖像的選擇涵蓋了各種不同的內容類型、風格特征和情感表達,確保評估結果能夠反映AI在各種情況下的表現。

      評估指標的選擇也體現了研究團隊的細致考慮。他們不僅使用了均方誤差和平均絕對誤差來衡量預測的準確性,更重要的是采用了斯皮爾曼相關系數來評估AI判斷與人類判斷之間的一致性。這個指標特別重要,因為在主觀評價中,絕對的數值準確性不如趨勢一致性重要。就像兩個人對同一批電影的評分可能都偏高或偏低,但只要他們對電影相對質量的排序一致,就說明他們的品味是相通的。

      當研究團隊用CogIP-Bench測試了十多個主流AI模型時,結果令人深思。幾乎所有模型在記憶度評估上的表現都接近隨機水平,斯皮爾曼相關系數接近零。這意味著這些先進的AI系統對于"什么樣的圖像更容易被人記住"這個問題幾乎沒有任何理解。在其他三個維度上,表現最好的模型也只能達到0.5左右的相關性,這個數字表明AI的判斷與人類感知之間存在顯著差距。

      有趣的是,不同類型的AI模型在各個維度上表現出了不同的特點。開源模型在美感和情感識別方面相對較強,而API接口的商業模型在幽默感知方面表現更好。這種差異可能反映了不同訓練策略和數據來源的影響。同時,研究團隊還發現,在傳統AI任務上表現優秀的模型(如Qwen系列和Gemma系列)在情感認知測試中也相對表現較好,這暗示著通用AI能力與情感認知能力之間存在某種正相關關系。

      CogIP-Bench的另一個重要價值在于它為AI情感認知能力的提升提供了明確的目標和測量標準。就像體能測試告訴運動員在哪些方面需要加強訓練一樣,這個測試平臺明確指出了當前AI系統的薄弱環節,為后續的改進工作提供了方向。

      四、"情感教育"的訓練方法——讓機器學會品味

      發現了AI在情感認知方面的不足后,研究團隊開始探索如何給機器進行"情感教育"。這個過程就像教一個天生缺乏藝術感的學生學會欣賞美術作品,需要耐心、系統的指導和大量的練習。

      訓練過程的核心是監督微調技術,但研究團隊在傳統方法的基礎上進行了精巧的改進。他們面臨的第一個挑戰是,AI模型天生就對數字不敏感。對于語言模型來說,數字"7.5"和"8.5"在處理時被視為完全不同的符號,就像單詞"貓"和"狗"一樣。這就導致了一個問題:當要求AI預測一張圖片的美感評分為7.8分時,如果它預測成7.9分,從人類感知角度來說這是非常接近的,但在傳統的訓練方法中,這兩個答案被視為完全不同的錯誤答案。

      為了解決這個數字敏感性問題,研究團隊采用了兩個巧妙的策略。首先,他們設計了"先分類再評分"的兩步法。AI模型首先需要給出一個定性的評價,比如"非常美"、"一般美"或"不夠美",然后基于這個分類給出具體的數字評分。這種方法讓模型先建立起對美感的概念性理解,再將這種理解轉化為具體的數值。就像一個初學畫畫的人先要學會區分"好看"和"不好看",然后才能進行更細致的品評。

      其次,他們引入了"軟標簽"技術來改進訓練過程。傳統的訓練方法只認為唯一的正確答案,而軟標簽技術承認答案之間存在相近性。如果正確答案是7.8分,那么7.7分和7.9分就被視為"接近正確"的答案,而6.8分或8.8分則被認為是"較遠"的答案。這種方法讓AI能夠理解數字之間的距離關系,從而產生更加合理的預測。

      訓練數據的設計也體現了研究團隊的細心考慮。他們為每個認知維度準備了800個訓練樣本,這些樣本均勻分布在評分區間的各個段落中,確保AI能夠學習到從極低到極高的各種情感水平。同時,他們精心設計了專門的提示語,幫助AI理解每個認知維度的具體含義。這些提示語就像是給學生的詳細作業說明,清楚地告訴AI應該關注圖像的哪些方面,以及如何進行評分。

      為了避免過度擬合和保持模型的通用性,研究團隊選擇了LoRA(低秩適應)技術而不是全參數微調。這種方法類似于給一個已經受過良好教育的學生補習特定科目,而不是從頭開始重新教育。它能夠在保持模型原有能力的基礎上,增加新的情感認知技能。

      訓練過程中的一個重要發現是,視覺編碼器比語言模型在情感認知學習中發揮了更重要的作用。當研究團隊分別凍結視覺部分和語言部分進行對比實驗時,發現凍結視覺部分的效果明顯更差。這表明情感認知能力主要依賴于對視覺信息的深度理解,而不僅僅是語言層面的處理。這個發現有點像發現音樂欣賞能力主要依賴于聽覺敏感度而不是理論知識。

      研究團隊還探索了強化學習方法來進一步提升訓練效果。他們使用了群體相對策略優化技術,基于預測評分與真實評分之間的接近程度來設計獎勵信號。這種方法類似于根據學生答題的準確性來給予不同程度的鼓勵,幫助AI逐步改善其判斷能力。雖然這種方法在某些維度上顯示出了改進潛力,但也帶來了在其他通用任務上的一定性能下降,體現了AI訓練中常見的權衡問題。

      經過這種系統化的"情感教育",AI模型開始表現出明顯的改進。在CogIP-Bench測試中,訓練后的模型在所有四個認知維度上都顯示出了與人類判斷更高的一致性。特別是在美感和情感識別方面,改進效果最為顯著。這種提升不僅體現在測試分數上,更重要的是體現在AI對圖像的理解變得更加細膩和人性化。

      五、實戰應用——情感認知能力的創意釋放

      經過"情感教育"訓練的AI模型并不滿足于僅僅成為一個優秀的圖像評判者,研究團隊進一步探索了這種新獲得的認知能力如何在實際應用中發揮作用。他們發現,當這些具備情感認知能力的AI被整合到圖像生成系統中時,產生了令人驚喜的效果。

      為了驗證訓練效果在創意應用中的價值,研究團隊選擇了Qwen-Image這個先進的圖像生成系統作為測試平臺。這個系統本身就使用Qwen2.5-VL-7B-Instruct作為核心的多模態語言模型來理解和處理用戶的指令。當研究團隊將經過情感認知訓練的模型替換原有的模型后,整個圖像生成系統的表現發生了顯著變化。

      測試過程設計得既全面又公平。研究團隊準備了五組不同類型的生成指令:專門測試美感生成能力的提示詞、考驗幽默創意的指令、要求表達特定情感的描述、挑戰記憶度的場景,以及用于對比的一般性生成任務。每組包含100個精心設計的提示詞,這些提示詞由ChatGPT-5生成,確保了指令的多樣性和代表性。

      為了確保比較的客觀性,研究團隊在生成過程中使用了相同的隨機種子,這意味著除了AI模型的認知能力差異外,其他所有條件都保持一致。這就像在相同的畫布上讓兩個藝術家按照相同的主題創作,最終作品的差異完全反映了藝術家本身能力的不同。

      當比較原始模型和訓練后模型生成的圖像時,差異立即變得明顯。在美感方面,訓練后的模型生成的圖像在色彩搭配、構圖平衡和整體視覺效果上都顯示出更高的藝術水準。原本可能顯得平淡或不協調的場景,在新模型的處理下變得更加賞心悅目。在幽默創意方面,訓練后的模型能夠更好地理解并創造出具有視覺趣味的場景,比如通過夸張的對比、意想不到的組合或者巧妙的視覺雙關來產生幽默效果。

      在情感表達方面,改進效果尤其顯著。當指令要求生成"令人憂郁的雨夜場景"時,訓練后的模型能夠更精準地營造出符合這種情感氛圍的視覺元素:恰當的光影對比、合適的色彩基調、能夠觸發相應情感反應的構圖選擇。這種改進使得生成的圖像不僅在技術上準確,更在情感傳達上更加有效。

      為了量化這些改進效果,研究團隊使用了多種評估指標。對于一般性的圖像生成質量,他們采用了ClipScore、人類偏好評分、LAION美學評分和ImageReward評分等廣泛認可的指標。結果顯示,所有指標都出現了提升,其中ImageReward評分的提升幅度達到了22.8%,這個數字表明訓練后的模型在人類評判者眼中產生了顯著的質量改進。

      對于認知特定的圖像生成效果,研究團隊使用專門的認知預測模型進行評估。這些模型專門訓練用來預測圖像在各個認知維度上的得分,代表了該領域的最高水平。結果顯示,訓練后的AI在所有四個認知維度上都實現了改進,特別是在情感維度上提升了19%,這表明新模型確實獲得了更強的情感表達能力。

      研究團隊還進行了一項有趣的用戶研究來驗證這些客觀指標所反映的真實效果。他們從每個認知維度隨機選擇了30對圖像,每對包括原始模型和訓練后模型基于相同提示詞生成的圖像,然后請五名志愿者在不知道哪個是哪個的情況下選擇他們更喜歡的版本。結果顯示,訓練后模型生成的圖像被選擇的頻率比原始模型高出1.7倍,這個比例清楚地表明了改進的實際效果。

      這些實驗結果展示了一個重要的發現:AI的情感認知能力不僅是一種被動的評判技能,更是一種主動的創造力量。當AI真正理解了什么是美、什么是有趣、什么是動人時,它就能夠有意識地創造出具備這些特質的內容。這就像一個學會了音樂欣賞的人不僅能夠評價音樂作品的優劣,還能夠創作出更有感染力的音樂作品。

      這種能力的獲得意味著AI在創意產業中的角色正在發生根本性的轉變。它不再只是一個執行技術指令的工具,而是開始成為具有一定審美判斷和情感理解的創作伙伴。這為廣告設計、藝術創作、情感計算等需要深度理解人類感受的領域開辟了新的可能性。

      六、深度分析——訓練策略的精妙設計

      為了深入理解哪些訓練策略真正起到了關鍵作用,研究團隊進行了詳盡的對比實驗。這些實驗就像廚師在試驗新菜譜時逐一調整每個配料,以找出每種成分對最終效果的具體貢獻。

      第一個重要發現涉及模型組件的相對重要性。當研究團隊分別凍結視覺編碼器和語言模型進行訓練時,結果出人意料。凍結視覺編碼器(只訓練語言部分)的效果明顯劣于凍結語言模型(只訓練視覺部分)的效果。這個發現顛覆了傳統多模態訓練中常見的做法——通常為了穩定性會凍結視覺編碼器。這個結果表明,情感認知能力主要根植于對視覺信息的深層理解,而非單純的語言處理能力。

      這個發現類似于發現音樂欣賞能力主要依賴于聽覺敏感度而非音樂理論知識。一個人可能不懂樂理,但如果聽覺足夠敏銳,依然能夠感受到音樂的美感。同樣,AI的情感認知能力更多地來源于對視覺特征的精細感知,而不是對情感概念的抽象理解。

      軟標簽技術的引入也證明了其重要價值。與傳統的硬標簽訓練相比,軟標簽訓練在所有認知維度上都實現了改進。這種改進特別體現在數值預測的準確性上,模型學會了理解數字之間的相對關系,而不是將每個數字視為孤立的符號。這種細微但重要的改進使得AI的判斷變得更加細膩和合理。

      "先分類再評分"的兩步策略也顯示出了顯著效果。相比于直接要求AI給出數字評分的簡化方法,這種策略幫助模型建立了更穩固的概念基礎。AI首先學會在概念層面理解"美"、"有趣"、"正面情感"等抽象概念,然后再將這些概念轉化為具體的數值判斷。這個過程模擬了人類的認知過程,我們在評價某個事物時往往也是先形成總體印象,再做出具體評判。

      研究團隊還發現,不同的認知維度對訓練策略的敏感程度不同。美感和情感識別相對容易訓練,改進效果也最為顯著。幽默感知的訓練難度適中,但改進穩定。而記憶度預測則最具挑戰性,即使經過訓練,改進幅度仍然有限。這種差異可能反映了這些認知能力本身的復雜程度不同——美感和情感更多依賴于直觀的視覺特征,而記憶度則涉及更復雜的認知機制。

      強化學習方法的探索為未來研究提供了有價值的見解。雖然群體相對策略優化在某些維度上實現了進一步改進,但也帶來了在其他通用任務上的性能下降。這個結果揭示了AI訓練中的一個根本性挑戰:專門化能力的提升往往伴隨著通用性能的某種程度犧牲。這就像一個人專注于發展某項特長時,可能會在其他方面投入較少精力。

      更深層的分析顯示,訓練后的模型不僅在目標任務上表現更好,還在其他多模態任務上保持了穩定的性能。研究團隊在12個涵蓋視覺理解、光學字符識別、通用推理和知識應用的基準測試上驗證了模型的通用能力。結果顯示,經過情感認知訓練的模型在保持原有能力的同時,在某些任務上甚至出現了意外的改進。這表明情感認知能力與通用AI能力之間存在某種正相關關系。

      訓練過程中的另一個重要發現是數據平衡的重要性。通過在每個認知維度的評分區間內均勻采樣,研究團隊確保了AI能夠學習到完整的情感認知光譜。如果訓練數據中某種情感水平的樣本過多,AI就會產生偏見,傾向于給出相似的判斷。這種平衡采樣策略類似于營養均衡的重要性——各種營養素都需要適當攝入才能維持健康。

      這些深入的分析結果為未來的研究提供了清晰的指導。它們揭示了哪些策略是必要的,哪些改進是有效的,以及在什么情況下需要做出權衡。更重要的是,這些發現展示了AI情感認知能力培養的復雜性和系統性,強調了需要多方面協調配合才能實現真正的突破。

      說到底,這項研究最重要的價值在于證明了AI確實可以學會像人類一樣"感受"圖像,而且這種能力不僅僅是理論上的可能,更是具有實際應用價值的技術突破。當AI開始理解美感、幽默、情感和記憶度時,它就不再只是一個冷冰冰的計算工具,而是開始具備了某種形式的"品味"和"感受力"。

      這種進步意味著我們正在接近一個新的AI時代——機器不僅能夠理解我們說什么,還能夠理解我們的感受和偏好。未來,當你要求AI幫你設計一張海報時,它不會只是機械地按照指令放置元素,而是會考慮如何讓這張海報更美觀、更有趣、更有感染力。當你讓AI幫你挑選照片時,它不會只看技術參數,還會理解哪些照片真正觸動了你的心。

      當然,這項研究也提醒我們,AI的情感認知能力雖然在快速發展,但距離完全理解人類的復雜感受還有很長的路要走。美感、幽默、情感這些概念本身就充滿了文化相關性和個體差異性,要讓AI完全掌握這些微妙之處,還需要更多的研究和探索。不過,這項工作已經為我們展示了一個令人興奮的可能性:AI正在從理解世界的"是什么"向理解世界的"感覺如何"邁進,而這種轉變將深刻改變人機交互的方式和AI在創意領域的作用。

      對于關心AI發展的普通人來說,這項研究傳遞了一個重要信息:未來的AI將不僅僅是高效的工具,更可能成為理解我們情感需求的伙伴。雖然我們還不需要擔心AI會完全取代人類的創意工作,但我們確實可以期待一個AI更好地理解和協助人類創意表達的未來。

      Q&A

      Q1:CogIP-Bench測試平臺具體是怎樣評估AI情感認知能力的?

      A:CogIP-Bench通過四個認知維度測試AI:美感認知、幽默感知、情感識別和記憶度評估。每個維度包含120個測試樣本,AI需要看圖像并給出0-10分的評分,然后通過斯皮爾曼相關系數等指標衡量AI判斷與人類判斷的一致性。測試發現大多數AI模型的相關性都低于0.5,在記憶度評估上甚至接近零。

      Q2:經過情感認知訓練的AI在圖像生成方面有什么具體改進?

      A:訓練后的AI在圖像生成質量上顯著提升,所有評估指標都有改進,特別是ImageReward評分提升了22.8%。在認知特定生成中,情感維度提升了19%。用戶研究顯示,人們選擇訓練后模型生成圖像的頻率比原始模型高1.7倍。生成的圖像在美感、情感表達和視覺趣味性方面都更符合人類偏好。

      Q3:這項研究對未來AI在創意領域的應用有什么意義?

      A:這項研究證明AI可以學會理解圖像的主觀特質如美感、幽默和情感,這將改變AI在創意產業中的角色。未來的AI不再只是執行技術指令的工具,而是具備一定審美判斷和情感理解的創作伙伴,可以在廣告設計、藝術創作、情感計算等需要理解人類感受的領域發揮更大價值,生成更符合人類情感需求的內容。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      41歲女演員郭碧婷回應與向佐分居兩地:不用嫁雞隨雞、嫁狗隨狗,他只用和孩子維持感情就好;坦言婆婆向太給了自己和孩子很多錢

      41歲女演員郭碧婷回應與向佐分居兩地:不用嫁雞隨雞、嫁狗隨狗,他只用和孩子維持感情就好;坦言婆婆向太給了自己和孩子很多錢

      極目新聞
      2025-12-11 17:04:37
      87歲范曾喜得獨子后續:曝和兒女斷絕關系原因,還是范一夫聰明!

      87歲范曾喜得獨子后續:曝和兒女斷絕關系原因,還是范一夫聰明!

      古希臘掌管松餅的神
      2025-12-11 13:08:12
      2025年12月1日全國機動車年檢新規落地,車主別白跑一趟

      2025年12月1日全國機動車年檢新規落地,車主別白跑一趟

      右耳遠聞
      2025-12-09 18:45:04
      無恥!百色教師性侵當庭翻供,女孩日記曝光:我說痛他以為是情趣

      無恥!百色教師性侵當庭翻供,女孩日記曝光:我說痛他以為是情趣

      派大星紀錄片
      2025-12-11 15:05:51
      這件事后果其實非常嚴重,可為什么沒人敢說!

      這件事后果其實非常嚴重,可為什么沒人敢說!

      胖胖說他不胖
      2025-12-11 10:00:19
      農業銀行尾盤暴拉,再現股民神預測,發生了什么?

      農業銀行尾盤暴拉,再現股民神預測,發生了什么?

      金石隨筆
      2025-12-12 00:08:21
      女孩曬出已故父親合影,沒想到卻是網友先繃不住了:這不是……

      女孩曬出已故父親合影,沒想到卻是網友先繃不住了:這不是……

      譚老師地理大課堂
      2025-12-11 22:20:25
      官媒親宣,34歲韋東奕再破天花板,辦公室內景曝光,新水杯未開封

      官媒親宣,34歲韋東奕再破天花板,辦公室內景曝光,新水杯未開封

      烏娛子醬
      2025-12-11 16:37:45
      美的、海爾、小米等聯手:推動“鋁代銅”標準落地、禁止互相惡意攻擊

      美的、海爾、小米等聯手:推動“鋁代銅”標準落地、禁止互相惡意攻擊

      第一財經資訊
      2025-12-11 15:32:10
      中央經濟工作會議釋信號:這三件事,不做!

      中央經濟工作會議釋信號:這三件事,不做!

      國是直通車
      2025-12-11 19:37:02
      亞冠激烈沖突!15人互相推搡,3人染黃柏楊染紅,國安3次惡斗

      亞冠激烈沖突!15人互相推搡,3人染黃柏楊染紅,國安3次惡斗

      奧拜爾
      2025-12-11 22:25:34
      86歲范曾太清醒!繼子范仲達想不到,當年一行為,讓徐萌成功上位

      86歲范曾太清醒!繼子范仲達想不到,當年一行為,讓徐萌成功上位

      阿纂看事
      2025-12-11 15:07:16
      山東冠縣凌晨發生3.7級地震,村民睡夢中被驚醒,房屋晃動了七八秒,地震局:暫未接到損失報告

      山東冠縣凌晨發生3.7級地震,村民睡夢中被驚醒,房屋晃動了七八秒,地震局:暫未接到損失報告

      極目新聞
      2025-12-11 10:22:06
      贏麻了!徐萌讓87歲范曾當爹并斷絕女兒、繼子關系,打理全部產業

      贏麻了!徐萌讓87歲范曾當爹并斷絕女兒、繼子關系,打理全部產業

      火山詩話
      2025-12-11 13:27:15
      貴州女老師趙慶梅被判死刑,全班22名男生受害,僅2人幸免

      貴州女老師趙慶梅被判死刑,全班22名男生受害,僅2人幸免

      瑾瑜聊情感
      2025-08-27 13:12:29
      總決賽爆大冷:國乒3人出局,雨果2-4一輪游,林詩棟進決賽壓力小

      總決賽爆大冷:國乒3人出局,雨果2-4一輪游,林詩棟進決賽壓力小

      侃球熊弟
      2025-12-11 22:53:05
      關鍵時刻,特朗普、馬克龍、斯塔默、默茨通話

      關鍵時刻,特朗普、馬克龍、斯塔默、默茨通話

      極目新聞
      2025-12-11 15:18:16
      山東村支書賣小米被舉報封店!當場喊話雷軍:放我們一馬行不行

      山東村支書賣小米被舉報封店!當場喊話雷軍:放我們一馬行不行

      亡海中的彼岸花
      2025-12-11 10:17:06
      2012年,廣東老板參加宴請后失蹤,13年后托夢妻子:我在車庫里

      2012年,廣東老板參加宴請后失蹤,13年后托夢妻子:我在車庫里

      農村情感故事
      2025-12-06 07:32:53
      一炮“送走”柬埔寨副司令,泰軍三軍壓境,不把洪森打服誓不罷休

      一炮“送走”柬埔寨副司令,泰軍三軍壓境,不把洪森打服誓不罷休

      大國知識局
      2025-12-10 22:21:12
      2025-12-12 05:55:00
      至頂AI實驗室 incentive-icons
      至頂AI實驗室
      一個專注于探索生成式AI前沿技術及其應用的實驗室。
      751文章數 151關注度
      往期回顧 全部

      科技要聞

      豆包剛被微信淘寶們"群毆" ,又有人來搶位

      頭條要聞

      村支書賣小米被小米法務投訴下架:希望給我們條活路

      頭條要聞

      村支書賣小米被小米法務投訴下架:希望給我們條活路

      體育要聞

      你最看不上的人,關鍵時刻卻最想救你...

      娛樂要聞

      黃慧頤曝保劍鋒出軌細節!

      財經要聞

      明年經濟工作怎么干 中央經濟工作會議定調

      汽車要聞

      長途穿越更輕松 二代哈弗H9穿越版限時售23.29萬

      態度原創

      旅游
      家居
      藝術
      教育
      時尚

      旅游要聞

      1 次漫步 = 看盡千年文脈!甘棠公園的冬日,藏著九江的靈魂

      家居要聞

      歐式風格 純粹優雅氣質

      藝術要聞

      嶺南畫派畫雪

      教育要聞

      烏蘭察布體校竟培養奧運選手!實力揭秘

      12月的奇跡,是“白”給的!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻中文系列| 91福利国产午夜亚洲精品| 又爽又黄又无遮挡的视频| 正在播放东北夫妻内射| 永寿县| 久久这里只精品国产2| 无码人妻h动漫| 中文字幕亚洲乱码熟女一区二区| 久久精品免视看国产成人| 色色欧美| 无套内射蜜桃小视频| 欧洲美熟女乱又伦av影片| 成年男女免费视频网站| 玩弄人妻少妇500系列| 又粗又大又硬又长又爽| 97在线视频观看| 第一福利精品| 亚洲乱熟女av| 熟女中文字幕| 欧美午夜精品| 狠狠v日韩v欧美v| 亚洲人成网站观看在线观看| 国产亚洲av夜间福利香蕉149 | 五大连池市| 无码探花| 日日干日日日撸| 印度成人无码AV| 日本无码中文| 国产xxxxxx| 岛国无码精品| 梁山县| 韩日一级| 醴陵市| 无码人妻一区二区三区免费n鬼沢| 最新中文字幕在线| 无码AV在线播放| 国产高清A片| 国产av日韩av| 呈贡县| 宝坻区| 欧美日韩xxx|