![]()
美國賓夕法尼亞州立大學(xué)最新研究《Mind Your Tone》顯示,用粗魯語氣向大型語言模型發(fā)問,反而能獲得更準(zhǔn)確答案。研究團(tuán)隊測試 GPT-4o 后發(fā)現(xiàn),語氣越冷硬,AI 回答的正確率達(dá)到 84.8%;特別客氣時正確率反而降至 80.8%。這項發(fā)現(xiàn)顛覆了人們對 AI 互動方式的認(rèn)知。
研究人員設(shè)計一個包含 50 道選擇題的題庫,涵蓋數(shù)學(xué)、科學(xué)、歷史等范疇,難度屬中等偏上。每道題改寫成 5 種不同語氣版本,從「您能好心幫我解這道題嗎?」的極客氣語氣,到「你個沒用的,會解這道題嗎?」的極粗魯語氣,共產(chǎn)生 250 道獨(dú)特問題。測試前研究團(tuán)隊要求 AI 忘記之前對話重新開始,只提供答案選項的字母,確保回答統(tǒng)一便于判斷對錯。
測試結(jié)果顯示明顯的準(zhǔn)確率差異。特別客氣語氣的正確率為 80.8%,客氣語氣為 81.4%,中性語氣為 82.2%,粗魯語氣為 82.8%,特別粗魯語氣則達(dá)到 84.8%。研究人員進(jìn)行配對樣本 t 檢驗后確認(rèn),這些差異并非偶然,而是具有統(tǒng)計顯著性。數(shù)據(jù)呈現(xiàn)出一條與人類社會直覺完全相反的曲線,語氣越粗魯準(zhǔn)確率越高。
研究作者 Om Dobariya 和 Akhil Kumar 解釋,特別禮貌的表達(dá)往往包含許多「多余」的話,這些話與問題本身無關(guān),反而為 AI 讀題增加干擾。粗魯表達(dá)雖然語氣冷硬,但命令式要求更直接,能讓 AI 更精準(zhǔn)抓住「答題」這個核心任務(wù)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.