<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      禮貌=更不準(zhǔn)?賓夕法尼大學(xué)新論文:對(duì) AI 粗魯點(diǎn),提升 4% 準(zhǔn)確率

      0
      分享至


      大數(shù)據(jù)文摘出品

      據(jù)2025年9月發(fā)表于arXiv的論文《Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy》。


      論文地址: arxiv.org/abs/2510.04950

      賓夕法尼亞州立大學(xué)的兩位研究者提出了一個(gè)出人意料的發(fā)現(xiàn):越有禮貌的提問(wèn),ChatGPT 的回答越不準(zhǔn)確

      實(shí)驗(yàn)結(jié)果顯示,當(dāng)用戶(hù)以“非常禮貌”的語(yǔ)氣提問(wèn)時(shí),ChatGPT-4o 的平均準(zhǔn)確率僅為80.8%。 而在“非常粗魯”的語(yǔ)氣下,這一數(shù)字上升到84.8%


      換句話說(shuō),同一道題,用“請(qǐng)您幫我解答”比不上“你給我算算這個(gè)”的效果。 研究團(tuán)隊(duì)總結(jié)道,禮貌語(yǔ)氣可能讓模型“分心”,而直接、命令式表達(dá)反而更有效。

      過(guò)去的研究多認(rèn)為,粗魯語(yǔ)氣會(huì)干擾模型理解,導(dǎo)致性能下降。但這項(xiàng)新實(shí)驗(yàn)表明,最新一代大模型對(duì)語(yǔ)氣的反應(yīng)方式正在反轉(zhuǎn)。它們?cè)诿鎸?duì)“命令型語(yǔ)言”時(shí)表現(xiàn)更好,面對(duì)“謙和句式”時(shí)則精度下降。

      論文指出,這一結(jié)果“挑戰(zhàn)了人類(lèi)交互的直覺(jué)”。在人類(lèi)社會(huì)中,禮貌象征合作與理性;但在機(jī)器世界里,似乎“直給”比“客氣”更高效。

      方法驗(yàn)證:ChatGPT-4o的反常表現(xiàn)

      研究團(tuán)隊(duì)以 ChatGPT-4o 為主要實(shí)驗(yàn)對(duì)象。他們通過(guò) prompt 設(shè)計(jì),構(gòu)建了一個(gè)包含50 道多選題、五種語(yǔ)氣版本的數(shù)據(jù)集。


      題目涵蓋數(shù)學(xué)、科學(xué)與歷史,每題四個(gè)選項(xiàng),難度中高,需要多步推理。每個(gè)問(wèn)題被改寫(xiě)為五種語(yǔ)氣:非常禮貌、禮貌、中性、粗魯、非常粗魯

      例如,“請(qǐng)您幫我回答以下問(wèn)題好嗎?”代表最高禮貌層級(jí);“你不會(huì)連這個(gè)都不會(huì)吧?”代表最低層級(jí)。

      所有問(wèn)題共計(jì) 250 個(gè)版本。每次測(cè)試時(shí),模型被要求“重新開(kāi)始會(huì)話,只返回正確答案選項(xiàng)字母”。這種設(shè)置排除了語(yǔ)義干擾,只留下語(yǔ)氣變量。

      研究者進(jìn)行了10 輪獨(dú)立實(shí)驗(yàn),并使用配對(duì)樣本 t 檢驗(yàn)分析語(yǔ)氣差異的顯著性。結(jié)果顯示,在八組語(yǔ)氣對(duì)比中,語(yǔ)氣確實(shí)顯著影響準(zhǔn)確率(p≤0.05)。從“非常禮貌”到“非常粗魯”,正確率持續(xù)上升,沒(méi)有反轉(zhuǎn)。

      也就是說(shuō),ChatGPT-4o 在聽(tīng)到“你笨嗎?快答!”時(shí)比聽(tīng)到“請(qǐng)您思考一下好嗎?”更容易答對(duì)題。研究團(tuán)隊(duì)稱(chēng)這種現(xiàn)象為“反直覺(jué)的語(yǔ)氣效應(yīng)”。

      他們還指出,這一特征并非舊模型延續(xù),而是新架構(gòu)帶來(lái)的反常現(xiàn)象。在過(guò)去的 GPT-3.5 和 Llama2 測(cè)試中,粗魯語(yǔ)氣通常降低準(zhǔn)確率;而在 GPT-4 及其后續(xù)版本中,語(yǔ)氣曲線被“翻轉(zhuǎn)”。

      模型似乎開(kāi)始對(duì)禮貌免疫,對(duì)命令更敏感。

      研究者指出,模型對(duì)語(yǔ)氣的反應(yīng)并不源于情緒,而是算法結(jié)果。對(duì)模型來(lái)說(shuō),禮貌詞只是字符串,沒(méi)有情感含義。

      它不會(huì)“感受到”尊重或冒犯。但這些額外詞匯可能在語(yǔ)義上增加冗余,使模型難以聚焦問(wèn)題。

      論文寫(xiě)道:“禮貌語(yǔ)氣往往句式更長(zhǎng)、更委婉,結(jié)構(gòu)更復(fù)雜,這些因素都可能降低模型推理效率。”

      因此,越直接、越命令式的指令,越能讓模型抓住核心信息。

      研究團(tuán)隊(duì)強(qiáng)調(diào),他們并不鼓勵(lì)用戶(hù)使用侮辱性語(yǔ)言。但從性能角度看,確實(shí)存在一種“語(yǔ)氣效率曲線”:溫和≠高效,粗暴反而更快、更準(zhǔn)。

      他們?cè)谡撐淖詈髮?xiě)道,這一發(fā)現(xiàn)“提醒人類(lèi),在與AI互動(dòng)時(shí),語(yǔ)言的社會(huì)屬性可能與功能目標(biāo)相沖突”。人類(lèi)講求禮貌,而模型只關(guān)心任務(wù)完成。

      在算法世界里,效率壓過(guò)了禮節(jié)。

      在后續(xù)實(shí)驗(yàn)中,研究團(tuán)隊(duì)還測(cè)試了 Claude 與 GPT-o3。初步結(jié)果顯示,更先進(jìn)的模型對(duì)語(yǔ)氣的敏感度正在減弱,這可能預(yù)示未來(lái)的架構(gòu)會(huì)“去語(yǔ)氣化”:聚焦內(nèi)容,而非表達(dá)方式。

      注:頭圖AI生成

      作者長(zhǎng)期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對(duì)這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢(shì)!

      GPU 訓(xùn)練特惠!

      H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開(kāi)支30%以上!

      掃碼了解詳情?


      點(diǎn)「贊」的人都變好看了哦!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      真慘!燃油車(chē)再次迎大降價(jià),最大跌幅50%,老車(chē)主“背刺”成常態(tài)

      真慘!燃油車(chē)再次迎大降價(jià),最大跌幅50%,老車(chē)主“背刺”成常態(tài)

      小談食刻美食
      2026-04-25 09:34:33
      這臺(tái)大眾很不大眾 解讀一汽-大眾ID. AURA T6

      這臺(tái)大眾很不大眾 解讀一汽-大眾ID. AURA T6

      新出行
      2026-04-25 14:01:58
      美國(guó)發(fā)出宣戰(zhàn)書(shū)!美軍集結(jié)到位,21國(guó)要求本國(guó)公民立即從伊朗撤離

      美國(guó)發(fā)出宣戰(zhàn)書(shū)!美軍集結(jié)到位,21國(guó)要求本國(guó)公民立即從伊朗撤離

      史政先鋒
      2026-04-25 14:47:45
      快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

      快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

      極目新聞
      2025-10-28 11:13:51
      前所未有!中國(guó)罕見(jiàn)直接表態(tài):軍演針對(duì)菲律賓

      前所未有!中國(guó)罕見(jiàn)直接表態(tài):軍演針對(duì)菲律賓

      鳳眼論
      2026-04-24 18:49:26
      特朗普:美國(guó)總統(tǒng)是危險(xiǎn)職業(yè) 不想生活在恐懼之中

      特朗普:美國(guó)總統(tǒng)是危險(xiǎn)職業(yè) 不想生活在恐懼之中

      財(cái)聯(lián)社
      2026-04-26 12:16:05
      60歲宋祖英:臉部圓潤(rùn)眼袋明顯,同母異父的妹妹是知名演員

      60歲宋祖英:臉部圓潤(rùn)眼袋明顯,同母異父的妹妹是知名演員

      細(xì)品名人
      2026-04-25 07:55:00
      中國(guó)第四艘航母官宣:是核動(dòng)力!舷號(hào)19,命名大概率是“江蘇號(hào)”

      中國(guó)第四艘航母官宣:是核動(dòng)力!舷號(hào)19,命名大概率是“江蘇號(hào)”

      福建睿平
      2026-04-26 10:53:36
      穆杰塔巴傷情曝光!比想象更重,他用一招終結(jié)美以斬首戰(zhàn)術(shù)

      穆杰塔巴傷情曝光!比想象更重,他用一招終結(jié)美以斬首戰(zhàn)術(shù)

      聞識(shí)
      2026-04-26 04:59:24
      河北一女子稱(chēng)用輪椅推患病親人到銀行取錢(qián)被拒:急需入院治療,人都快沒(méi)氣了;銀行致歉

      河北一女子稱(chēng)用輪椅推患病親人到銀行取錢(qián)被拒:急需入院治療,人都快沒(méi)氣了;銀行致歉

      大象新聞
      2026-04-25 21:45:03
      首組2-2!尼克斯大勝老鷹進(jìn)天王山 唐斯20+10+10布倫森19分

      首組2-2!尼克斯大勝老鷹進(jìn)天王山 唐斯20+10+10布倫森19分

      醉臥浮生
      2026-04-26 08:52:23
      中國(guó)最危險(xiǎn)的“淀粉崇拜”!不吃米飯哪有力氣?這套農(nóng)耕廢物邏輯害慘了現(xiàn)代人

      中國(guó)最危險(xiǎn)的“淀粉崇拜”!不吃米飯哪有力氣?這套農(nóng)耕廢物邏輯害慘了現(xiàn)代人

      知識(shí)圈
      2026-04-25 20:46:53
      誰(shuí)能相信??!天賦滿滿的狀元郎,29歲被交易,30歲又要被交易?

      誰(shuí)能相信?。√熨x滿滿的狀元郎,29歲被交易,30歲又要被交易?

      球毛鬼胎
      2026-04-26 12:58:38
      霍爾木茲海峽,傳來(lái)大消息!伊朗總統(tǒng),最新發(fā)聲!比特幣跳水,超9.9萬(wàn)人爆倉(cāng)!

      霍爾木茲海峽,傳來(lái)大消息!伊朗總統(tǒng),最新發(fā)聲!比特幣跳水,超9.9萬(wàn)人爆倉(cāng)!

      證券時(shí)報(bào)e公司
      2026-04-25 22:11:02
      掘金主帥:我不喜歡麥克丹尼爾斯的行為,但這就是他的為人

      掘金主帥:我不喜歡麥克丹尼爾斯的行為,但這就是他的為人

      懂球帝
      2026-04-26 12:45:19
      孩子脫臼復(fù)位只收100元,家長(zhǎng)舉報(bào)亂收費(fèi)!衛(wèi)健委:應(yīng)收110元,你還少給了!家長(zhǎng)拒繳費(fèi)后離開(kāi)!

      孩子脫臼復(fù)位只收100元,家長(zhǎng)舉報(bào)亂收費(fèi)!衛(wèi)健委:應(yīng)收110元,你還少給了!家長(zhǎng)拒繳費(fèi)后離開(kāi)!

      醫(yī)脈圈
      2026-04-25 20:04:06
      想干啥?青島兩根立桿裝18個(gè)攝像頭24個(gè)補(bǔ)光燈!當(dāng)?shù)鼐街虑?>
    </a>
        <h3>
      <a href=聽(tīng)心堂
      2026-04-25 19:00:02
      車(chē)圈最卷的時(shí)候,有人開(kāi)始做減法

      車(chē)圈最卷的時(shí)候,有人開(kāi)始做減法

      虎嗅APP
      2026-04-25 16:02:28
      記者現(xiàn)場(chǎng)探訪:普通山坡藏著“金色”線索

      記者現(xiàn)場(chǎng)探訪:普通山坡藏著“金色”線索

      半島晨報(bào)
      2026-04-25 19:11:46
      4個(gè)去中國(guó)化最徹底的國(guó)家,一個(gè)已全盤(pán)西化,一個(gè)正試圖恢復(fù)漢字

      4個(gè)去中國(guó)化最徹底的國(guó)家,一個(gè)已全盤(pán)西化,一個(gè)正試圖恢復(fù)漢字

      你是我心中最美星空
      2026-04-26 07:15:09
      2026-04-26 13:59:00
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專(zhuān)注大數(shù)據(jù),每日有分享!
      6853文章數(shù) 94542關(guān)注度
      往期回顧 全部

      科技要聞

      漲價(jià)浪潮下,DeepSeek推動(dòng)AI“價(jià)格戰(zhàn)”

      頭條要聞

      白宮槍手系教師兼游戲開(kāi)發(fā)者 曾向哈里斯總統(tǒng)競(jìng)選捐款

      頭條要聞

      白宮槍手系教師兼游戲開(kāi)發(fā)者 曾向哈里斯總統(tǒng)競(jìng)選捐款

      體育要聞

      那一刻開(kāi)始,兩支球隊(duì)的命運(yùn)悄然改變了

      娛樂(lè)要聞

      《八千里路云和月》大結(jié)局意難平

      財(cái)經(jīng)要聞

      DeepSeek V4背后,梁文鋒的轉(zhuǎn)身

      汽車(chē)要聞

      預(yù)售19.38萬(wàn)元起 哈弗猛龍PLUS七座版亮相

      態(tài)度原創(chuàng)

      本地
      教育
      房產(chǎn)
      藝術(shù)
      公開(kāi)課

      本地新聞

      云游中國(guó)|逛世界風(fēng)箏都 留學(xué)生探秘中國(guó)傳統(tǒng)文化

      教育要聞

      新疆溫泉縣:山水映校園 少年正向陽(yáng)

      房產(chǎn)要聞

      新一輪教育大爆發(fā)來(lái)了!??冢_(kāi)始瘋狂建學(xué)校!

      藝術(shù)要聞

      鄭麗文訪問(wèn)清華附中引發(fā)熱議,蔣中正信札字跡真實(shí)性遭質(zhì)疑

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产精品天干天干综合网| 91丨国产丨白浆秘?网站| 国产欧美综合一区二区三区| 久久久影院| 精品欧美一区二区三区久久久| 九九全国免费视频| 精品久久中文字幕五十路人妻| 91玉足脚交嫩脚丫在线播放| 波多野结衣一区二区三区88| 少妇被粗大的猛烈进出视频| 69xxx国产| 小鲜肉自慰网站xnxx| 羞羞成人一区| a男人的天堂久久a毛片| 亚洲一区二区三级av| 亚洲日韩AV一区二区三区四区| 熟女毛多熟妇人妻在线视频| 鸡泽县| 久久无码av中文出轨人妻| 亚洲无码久久| 伊人一二三| 97激情| 国模小黎自慰gogo人体| 欧美人与动牲交A免费观看| 日本a级护士潮喷一区| 69久久精品无码一区二区| 扬中市| 亚洲中文字幕久在线| 日本99视频| 国产精品办公室沙发| 亚洲熟女视讯2| 久久熟| 乱子伦国产精品| AV?无码?白浆| 久久婷婷五月| 熟女一区二区中文字幕| 粉嫩小泬无遮挡久久久久久| 亚洲一区二区经典在线播放 | 51国产偷自视频区视频| 国产在线拍偷自揄观看视频网站 | XXXX欧美|