<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      “專家人設”反而讓 AI 變笨?研究實錘:一句“你是資深工程師”,代碼準確率不升反降!

      0
      分享至

      編譯 | 鄭麗媛

      出品 | CSDN(ID:CSDNnews)

      如果你也經常這樣寫 Prompt——

      “你是一位資深全棧工程師,請幫我寫一套生產級系統代碼……”

      那這篇研究,可能會讓你重新審視自己的使用習慣。

      一直以來,“給 AI 加人設”幾乎成了默認操作。從寫代碼、寫文檔,到做架構設計,不少開發者都會在開頭先“鋪墊一句”,試圖把模型“催眠”成一個更專業的版本。但問題是:這種看似提升專業性的技巧,可能正在悄悄拉低結果質量。

      近日,一項來自美國南加州大學(USC)的最新研究,對這一做法給出了一個有些反直覺的結論:讓 AI 扮演“專家”,并不會讓它更擅長解決專業問題,反而在編程和數學任務上會明顯變差。(論文地址:https://arxiv.org/abs/2603.18507)



      一項研究:為什么“專家人設”會翻車?

      所謂“人設提示”(Persona-based Prompting),本質上就是一種“角色扮演式”的 Prompt 技術。它的核心邏輯很簡單:通過一句身份設定,讓模型進入某種“工作狀態”。

      這種方法在 2023 年開始被廣泛討論,并迅速在開發者社區流行開來。無論是教程、課程,還是各種 Prompt 模板,幾乎都會建議你這樣寫:

      ● “你是一位經驗豐富的機器學習工程師……”

      ● “你是一名精通系統設計的架構師……”

      ● “請以安全專家的視角分析以下問題……”

      理論上來說,這種方法似乎很合理。畢竟模型是“語言驅動”的,那多給一點上下文,不就能讓它“更像專家”嗎?但來自南加州大學(USC)的研究人員在一篇論文中指出:

      “人設提示是否有效,很大程度上要看任務類型。”

      也就是說,并不是“加了人設就一定能變強”,而是“用對了才行”。具體來說,該研究團隊將任務大致分成兩類:

      (1)一類是依賴“對齊能力”的任務,比如寫作、角色扮演、遵守規則、安全策略等。在這些場景中,模型需要的是“行為符合預期”,而不是絕對正確的答案。

      (2)一類則是依賴“知識和推理能力”的任務,比如數學計算、代碼生成、事實問答。這些任務則更依賴模型在預訓練階段學到的知識儲備。

      基于這兩類任務,研究團隊得到的實驗結果為:在“人設提示”的加持下,第一類任務表現有所提升;但在第二類任務中,模型表現卻出現了系統性下降。


      真正的問題:它在“演”,而不是在“算”

      為了量化這種影響,研究人員使用了一個經典評測基準:MMLU(大規模多任務語言理解測試)。這個測試覆蓋多個學科,常被用來衡量大模型的綜合能力。

      評測之后,結果非常直接:

      ● 不加“人設”:準確率 71.6%

      ● 加“專家人設”:準確率 68.0%

      更重要的是,這種下降幾乎出現在所有學科類別中,而不僅僅是個別任務。這說明了一個問題:“人設提示”確實改變了模型的行為方式,但這種改變,并不總是好的。

      對于這個結果,研究團隊給出的解釋非常耐人尋味:

      “人設前綴可能激活了模型的‘指令執行模式’,從而擠占了原本用于‘事實回憶’的能力。”

      解釋一下,從模型機制來看,大語言模型本質上是在做“概率生成”。當你告訴它“你是一位專家”,它并不會獲得任何新的知識,也不會解鎖新的推理能力,但會進入一種更偏“指令執行”和“角色模擬”的模式。而這,就帶來了一個微妙但關鍵的變化:原本用于“從預訓練數據中檢索事實”的能力,被部分“擠占”了。

      簡單來說,就是模型開始更關注“如何像專家說話”,而不是“答案本身是否正確”。這也是為什么在編程和數學任務中,“人設”反而成為了模型的負擔。

      不過,雖然準確性下降,但在人類更關心的“安全”和“規范”上,人設提示確實有明顯幫助。

      例如,在安全性測試中引入一個類似“安全審查員(Safety Monitor)”的人設后,模型拒絕惡意請求的能力將明顯提升。其中在 JailbreakBench 測試中:原始模型拒絕率為53.2%,但加了“人設”后拒絕率提升 17.7 個百分點,變為70.9%。


      對開發者來說,有點反直覺的結論

      基于以上發現,研究人員在論文中明確表示:

      讓 AI 扮演“專家程序員”,不會提升代碼質量或實用性。

      這對很多開發者來說,可能是一個需要“糾正”的習慣。

      因為在實際使用中,大量開發者的 Prompt 都包含類似話術: “你是 Google 級別的架構專家” 、 “你擁有 20 年開發經驗”……這些描述看似增強了“專業性”,實際上并沒有給模型帶來任何實質性的能力提升。

      不過研究也指出,雖然“泛化的人設”沒什么用,但具體、細粒度的約束卻是有效的。例如:

      ● 明確前端框架(React / Vue)

      ● 指定架構模式(微服務 / 單體)

      ● 限定工具鏈(Docker / Kubernetes)

      ● 描述代碼風格、接口規范

      因為本質上來說,這些屬于“對齊信息”、“需求約束”,而不是“身份設定”,它們的作用是幫助模型更好地對齊你的目標,而不是讓它“扮演某個人”。


      一個更工程化的解法:PRISM

      既然人設提示“有利有弊”,那有沒有辦法兩者兼顧呢?

      針對這個問題,研究團隊提出了一種新的方法,叫做 PRISM(基于意圖的人設路由機制)。它的核心思想有點像“動態開關”:一般情況下保持原始模型,主要確保知識與準確性,僅在需要時啟用“人設行為”。

      在實現上,它借助了一種叫 LoRA(低秩適配)的技術,通過一個“門控機制”來自動判斷使用哪種模式。簡單來說,這就讓模型具備一種能力:該認真的時候就認真算,該演的時候再去演。

      在論文的最后,研究人員總結了一條非常實用的經驗法則:

      ● 當你更關心“對齊”(安全、格式、規則)時→可以加人設,并具體描述要求;

      ● 當你更關心“準確性和事實”時→ 不要加任何設定,直接提問。

      某種程度上來說,“你是一位專家”這句話,本質上更像是寫給人看的,而不是寫給模型看的——它滿足的是人類對“專業感”的心理預期,卻未必真能提升結果質量。

      有時候,想讓模型輸出得更好,并不用讓它“更像人”,而是盡量別干擾它本就擅長的事情。

      參考鏈接:https://www.theregister.com/2026/03/24/ai_models_persona_prompting/

      110 萬美金懸賞!

      AMD 2026 線上黑客松大賽來襲

      從 MXFP4 MoE 算子爆改,到真實千倍并發下的吞吐量極限拉扯

      不看資歷,只看絕對速度

      挑戰DeepSeek?R1/KimiK2.5極致并發

      入圍即能拿 1 萬美金

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “把孩子當力工培養呢?”一份中學生高碳水午餐,讓家長被群嘲

      “把孩子當力工培養呢?”一份中學生高碳水午餐,讓家長被群嘲

      妍妍教育日記
      2026-04-21 09:05:03
      國家隊下令停職8年后,國際乒聯提及孔令輝,有一點大家都難反駁

      國家隊下令停職8年后,國際乒聯提及孔令輝,有一點大家都難反駁

      林子說事
      2026-04-26 18:02:09
      總有人說劉亦菲體態不好,但是你看看這一幕…她完勝所有人

      總有人說劉亦菲體態不好,但是你看看這一幕…她完勝所有人

      阿廢冷眼觀察所
      2026-04-24 16:53:29
      復婚傳聞真相大白僅24小時,李亞鵬高調官宣喜訊,全網恭喜

      復婚傳聞真相大白僅24小時,李亞鵬高調官宣喜訊,全網恭喜

      娛說瑜悅
      2026-04-25 15:27:17
      宋靄齡23歲兒子愛上40歲青樓二婚女私奔結婚,宋靄齡被氣渾身顫抖

      宋靄齡23歲兒子愛上40歲青樓二婚女私奔結婚,宋靄齡被氣渾身顫抖

      睡前講故事
      2026-03-19 21:20:31
      森碟18歲近照曝光!身高超1米7背香奈兒,風一樣的女子長大了

      森碟18歲近照曝光!身高超1米7背香奈兒,風一樣的女子長大了

      小椰的奶奶
      2026-04-26 15:28:30
      “被嚇到!”AI生圖已經這么逼真了?網友:以后還能信嗎?

      “被嚇到!”AI生圖已經這么逼真了?網友:以后還能信嗎?

      魯中晨報
      2026-04-24 16:56:11
      “有錢就變壞”山東,一男子花42元買彩票,竟中獎1000多萬,...

      “有錢就變壞”山東,一男子花42元買彩票,竟中獎1000多萬,...

      網絡易不易
      2026-04-23 11:56:17
      戴安娜因太好看引發SBI強烈不滿,稱不倫不類令人作嘔

      戴安娜因太好看引發SBI強烈不滿,稱不倫不類令人作嘔

      街機時代
      2026-04-25 18:00:03
      何潔自曝養家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

      何潔自曝養家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

      扒點半吃瓜
      2026-03-10 07:00:13
      陸毅50歲體重飆至176斤,血壓偏高嘴唇發紫入院

      陸毅50歲體重飆至176斤,血壓偏高嘴唇發紫入院

      日不西沉
      2026-04-26 23:00:12
      詩妮娜新亮相意大利,臉僵了醫美過度,貴妃架子十足要求行跪拜禮

      詩妮娜新亮相意大利,臉僵了醫美過度,貴妃架子十足要求行跪拜禮

      動物奇奇怪怪
      2026-04-26 15:56:36
      郭德綱官宣招生不到10天,繼承人之位就再陷爭議,王惠在下什么棋

      郭德綱官宣招生不到10天,繼承人之位就再陷爭議,王惠在下什么棋

      鄉野小珥
      2026-04-27 00:54:51
      宇航員登月回歸后精神失常,死前坦言:人類不應踏足遠方

      宇航員登月回歸后精神失常,死前坦言:人類不應踏足遠方

      清茶淺談
      2024-12-20 22:30:46
      血虧8億!華晨宇直播崩潰大哭,云南拿地建樂園,臨門一腳被強拆

      血虧8億!華晨宇直播崩潰大哭,云南拿地建樂園,臨門一腳被強拆

      奇怪的鯊魚們
      2026-04-26 16:32:25
      伊朗宣布,其特種部隊成功摧毀三枚美國GBU-57巨型鉆地彈

      伊朗宣布,其特種部隊成功摧毀三枚美國GBU-57巨型鉆地彈

      止戈軍是我
      2026-04-26 23:20:38
      張婉婷曝宋寧峰近況:他每天就是下跪、哭、悔過,就是死都不離開

      張婉婷曝宋寧峰近況:他每天就是下跪、哭、悔過,就是死都不離開

      觀魚聽雨
      2026-04-15 22:30:00
      這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

      這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

      喜歡歷史的阿繁
      2026-04-16 11:17:28
      孫穎莎被日乒選手表白,曬二人合照,球迷:別白日做夢

      孫穎莎被日乒選手表白,曬二人合照,球迷:別白日做夢

      酷侃體壇
      2026-04-24 23:12:49
      白宮記者晚宴的槍聲,為什么萬斯撤得比總統快?是貪生怕死嗎

      白宮記者晚宴的槍聲,為什么萬斯撤得比總統快?是貪生怕死嗎

      西樓知趣雜談
      2026-04-26 15:18:33
      2026-04-27 04:07:00
      CSDN incentive-icons
      CSDN
      成就一億技術人
      26482文章數 242273關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

      頭條要聞

      特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

      體育要聞

      森林狼3比1掘金:逆境中殺出了多孫穆?!

      娛樂要聞

      僅次《指環王》的美劇,有第二季

      財經要聞

      事關新就業群體,中辦、國辦發文

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      親子
      手機
      教育
      旅游
      軍事航空

      親子要聞

      爸爸買的餐椅太好了,早知道早買了#餐椅 #寶寶板凳 #寶寶吃飯 #寶媽推薦

      手機要聞

      vivo Y600 Pro配備 6.83 英寸 1.5K 護眼屏,新機明天見!

      教育要聞

      超燃暴擊!孩子們為啥都樂翻天了?!這所人附系學校揭秘

      旅游要聞

      2000余場特色活動邀市民歡度五一

      軍事要聞

      伊朗總統:不會在壓力、威脅下進行談判

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 色AV综合| 男女性高爱潮免费网站| 人妻少妇不满足中文字幕| 精品国内自产拍在线观看| 欧美性xxxxx极品少妇| 美女秘密91| 中文字幕潮喷人妻系列| 国产不卡精品视频男人的天堂| 亚洲熟妇中文字幕五十中出| 边啃奶头边躁狠狠躁| 国产精品免费久久久免费| 久久精品亚洲| 国产午夜精品1区2区3福利| 国产成人小视频| 中文字幕亚洲中文字幕无码码| 乱女伦露脸对白在线播放| 欧美日韩另类国产| 亚洲熟女视讯2| 牛牛视频一区二区三区| 啦啦啦高清在线观看视频www| 日本无码白浆一区二区 | 国产一区二区亚洲一区二区三区| 国产超高清麻豆精品传媒麻豆精品| 亚洲色成人www永久在线观看 | 免费国精产品wnw2544| 久久99嫩草熟妇人妻蜜臀| 人伦中文字幕| 国产精品亚洲综合久久小说| 最新的国产成人精品2022| 亚洲欧美成人a∨观看| 人妻蜜臀久久av不卡| 国产999精品成人网站| 欧洲极品少妇| 亚洲国产av无码综合原创国产| 九一看片| 欧美一区二区三区性视频| 亚洲日本91| 中文无码人妻| 久久福利影院| 亚洲人人人| 四虎av|