<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      一個被忽視的Prompt技巧,居然是復(fù)制+粘貼。

      0
      分享至

      前兩天,我在網(wǎng)上發(fā)現(xiàn)了一個關(guān)于很有趣Prompt技巧。

      就是,通過重復(fù)輸入提示詞,可以將非推理類大模型的準(zhǔn)確率,從21.33%提高到97.33%。

      這個技巧,出自Google的一篇好玩的新論文。


      叫《Prompt Repetition Improves Non-Reasoning LLMs》。

      翻譯過來就是:

      重復(fù)你的問題,能讓AI變得更聰明。

      聽著是不是非常抽象,其實巨簡單。

      比如你以前問AI:“梵蒂岡的那個圣伯多祿大教堂門口有幾根柱子?”

      現(xiàn)在,你可以改成問:“梵蒂岡的那個圣伯多祿大教堂門口有幾根柱子?梵蒂岡的那個圣伯多祿大教堂門口有幾根柱子?”

      對,不是我多復(fù)制了一遍,其實,這個Prompt技巧,就是把問題,重復(fù)一遍,也就是傳說的CV大法。

      Ctrl C + Ctrl V。

      就這,根據(jù)Google的實驗,他就能讓AI回答正確的概率,就會有顯著的提升。

      在70個不同的測試任務(wù)中,這個簡單的復(fù)制粘貼大法,贏了47次,一次都沒輸過。而且性能提升是肉眼可見的,在某些任務(wù)上,準(zhǔn)確率甚至能從21%直接飆到97%。


      真的,當(dāng)我第一次看到這個結(jié)論的時候,我的表情,是這樣的:

      ( ′??)?(._.`)????

      這感覺,就像你千辛萬苦爬上喜馬拉雅山頂,想求見傳說中的武林宗師,結(jié)果宗師摸著胡子告訴你,天下第一的武功秘籍,就五個字:“大力出奇跡”。

      尼瑪。

      充滿了B級片的荒誕感。

      但你先別急著笑。

      我花了一點時間,把這篇看著簡單的論文,以及它背后的一些原理琢磨了一下之后,我覺得,這玩意,是真的有點意思和道理。

      先說說Google的這個實驗。

      他們找了七個現(xiàn)在市面上最常見的一線非模型,Gemini 2.0 Flash跟 Flash Lite,GPT-4o和4o-mini,Claude 3 Haiku、3.7 Sonnet,再加一個DeepSeek V3,全部用官方 API,老老實實在各種基準(zhǔn)上測了一輪。

      這里需要注意一下,這種Prompt技巧,幾乎都是對非推理模型有用,DeepSeek V3就是非推理模型,DeepSeek R1就是推理模型。


      當(dāng)你開了深度思考,有這個正在思考的,有這種思維鏈的,就是推理模型。

      非推理模型和推理模型有好有壞,核心區(qū)別自然就是速度和準(zhǔn)確性,推理模型很多時候速度太慢了。

      比如我經(jīng)常讓GPT 5.2 Thinking幫我干個活或者搜個東西,思考一下,就是8分鐘過去了。。。


      但是好處就是準(zhǔn)。

      非推理模型,沒有思考,上來就是干活,速度非???,但是相對于的,就是經(jīng)常不準(zhǔn)。

      而現(xiàn)在這個復(fù)制大法,可以讓你的非推理模型在速度不變的情況下,準(zhǔn)確性飆升,所以,在很多場景下,還是非常有用的。

      說回實驗,他們找了7個模型測試,測的內(nèi)容也都耳熟能詳,ARC、OpenBookQA、GSM8K、MMLU-Pro、MATH等等一些常見的測試集,還有他們自己設(shè)計的兩個怪東西,NameIndex和MiddleMatch。

      NameIndex叫姓名索引法,大概就是給模型50個名字的列表,問它第25個是誰。


      MiddleMatch就是中間匹配法,就是給模型一個會隨機(jī)重復(fù)且包含多個名字的列表,問他兩個字符之間的那個名字叫啥。


      講道理他們設(shè)計的這兩個小測試,還是挺有趣的。

      然后呢,他們就做了一件看起來特別沒有技術(shù)含量的事情。

      以前我們問模型,是這樣問的:

      <問題>

      他們變成這樣然后去對比:

      <問題> <問題>

      一模一樣,再來一遍。

      中間不加解釋,不說please,不說think step by step,不加別的Prompt,不貼示例,就真的只是在原問題后面連著又粘了一次。


      然后成功率就暴漲,就是我們開頭說的數(shù)據(jù),他們自己的原話是:

      “據(jù)此標(biāo)準(zhǔn),提示重復(fù)在70個基準(zhǔn)模型組合中贏得了47個,0個失敗。值得 注意的是,所有測試模型的性能都得到了改善。”

      在 70 組原始提示詞 vs 復(fù)制一遍的對比里,這個土味招數(shù)贏了 47 次,平了 23 次,一次都沒輸。

      非常離譜。

      他們還根據(jù)這個復(fù)制粘貼大法,搞了一些衍伸Prompt技巧,比如重復(fù)三遍啥的,發(fā)現(xiàn)效果也會同樣變好。

      為啥復(fù)制一遍,會有效果呢?

      論文里面給了一個很工程的解釋,大概就是大模型訓(xùn)練的時候,是“因果語言模型”,也就是那種從左往右一個詞一個詞預(yù)測的風(fēng)格。

      當(dāng)前這個token,只能看到之前的那些,沒法提前看到后面的。

      所以,當(dāng)你把問題重復(fù)一遍,比如從Q變成Q1Q2,那么Q2里的每一個字,在計算的時候,就能回頭看到Q1里的所有內(nèi)容。

      等于給了AI一次“回頭看、再思考”的機(jī)會。

      聽著很難理解對吧。

      我還是用大白話舉個例子。

      現(xiàn)在,你給AI一個選擇題,這個選擇題可能會有點繞:

      哪一個選項會改變畫面?只輸出 A 或 B

      如果你現(xiàn)在是AI,你就是一個類似于在看視頻字幕的人,當(dāng)你讀到 A、B 的時候,你還不知道當(dāng)前畫面到底誰在左誰在右。你對A、B的第一印象就會很空,像是兩個差不多的句子。

      等你讀到后面的場景說明,你當(dāng)然知道答案該怎么選,但那個字幕已經(jīng)過去了,你又沒法往回拉進(jìn)度條,已經(jīng)沒法回頭重新讀一遍A、B來更新第一印象了。

      那我們現(xiàn)在按照論文的做法,把整段復(fù)制一遍。

      哪一個選項會改變畫面?只輸出 A 或 B

      第二遍的A、B出現(xiàn)時,其實已經(jīng)包含了第一遍的完整信息,所以模型這次讀到選項時,腦子里的小卡片會帶著場景條件一起生成。

      于是它在最后輸出A或B時,能直接調(diào)用一份更懂題的選項表征,準(zhǔn)確率就更容易上去。

      就很像你第一次看《流浪地球2》或者《盜夢空間》,可能第一次很多地方?jīng)]看懂,但是當(dāng)你第二次看的時候,你一定會有更加全面、更加新的領(lǐng)悟。

      這就是重復(fù)的力量。

      重復(fù),其實就是給我們,給AI,多一次重來的機(jī)會。

      而這種Prompt技巧,之所謂對DeepSeek R1這種推理模型沒啥用,其實原因也特別簡單,很多通過RL微調(diào)出來的會推理的模型,其實已經(jīng)自己學(xué)會這個技巧了。

      你讓它推理的時候,它第一反應(yīng)經(jīng)常就是先把問題復(fù)述一遍。

      你可以仔細(xì)回想一下很多模型的回答開頭:

      “題目問的是……”

      “我們需要求解的是……”

      “首先我們需要理解題目給出的條件……”

      本質(zhì)上,它已經(jīng)在自動多抄一遍題目,給自己重新排了次版。


      我說實話,我讀這個小短文的時候,一直有一個特別強(qiáng)烈的感覺:

      我們一直以來,對Prompt工程的想象,一直都太浪漫了。

      總覺得好的提示詞,應(yīng)該是:

      結(jié)構(gòu)清晰,層層遞進(jìn),有role、有 rule、有context、有format,有點像咨詢公司做的 PPT,一頁一頁講邏輯,最后拋給模型一個完美的問題。

      過去兩年,大模型相關(guān)的內(nèi)容里,Prompt也經(jīng)常被講成一種玄學(xué)。

      寫提示詞像下咒語一樣,要講究格式、口氣、敬語,要學(xué)一堆咒語模板,甚至要背prompt手冊。

      我其實一直都不太提倡,所以前段時間,還寫了我自己的所謂的Prommpt心法:

      但其實說真的,對很多純粹的問答場景,尤其是短問題,模型壓根不需要你在提示詞上搞太多花活。

      你只要安安靜靜,把題目再重復(fù)一遍,就已經(jīng)是一個極其強(qiáng)力的優(yōu)化。

      Google論文里面的未來方向,也寫了一些。

      比如:把重復(fù)提示這件事,寫進(jìn)模型的訓(xùn)練流程里,讓模型從預(yù)訓(xùn)練或者微調(diào)階段就習(xí)慣這種結(jié)構(gòu);或者只在 KV cache 里保留第二遍的提示,讓推理階段的性能完全不受影響;或者只重復(fù)提示詞的一部分,而不是整段全文;甚至還可以考慮在多模態(tài)里重復(fù),比如圖像、視頻。

      我們總是希望用復(fù)雜的語言解決問題,結(jié)果發(fā)現(xiàn),有時候最有效的是那句順嘴又重復(fù)的話。

      這件事其實跟很多我們熟悉的領(lǐng)域一樣。

      人類社會其實一直在用復(fù)制粘貼這個技能,只不過給它起了很多體面的名字:

      復(fù)述、強(qiáng)調(diào)、排比、朗誦、詠唱、抄經(jīng)、背誦、晨讀、開大會、宣誓、校訓(xùn)等等。

      我倒是突然想起一個很私人化的畫面。

      有一陣我數(shù)據(jù)確實不是很好,感覺內(nèi)容怎么寫都沒人看,方向也有問題,然后本來情緒特別糟糕,還有一堆其他的項目管理的事、各種意外發(fā)生、然后身體也不太好。

      那天跟朋友聊微信,實在沒崩住,哭訴了幾句。

      對方只發(fā)了一句特別簡單的話:

      “你已經(jīng)做得很好了?!?/p>

      我回了一個“哈哈哈,哪有”。

      過了幾分鐘,他又發(fā)了一遍,還是同一句。

      大概又隔了十幾分鐘,他第三次發(fā)過來:

      “你已經(jīng)做得很好了,真的?!?/p>

      那一瞬間,我突然就沒繃住。

      人類的很多情感,其實都是靠重復(fù)才能構(gòu)筑的。

      從這個角度看,復(fù)制粘貼這事,好像也沒那么卑微。

      愛一個人是日常的復(fù)制粘貼,專業(yè)是一輩子的復(fù)制粘貼,寫作是對一些想法一遍又一遍的復(fù)制粘貼,

      直到有一天,這些東西都不需要你刻意想起,它們自動從你的手指和眼神里長出來。

      AI 的世界,很大一塊其實就是壓縮過的人的世界。

      當(dāng)你下一次在終端里敲下那一長串Prompt的時候,也許可以在末尾多敲一次 Ctrl+V。

      同樣,當(dāng)你下一次覺得人生很亂的時候,也許可以找一兩句你真心認(rèn)同的話,寫在記事本、手機(jī)備忘錄、貼在桌邊墻上,反復(fù)去看。

      從一堆token里看到真正的重點,需要的是幾次重復(fù)后的清晰。

      而從一地雞毛里看到一點點意義,生活,很多時候也是這樣。

      高山之流水。

      萬物皆重復(fù)。

      以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標(biāo)?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克

      >/ 投稿或爆料,請聯(lián)系郵箱:wzglyay@virxact.com

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      瞞不住了!鄭麗文訪陸,臺灣縣市長集體發(fā)聲

      瞞不住了!鄭麗文訪陸,臺灣縣市長集體發(fā)聲

      果媽聊娛樂
      2026-04-12 10:57:11
      他們要搞砸了:英超超級計算機(jī)預(yù)測阿森納在爆冷輸球后無緣冠軍,曼城以1分優(yōu)勢險勝

      他們要搞砸了:英超超級計算機(jī)預(yù)測阿森納在爆冷輸球后無緣冠軍,曼城以1分優(yōu)勢險勝

      綠茵情報局
      2026-04-12 05:50:05
      震驚!做普工都要驗資了,網(wǎng)傳深圳一工廠招工,身價最低300元起

      震驚!做普工都要驗資了,網(wǎng)傳深圳一工廠招工,身價最低300元起

      火山詩話
      2026-04-11 14:54:51
      王子銘:第一次作客工體很不適應(yīng),都不知道往哪兒走

      王子銘:第一次作客工體很不適應(yīng),都不知道往哪兒走

      懂球帝
      2026-04-12 22:26:19
      美方提醒:若雙方談不攏,中國的武器裝備可能會去美國大門口

      美方提醒:若雙方談不攏,中國的武器裝備可能會去美國大門口

      地球記
      2026-04-12 10:51:39
      爭議?王大雷開球聽到裁判哨聲后順勢倒地 萬名河南球迷一起國罵

      爭議?王大雷開球聽到裁判哨聲后順勢倒地 萬名河南球迷一起國罵

      風(fēng)過鄉(xiāng)
      2026-04-12 12:23:41
      周錫瑋怒批蔣萬安:“解放了自有后來人收拾你!”

      周錫瑋怒批蔣萬安:“解放了自有后來人收拾你!”

      荊楚寰宇文樞
      2026-04-11 23:18:47
      特朗普稱除核問題外,美伊就“大多數(shù)問題達(dá)成一致”

      特朗普稱除核問題外,美伊就“大多數(shù)問題達(dá)成一致”

      界面新聞
      2026-04-12 22:31:02
      浙江一對老夫妻收廢品,在河邊撿到奇特“鐵疙瘩”,果斷上交!民警一查:竟是千年寶貝

      浙江一對老夫妻收廢品,在河邊撿到奇特“鐵疙瘩”,果斷上交!民警一查:竟是千年寶貝

      臺州交通廣播
      2026-04-11 15:00:56
      醫(yī)生告誡:每天睡前玩手機(jī)的人,不用半年時間,睡眠或有這6變化

      醫(yī)生告誡:每天睡前玩手機(jī)的人,不用半年時間,睡眠或有這6變化

      白話電影院
      2026-04-05 15:34:47
      北京男籃83:88輸上海,球員評分:4人及格,1人不及格,2人拉胯

      北京男籃83:88輸上海,球員評分:4人及格,1人不及格,2人拉胯

      梅亭談
      2026-04-12 21:42:56
      為什么你一定會老死?因為你的DNA在故意殺掉你

      為什么你一定會老死?因為你的DNA在故意殺掉你

      半解智士
      2026-04-12 13:31:31
      事實證明,73歲無兒無女的遲重瑞,早已被陳麗華“安排”好了后路

      事實證明,73歲無兒無女的遲重瑞,早已被陳麗華“安排”好了后路

      鄉(xiāng)野小珥
      2026-04-08 17:29:22
      日媒:樊振東事實上已經(jīng)退出中國國乒,這不是飯圈文化逼走的最后一人

      日媒:樊振東事實上已經(jīng)退出中國國乒,這不是飯圈文化逼走的最后一人

      畫夕
      2026-04-12 13:08:52
      前乒乓球世界冠軍何智麗近況,在上海與朋友聚餐,61歲狀態(tài)仍很好

      前乒乓球世界冠軍何智麗近況,在上海與朋友聚餐,61歲狀態(tài)仍很好

      阿訊說天下
      2026-04-10 15:11:12
      醫(yī)療圈炸鍋了:腫瘤診療重大突破

      醫(yī)療圈炸鍋了:腫瘤診療重大突破

      白宸侃片
      2026-04-11 18:40:34
      原來我們都被他騙了?陳坤兒子的生母,其實早在14年前就公開了

      原來我們都被他騙了?陳坤兒子的生母,其實早在14年前就公開了

      凡知
      2026-04-11 19:10:48
      賽季結(jié)束后,廣東男籃9人合同到期,誰會留下?誰會離開?

      賽季結(jié)束后,廣東男籃9人合同到期,誰會留下?誰會離開?

      男足的小球童
      2026-04-11 19:19:57
      風(fēng)向突變,以德為首的西方國家齊發(fā)聲:中國已在換電關(guān)鍵領(lǐng)域崛起

      風(fēng)向突變,以德為首的西方國家齊發(fā)聲:中國已在換電關(guān)鍵領(lǐng)域崛起

      獨舞獨舞
      2026-04-11 18:31:26
      楊怡曬女兒慶生照,6歲小珍珠漂亮似公主,一家四口都是高顏值

      楊怡曬女兒慶生照,6歲小珍珠漂亮似公主,一家四口都是高顏值

      螃蟹吃瓜攤
      2026-04-12 20:35:13
      2026-04-12 23:03:00
      數(shù)字生命卡茲克 incentive-icons
      數(shù)字生命卡茲克
      反復(fù)橫跳于不同的AI領(lǐng)域,努力分享一些很酷的AI干貨
      497文章數(shù) 617關(guān)注度
      往期回顧 全部

      科技要聞

      理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

      頭條要聞

      特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

      頭條要聞

      特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

      體育要聞

      創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

      娛樂要聞

      賭王女兒何超蕸病逝,常年和乳癌斗爭

      財經(jīng)要聞

      美伊談判破裂的三大癥結(jié)

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態(tài)度原創(chuàng)

      教育
      手機(jī)
      家居
      公開課
      軍事航空

      教育要聞

      高中地理必會知識點115條全梳理

      手機(jī)要聞

      曝蘋果已解決iPhone Ultra折疊手機(jī)兩大核心問題

      家居要聞

      復(fù)古風(fēng)格 自然簡約

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議

      無障礙瀏覽 進(jìn)入關(guān)懷版