網易首頁 > 網易號 > 正文申請入駐

CALM模型的黑盒采樣：用碰撞方法實現溫度調節

2026-01-14 21:19:36　來源: deephub

北京舉報

分享至

溫度參數大概是LLM推理中最容易理解的控制手段了。把溫度調低，輸出就更確定、更收斂；調高，模型就更發散、更有"創意"。問題是，這套機制依賴于顯式的logits——而連續自回歸語言模型（CALM）恰恰沒有這東西。

我們在前面CALM框架的介紹中看到，CALM基本上把架構都做過修改，但是唯獨溫度采樣這塊一直沒動。

這時因為模型預測的是無限維空間中的連續向量，根本沒法枚舉所有可能輸出，更別提計算概率了。或者說我們只有一個能吐樣本的黑盒，沒有logits可以縮放，沒有softmax可以操作。

調整token生成分布是語言模型最常用的技術之一操作也足夠簡單直接。

生產環境里幾乎所有LLM部署都離不開溫度采樣——它決定了輸出在創造性和確定性之間的平衡點

傳統做法是在softmax之前對logits做縮放，直接重塑詞匯表上的概率分布。但CALM的輸出空間是連續的、無限的，這條路是走不通，那怎么辦？本文要解決的就是這個問題：只靠抽樣能力，不碰任何概率數值，照樣可以實現溫度控制。

這里介紹的技術補全了CALM工具鏈的最后一塊拼圖，證明連續語言模型在可控性上并不遜于傳統token模型，效率優勢還能保住

溫度參數的工作原理

先快速回顧下經典溫度采樣的機制。設 x_i_ 為第i個token的logit，溫度調整后的概率分布長這樣：

溫度值T的作用很直觀：T < 1時分布變尖銳，概率質量往頭部token集中，適合編程、數學這類需要確定性的場景；T > 1時分布變平坦，尾部token也有更多機會被采到，適合創意寫作、brainstorming。

本質上就是除以一個更大的T會壓縮logit之間的差距，削弱softmax的"贏家通吃"效應，但CALM每一步并不輸出有限詞匯表上的離散分布，自然也就沒有logits向量可供縮放

這就是為什么需要一套完全不依賴似然函數的替代方案。

上圖展示了溫度對分布形狀的影響：左邊低溫，分布尖銳、確定性強；右邊高溫，分布平坦、多樣性高。

只有樣本，沒有概率？照樣能做溫度控制

CALM的生成器就是個黑盒：可以從里面抽樣本，但拿不到概率值也沒有logits。

一個看不見的分布，怎么讓它變尖或變平？

核心思路和經典溫度采樣相同的目標，從溫度調整后的分布中采樣但把直接操作概率的步驟全部換成純采樣操作。具體來說，假設有個基礎采樣器能產生x～P(x)，目標是構造一個新采樣器產生x～PT(x)，且只能用原采樣器反復抽樣這一種手段。

下一步是把溫度采樣重寫成不需要logits的形式，這就是后續所有推導的"起點公式"：

有了這個公式就能在連續生成模態下復刻溫度采樣的效果。

碰撞方法（collision method）提供了基礎框架。但是還有一個重要的問題：1/T不是整數怎么辦？

碰撞技巧的基本原理

先把CALM的采樣適配到溫度控制框架上。這里需要用到碰撞方法：抽取多個獨立樣本，根據它們的匹配情況來間接確定概率。

這里說的"樣本x"是單個CALM解碼步驟產生的整個K-token塊，不是單個token

當 T=1/n（n為正整數）時，溫度調整后的分布正比于 P(x)?

碰撞技巧的數學基礎是獨立性：n次獨立抽樣全部等于同一個塊x的概率恰好是 P(x)n

操作方法就是抽n個樣本，全部相同才接受否則拒絕重來

舉個例子：某個塊的概率是 P(__ x __)=0.2，那三路碰撞的概率就是0.23=0.008

問題在于1/T 一般不是整數，比如沒法抽"3.33個樣本"。而且低溫度情況下拒絕率會很高，比如 T=0.1意味著需要連續10個完全相同的樣本，所以整數部分和小數部分必須分開處理，這就引出了分解策略。

指數分解：拆成整數和小數兩部分

分解策略把指數運算的代數規則映射到概率上，把1/T拆成整數n和小數 α 兩個分量：

整數部分用碰撞方法搞定，小數部分得靠伯努利工廠配合廣義二項級數。

比如 T=0.3，那 1/T=3.33，于是 n=3，α=0.33

整數分量處理起來相對簡單，還是碰撞方法那套。

小數分量就麻煩了，沒法用樣本重復的方法，所以要把問題轉化成無限級數形式。這就是伯努利工廠的用武之地：用只能訪問概率為p的硬幣，"制造"出一個概率為p? 的有偏硬幣。

所謂"概率為p的硬幣"其實就是個匹配指示器：從基礎采樣器抽一個樣本，跟目標x相等就返回成功。這是個伯努利隨機變量（真/假），成功概率等于 p=P(x)

兩部分必須同時滿足，采樣才算有效。

數學上這套東西還是很好解釋的但計算上有個嚴重瓶頸。低溫度的情況下——比如T=0.1——需要連續10個相同樣本。模型可能要跑幾百萬次才出一個有效結果。

批量近似：讓低溫采樣變得可行

作者給出的解法是批量近似。與其等連續n個相同樣本，不如一次性抽一大批樣本（N >> n）然后在里面找重復。

具體操作如下：假設 n=10（即 T=0.1），一次抽 N=200 個樣本統計每個塊出現的次數，出現次數≥10的塊就成為整數部分階段的合格候選

當 N=10、n=2 時，合格候選就是那些在10個樣本里出現至少2次的塊，這可比等連續相同樣本高效多了。

這種做法用一次可并行的批量抽樣替代了反復重啟，低溫情況下的樣本利用率大幅提升。

結合組合數學，低溫和小數分量的問題都有了穩健解法。溫度被正確遷移到隱式分布上，創造性和精確性之間的調節照樣能做，而且根本不需要知道真實分布長什么樣。

這對CALM意味著什么

這套采樣框架補齊了CALM工具鏈，剩下的挑戰主要是工程層面的：讓低溫解碼在實際推理中跑得夠快。批量近似提供了思路——不用反復重啟等碰撞，抽一個大批次然后在里面找，熟悉的創造性?精確性旋鈕就保住了。

這個思路的適用范圍遠不止CALM。任何能采樣但沒法給概率打分（或做歸一化）的隱式生成模型都能復用同樣的原理。

擴散語言模型、流匹配架構同樣適用

另外值得一提的是CALM把自回歸步數降到了原來的 1/K（比如K=4 時就是4倍壓縮），而上面這套采樣框架保住了細粒度的解碼控制，而實用性沒打折扣。

技術貢獻總結

核心創新點在于：不需要概率值也能做溫度控制。方法是把概率重加權P(x)?轉化成一個采樣事件——只在n個獨立抽樣碰撞到同一結果時接受。

數學上的關鍵技巧是把 1/T寫成n+α的形式。整數指數靠碰撞解決，小數指數靠伯努利工廠搞定p?。

工程上的突破是批量近似：一次并行批量加組合分組，取代了低效的反復重啟，低溫解碼終于變得可行。

更廣泛地看，這套方法適用于所有"能采樣但沒法評分歸一化概率"的隱式模型——擴散模型、流匹配等新范式都能用。

https://avoid.overfit.cn/post/e2161ee3e44c4645b1e1f31666edd9b7

作者：Fabio Yá?ez Romero

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

GPT-5.3 Instant上線：ChatGPT終于不說教了

量子位 2026-03-05 14:49:03
6 跟貼 6
ICLR 2026 | PIL：基于線性代理的不可學習樣本生成方法

機器之心Pro 2026-02-24 19:36:33
0 跟貼 0

架構解耦是統一多模態模型所必須的嗎？全新AIA損失：No

機器之心Pro 2025-12-02 14:25:38
0 跟貼 0

GPT-5.4「原生操控電腦」實測封神！OpenClaw天選模型來了

新智元 2026-03-06 10:35:47
39 跟貼 39
FlashAttention-4正式發布：算法流水線大改，矩陣乘法級速度

機器之心Pro 2026-03-06 14:48:35
0 跟貼 0

劍指世界模型！商湯發多模態理解生成一體化架構，無需編碼器“玩轉”圖像

智東西 2026-03-06 20:12:11
0 跟貼 0

這到底什么原理呢

我知百道 2026-03-05 21:14:10
142 跟貼 142
深度長文：無限到底有多大？你敢信無限也有大小之分嗎？

宇宙時空 2026-03-07 14:11:55
0 跟貼 0

你刷到的視頻是真的么？用物理規律拆穿Sora謊言

機器之心Pro 2025-11-05 16:27:02
0 跟貼 0
電動車邊走邊發電的原理

磊子帶你自駕游 2026-03-03 09:42:21
18 跟貼 18
Energy Distance：度量兩個多元分布差異的統計方法

deephub 2026-03-06 20:59:28
6 跟貼 6
兩位女生面對面揮動胳膊，軸承為什么要加鋼珠，原理非常明顯了！

瞇眼的少女 2026-03-05 13:25:30
4 跟貼 4
這是什么原理？一下子從平面變立體了

財經時間官方 2026-03-06 23:29:06
0 跟貼 0
小伙對準地上倒影隨手一噴，立馬變身豪華汽車，這是什么原理？

生活趣聞集 2026-03-07 11:23:43
1 跟貼 1
相隔千里的兩部手機卻能實時通話，這背后的原理究竟是如何做到

搞笑壯漢夫妻 2026-03-07 08:06:15
0 跟貼 0
智商決定收入在這一刻具象化了，網友：這具體是什么原理

先鋒音樂 2026-03-07 11:09:11
3 跟貼 3
這個原理跟做股票差不多

小雯講廢話 2026-03-03 12:52:51
1 跟貼 1
原理好像可行，但總感覺哪里不對勁

龍龍哥搞笑配音 2026-03-06 12:02:40
0 跟貼 0
真金不怕火煉，為啥越燒越亮？原理太簡單！

大超搞笑 2026-03-06 14:02:17
1 跟貼 1
驗鈔機原來這樣工作的，內部構造的拆解，原理一下就看懂了！

酷奇愛搞笑 2026-03-07 13:31:00
1 跟貼 1
美軍無人機蜂群工作原理，太暴躁了！

大國洞察局 2026-03-02 22:56:32
0 跟貼 0
哪個神人設計，這是什么原理，你別說挺方便的！

皮皮怪搞笑 2026-03-07 14:03:21
1 跟貼 1
你認識的所有素數中，大約有一半都不是素數

返樸 2026-03-06 10:26:00
0 跟貼 0
老面制作原理

米糕饅頭哥 2026-03-05 18:25:57
2 跟貼 2
蔚來底盤技術十年蛻變：從黑盒依賴到全球引領

電動知家 2026-03-07 10:33:48
2 跟貼 2
剛下飛機行李就沒了！杭州姑娘花10多萬去南極旅游卻崩潰：衣物全靠借

環球網資訊 2026-03-03 08:53:57
6129 跟貼 6129
想進入量子信息的世界嗎？有高中數學水平就可以開始了！

返樸 2026-03-06 10:27:19
15 跟貼 15
剛剛，Gemini攻克「宇宙弦」終極難題！AI科學家最優雅解法震撼物理學

新智元 2026-03-07 15:29:27
0 跟貼 0
迫擊炮、閃光彈、手雷、詭雷的原理

黑豬跑跑 2026-03-06 08:28:48
1 跟貼 1
今年高校畢業生預計1270萬

人民網-人民日報 2026-03-07 10:36:14
4541 跟貼 4541
山姆1.38公斤冰塊賣37.9元，消費者稱比冰塊融化速度慢，而且顏值高，門店工作人員：銷量不錯，現貨極少

觀威海 2026-03-04 10:39:05
4025 跟貼 4025
4個常見測量血糖的數值分別要怎么看？

陳薇醫生 2026-03-03 12:51:27
0 跟貼 0
17歲高中生用AI解決數學界難題，陶哲軒、Jeff Dean點贊

機器之心Pro 2026-01-26 14:24:45
6 跟貼 6
印度P18要造144垂發巨艦？參數碾壓055背后藏致命缺陷！

安之若憟 2026-03-07 10:54:13
0 跟貼 0
中考數學復習，就怕二次函數難題？中考數學重難點二次函數教會你

艾優數學 2026-03-07 15:58:56
4 跟貼 4
女子在杭州西湖景區把“西泠印社”認成“杜帥冷面”，網友：四個字認錯五個，當事人：沒有文化確實不行

揚子晚報 2026-03-06 17:44:56
997 跟貼 997
發動機模型

制造科技 2026-03-04 18:55:15
0 跟貼 0
高速列車運行藏何奧秘，原理背后科技大揭秘，看完直呼太牛了

趣味加工廠 2026-03-06 00:00:00
0 跟貼 0
初中數學整數小數部分求值

天天數理學習分享 2026-03-04 17:36:26
16 跟貼 16
VGGT4D：無需訓練，挖掘3D基礎模型潛力，實現4D動態場景重建

機器之心Pro 2025-12-17 17:46:42
0 跟貼 0

deephub

CV NLP和數據挖掘知識

1940文章數 1456關注度

往期回顧全部

針對"不敢休、不讓休"怪圈國家出手了

汽車要聞

逃離ICU，上汽通用“止血”企穩

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

本地

數碼

健康

公開課

津南好·四時總相宜
妝藝大游行2026：愿
春花齊放2026：《駿馬奔騰迎新歲》

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

CALM模型的黑盒采樣：用碰撞方法實現溫度調節

OpenClaw爆火，六位"養蝦人"自述與AI共生

中國貨船"鐵娘子"號通過霍爾木茲海峽 大量船舶仍滯留

中國貨船"鐵娘子"號通過霍爾木茲海峽 大量船舶仍滯留

塔圖姆298天走完這段路 只用27分鐘征服這座城

周杰倫田馥甄的“JH戀” 被扒得底朝天

針對"不敢休、不讓休"怪圈 國家出手了

逃離ICU，上汽通用“止血”企穩

態度原創

《圣教序》真跡終于找到！1903字清晰無損

食味印象｜一口入魂！康樂烤肉串起千年絲路香

AI存儲需求進一步增長，三星NAND閃存被曝Q2將繼續漲價

轉頭就暈的耳石癥，能開車上班嗎？

中國貨船"鐵娘子"號通過霍爾木茲海峽大量船舶仍滯留

中國貨船"鐵娘子"號通過霍爾木茲海峽大量船舶仍滯留

塔圖姆298天走完這段路只用27分鐘征服這座城

針對"不敢休、不讓休"怪圈國家出手了