在AI領(lǐng)域一路高歌猛進(jìn)的NVIDIA,在CES 2026上也沒有忘記將注意力放在游戲上。黃仁勛CES 2026特別演講過后,筆者有幸參觀了GeForce RTX新技術(shù)展示區(qū),一整套游戲新技術(shù)組合拳著實(shí)帶勁,比如DLSS 4.5動態(tài)多幀生成最高可以將幀率提升6倍,G-SYNC Pulsar顯示器也終于蓄勢待發(fā),圍繞RTX AI PC構(gòu)建出的創(chuàng)作生態(tài)也展現(xiàn)出了全新可能,趁著現(xiàn)場體驗(yàn),不妨讓我們直觀的感受一下GeForce RTX給PC帶來的更多可能性。
![]()
DLSS 4.5:游戲幀率暴增6倍
DLSS 4.5帶來的最重要的更新之一是第二代Transformer和DLSS 4.5 超分辨率模型。它的工作方式在AI服務(wù)器集群上將畫質(zhì)訓(xùn)練提升至16K分辨率下開啟路徑追蹤畫質(zhì)作為最終參考幀,針對游戲新增700+小時的錄像訓(xùn)練,并重點(diǎn)采集高運(yùn)動、高對比、粒子密集的場景,確保畫質(zhì)提升有更多可能性。
![]()
同時DLSS 4.5也首次引入大模型訓(xùn)練中常見的反向標(biāo)注方式,通過人工和AI的方式找到原來模型訓(xùn)練中鬼影、撕裂、閃爍的反向樣本,然后針對性進(jìn)行訓(xùn)練,以避免DLSS開啟后可能產(chǎn)生的不真實(shí)感。
這些DLSS 4.5的訓(xùn)練都是在H100上通過FP8精度訓(xùn)練超過六周完成的。由于FP8只能在Blackwell,也就是GeForce RTX 50系列GPU上實(shí)現(xiàn),GeForce RTX 40以前的GPU在運(yùn)行DLSS 4.5的時候則會使用FP16完成,在畫質(zhì)相同的前提下,GeForce RTX 50系列無疑更有優(yōu)勢。
![]()
在幀生成過程中,Transformer 模型會把前后4幀的運(yùn)動矢量、深度、粗糙輻照度一起送進(jìn)注意力,提前預(yù)測遮擋,進(jìn)而將鬼影可能性降低42%。同時還會在1/4分辨率下運(yùn)行一次邊緣檢測,進(jìn)而補(bǔ)償幾何邊緣可能出現(xiàn)的損失,讓抗鋸齒AA質(zhì)量提升0.8 dB LPIPS。與此同時,粒子/透明支路有所增強(qiáng),避免火焰、雨水、UI因?yàn)殚_啟DLSS之后被抹掉,最顯著的例子就是火焰迸發(fā)出的火星得意保留。
在提前溝通會上,NVIDIA展示了《心靈殺手Remastered》手電筒高速會動時候殘影情況,原本會出現(xiàn)至少3層殘影的手電筒光照現(xiàn)在降低到了1層。《天國:拯救2》中木紋桌面上的抖動完全靜止。《奪寶奇兵:古老之圈》中鐵欄的斷裂情況概率顯著降低。
![]()
![]()
即將發(fā)布的《影之刃零》也同樣會在新技術(shù)中受益,由于《影之刃零》注重細(xì)膩的雨水渲染場景氣氛,傳統(tǒng)方式會模糊雨滴的細(xì)節(jié),讓畫面產(chǎn)生模糊感,DLSS 4.5中的第二代Transformer 模型很好解決了這個問題,在大幅提升幀率的同時,還能獲得更為細(xì)膩和清晰的沉浸感,顯然也是玩家最愿意見到的。
![]()
得益于FP8加持,第二代Transformer模型可以幫助Blackwell GPU在不增加任何能耗的前提下提升相應(yīng)速度,例如140W GeForce RTX 5080 Laptop GPU筆記本獲得更好的畫質(zhì)和幀率后,功耗沒有任何提升。
在這個基礎(chǔ)上,引入6x的Dynamic Multi-Frame Generation動態(tài)多幀生成變得順理成章。以往的幀生成是按照原生幀和生成幀的固定比例完成的,比如DLSS 3的1:1,即1幀原幀,1幀生成幀,DLSS 4的1:3,即1幀原幀,3幀生成幀。在動態(tài)多幀生成下,幀生成變成了0-5幀隨機(jī)調(diào)整,這樣做的目的是讓幀生成永遠(yuǎn)吃滿顯示器VRR上限。
![]()
比如顯示器有240Hz刷新率,那么動態(tài)多幀生成就會泡在240FPS,沒必要運(yùn)算出更多的幀率,即浪費(fèi)GPU資源,還增加系統(tǒng)延遲。
NVIDIA在啟動中埋入了2ms為單位的檢測動作,即每2ms查看GPU占用率,幀時間抖動情況,顯示器實(shí)時刷新率,根據(jù)實(shí)際情況做出調(diào)整。根據(jù)這三個變量實(shí)時調(diào)整,在16.7ms內(nèi)就能完成0到5幀生成的來回切換,做到6x動態(tài)多幀生成。
![]()
配合第二代Transformer,幀生成會先做1/4分辨率的全局運(yùn)動判斷,然后向上逆采樣,進(jìn)而節(jié)省顯存帶寬。在技術(shù)上還增加了遮擋置信圖,主要是防止UI、十字準(zhǔn)心、血條在幀生成狀態(tài)下閃爍的問題。
在現(xiàn)場《黑神話:悟空》體驗(yàn)中,最高特效開啟DLSS 4.5后,會自動將游戲幀率匹配到4K 240Hz顯示器的上限,可以看到右側(cè)成功開啟了6x多幀生成,且系統(tǒng)延遲沒有降低。將幀率維持在顯示器上限另一個好處就是不會浪費(fèi)額外幀率計(jì)算的功耗,對于節(jié)能而言更有效果。
![]()
事實(shí)上現(xiàn)場展示的GeForce RTX 50系列Laptop GPU就使用了類似的結(jié)束,在《賽博朋克2077》中,開啟DLSS 4.5不僅獲得了更好的畫質(zhì),同時也沒有超額消耗GPU資源,能夠確保筆記本更容易低發(fā)熱、風(fēng)扇安靜的前提下運(yùn)行。
![]()
G-SYNC Pulsar蓄勢待發(fā)
NVIDIA G-SYNC Pulsar定位高端電競顯示器認(rèn)證,即把NVIDIA G-SYNC算法和協(xié)議一次性做到27英寸電競顯示器中,從而獲得360Hz高刷、1000Hz感知運(yùn)動清晰度,提供環(huán)境光感應(yīng),并且能夠直接檢測Reflex延遲。首發(fā)的四款產(chǎn)品型號包括:
– AOC AGON PRO AG276QSG2
– Acer Predator XB273U F5
– ASUS ROG STRIX XG27AQNGV
– MSI MPG 272QRF X36
![]()
不過NVIDIA G-SYNC Pulsar顯示器并非第一次發(fā)布,此前NVIDIA已經(jīng)公布了技術(shù)白皮書和Project Pulsar計(jì)劃,這次G-SYNC Pulsar顯示器終于算是開售,并與時俱進(jìn)增加Ambient Adaptive環(huán)境光傳感器、Reflex Analyzer USB-C等細(xì)節(jié)。
現(xiàn)場用《守望先鋒2》和《紀(jì)元117:羅馬和平》進(jìn)行了對比。由于NVIDIA G-SYNC Pulsar顯示器可變頻率背光頻閃技術(shù),實(shí)現(xiàn)超過1000Hz的有效動態(tài)清晰度,大幅提升動態(tài)畫面的清晰度和可見性,即使是同樣的幀率,仍然可以直觀感受到G-SYNC Pulsar有著更為明顯的清晰度,敵人和畫面移動更為清晰流暢。
![]()
![]()
RTX Remix Logic:一步到位加個氛圍
RTX Remix的使用邏輯是在原游戲的基礎(chǔ)上,通過全局替換的方式給經(jīng)典老游戲換上高清材質(zhì)、模型和光追效果。RTX Remix Logic則是更進(jìn)一步,相當(dāng)于在渲染管線上增加了一條無代碼的事件總線,讓游戲畫面可以隨著游戲中的變量,比如主角血條、關(guān)卡、開關(guān)、NPC狀態(tài)等隨時變換,這些動作在RTX Remix上都是需要創(chuàng)作者手動一個一個調(diào)整的,現(xiàn)在可以一步到位了。
![]()
這個過程的實(shí)現(xiàn)原理是Remix Runtime把DirectX 8和DirectX 9 Draw Call攔截到USD場景圖中,將超過30種游戲事件注冊成命名信號,隨后依靠邏輯層Node-Graph UI綁定到超過900種圖形參數(shù)中做匹配。比如天氣中的體積霧密度、散射顏色,材質(zhì)的粗糙度、自發(fā)光強(qiáng)度,后處理中的曝光、色散、暗角等。
最后RTX Remix Logic可以在渲染層將節(jié)點(diǎn)編譯成USD層棧,實(shí)時Hot-Reload,0.3 ms內(nèi)完成切換,無需重啟關(guān)卡,對于Modder而言,所見即所得的游戲重置體驗(yàn),五一是很酸爽的。
![]()
這意味著整個過程中,創(chuàng)作者即使不會C++語言,Modder也能做到隨著劇情需要切換光追天氣變化,并且創(chuàng)作節(jié)點(diǎn)可以隨時復(fù)用,可以直接將RTX Remix Logic的文件復(fù)制給其他游戲關(guān)卡或者游戲,實(shí)現(xiàn)同樣的效果。在SDK的生態(tài)中,社區(qū)已經(jīng)準(zhǔn)備好了Blender和Substance插件,這個過程可以一鍵導(dǎo)入。
NVIDIA計(jì)劃將RTX Remix Logic在1月份的Remix 2025.1 SDK中添加,并且已經(jīng)給50位《半衰期2 RTX》創(chuàng)作者提前內(nèi)測,后續(xù)會在GitHub中同步開源示例節(jié)點(diǎn)圖。NVIDIA在現(xiàn)場也提供了《半衰期2 RTX》演示DEMO,比如推開門后檢測到事件,游戲環(huán)境中的體積霧、冷色調(diào)體積光線、落葉粒子瞬間切換到冬季預(yù)設(shè)。
![]()
游戲中敵人靠近但尚未進(jìn)入主角視野,也會出發(fā)隱藏?cái)橙耸录琑TX Remix Logic隨即做出對應(yīng)的Paranoia濾鏡效果,包括脈沖暗角、色差強(qiáng)度隨距離線性提升,UI血條邊緣同步閃爍。
![]()
當(dāng)玩家在《半衰期2 RTX》游戲中啟動機(jī)器,引發(fā)MachineActivate事件,時間軸節(jié)點(diǎn)依次拉高粒子速率、屏幕泛白、最終核爆閃屏,敵人角色被同步消滅的著色器也隨之被觸發(fā)。
![]()
RTX AI:3分鐘內(nèi)生成4K視頻
NVIDIA ACE也迎來了全面升級,可以在本地運(yùn)行14B大模型,并且支持RAG檢索實(shí)時獨(dú)擋。整個功能鏈路在本地實(shí)現(xiàn),無需聯(lián)網(wǎng),但需要6GB的常駐顯存,如果后期使用FP4量化之后,可以壓縮到3.8GB左右。
NVIDIA ACE可以做到根據(jù)游戲?qū)崟r狀態(tài)進(jìn)行RAG檢索,以現(xiàn)場展示的《全面戰(zhàn)爭:法老》為例,新版的NVIDIA ACE會把每個回合中的經(jīng)濟(jì)、外交、兵力、科技樹情況導(dǎo)入向量庫進(jìn)行判斷,整個過程只需要80ms不到的延遲。
![]()
比如玩家問游戲中為什么忽然產(chǎn)生叛亂,NVIDIA ACE主導(dǎo)的游戲顧問會以自然語言的形式總結(jié)原因,并且提供對應(yīng)的決策。或者玩家提出下一步的方向,讓游戲顧問根據(jù)玩家希望的方向指定游戲中的策略,確保游戲順利進(jìn)行。有意思的是,NVIDIA ACE還可以根據(jù)游戲場景切換到不同的角色,比如在扮演埃及國王的時候,游戲顧問是埃及祭司,還會發(fā)出法老腔音色給游戲產(chǎn)生沉浸感。
![]()
這一套NVIDIA ACE至少需要GeForce RTX 4070 8GB以上的顯存才能進(jìn)行,NVIDIA也推薦12GB顯存以上保證游戲體驗(yàn)。首發(fā)將支持中文、英語、日語和德語,后續(xù)語種會在2026 Q2后追加。
![]()
隨著NVFP4和NVFP8量化付諸實(shí)踐,模型體積還可以降低60%,顯存需求也同步降低40%到60%,并且支持Tensor Core原生指令,不再依賴于Hopper或者Blackwell GPU中的專屬硬件,這也是NVIDIA近期技術(shù)發(fā)展趨勢之一。
在現(xiàn)場NVIDIA展示通過PyTorch-CUDA形式將FLUX.1生成速度提升3.7倍,并且在顯存用滿之后,自動切換到DDR5內(nèi)存,F(xiàn)LUX.2 87GB在本地AI PC上完成4K圖生圖也完全沒有問題。
![]()
NVIDIA描述了這一套升級組合拳帶來的可能性,創(chuàng)作者可以通過文本Qwen SLM直接生場景描述,然后利用Trellis 3D建立基礎(chǔ)模型并通過Blender手動調(diào)整需要的擺放位置。隨后通過FLUX Image直接完成4K起始幀和結(jié)束幀。并通過LTX-2模型完成720p的視頻輸出,最后通過RTX Video Super-Resolution將視頻分辨率提升至4K。
![]()
如果通過GeForce RTX 4090在FP 16上運(yùn)行,上述一套工作至少需要8分鐘,但通過GeForce RTX 5090 FP4,現(xiàn)在只需要3分鐘就能完成了。NVIDIA表示FLUX.1/2 NVFP4、LTX-2模型會在發(fā)布活動結(jié)束后同步在HuggingFace 和ComfyUI上線,RTX 視頻超分辨率則會在2月份融入到ComfyUI中。
重點(diǎn)是這一套功能都是免費(fèi)的,所有功能都是基于GeForce RTX 50系列GPU實(shí)現(xiàn),從而獲得效率最大化。
![]()
DGX Spark:性能瞬秒M4 MAX
在演示現(xiàn)場,我們也看到了近期剛剛開賣的NVIDIA DGX Spark。
NVIDIA將DGX Spark定位一款緊湊型 AI 超級計(jì)算機(jī),它可以獨(dú)立使用,也可以作為家用服務(wù)器中的一員,通過PC、MAC或者其他設(shè)備訪問使用,定制化Linus平臺意味著對模型的廣闊兼容性,也使得家里任何設(shè)備都有機(jī)會擁有AI加速的超級算力。
![]()
在CES 2026上,NVIDIA發(fā)布了Spark的重大AI性能更新,使其相較于不到三個月前首次發(fā)布時,最高可獲得高達(dá)2.6倍的性能提升。在展示區(qū),工作人員通過使用旗艦款MacBook Pro M4 MAX筆記本與NVIDIA DGX Spark進(jìn)行性能比較。
通過ComfyUI動態(tài)調(diào)節(jié)一段4K高清視頻,將視頻中的綠色跑車調(diào)成紅色。兩者同時開始運(yùn)行。NVIDIA DGX Spark利用NVFP4的優(yōu)勢在數(shù)秒內(nèi)就完成了顏色切換,同樣的操作在頂配的MacBook Pro M4 MAX上運(yùn)行超過三分鐘,差距非常大。
![]()
有意思的是,現(xiàn)場展示的NVIDIA DGX Spark利用旁邊的MacBook Pro即可直接訪問,省略大量的調(diào)試和部署成本,足以一窺Spark的便利性。
![]()
無論是將14B模型的NVIDIA ACE塞入游戲顧問中,讓游戲體驗(yàn)獲得深入的一對一指導(dǎo),再或者3分鐘內(nèi)從無到有生成一整套高規(guī)格的4K視頻,不發(fā)布任何新硬件的前提下,GeForce RTX 50系列的AI含金量依然在持續(xù)提升。
![]()
![]()
對于N卡用戶而言,軟件和技術(shù)的免費(fèi)升級也已經(jīng)成為日常顯卡增值的一部分,雖然CES 2026沒有發(fā)布新款的消費(fèi)級GPU,但一波迅猛的軟件升級,對于已經(jīng)配好GeForce RTX 50系列AI PC的同學(xué)而言,顯然已經(jīng)賺翻了。
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.