你有沒有想過,電影院、家庭影院銀幕上為什么會出現(xiàn)色彩鮮艷、圖像清晰逼真的電影畫面?電視機(jī)、電腦顯示器為什么能顯示出照片和游戲、視頻?
![]()
而這些視頻、圖像居然只需要一條HDMI信號線就能傳輸過去。
我們在聊8K硬盤播放機(jī)時(shí)候,經(jīng)常提到一些新的視頻編碼格式,比如AV1、AVS3、H.265、VP9等,以及存在已久的BDMV、ISO、MKV、TS等常見媒體封裝格式。
它們是什么意思呢?
![]()
說來話長,事情要從20 世紀(jì) 80 年代講起。
1、存儲危急
當(dāng)時(shí)計(jì)算機(jī)剛進(jìn)入商用領(lǐng)域,卻面臨致命瓶頸:一張 256 色的 512×512 像素圖像,未經(jīng)壓縮需占用 256KB 存儲空間 —— 這相當(dāng)于當(dāng)時(shí)主流軟盤容量的 1/4;美國國家航空航天局(NASA)更頭疼:衛(wèi)星傳回的一張遙感圖像原始數(shù)據(jù)達(dá)數(shù)十MB,當(dāng)時(shí)的硬盤根本無法承載。
現(xiàn)在感覺幾十MB好像非常小,手機(jī)隨便拍個(gè)照片可能都要十幾MB,手機(jī)存儲空間都有1TB的了,二十年前都不敢。比如二十多年前我用這個(gè)普拉斯版軟盤,它的整體容量是也只有可憐的2MB……
![]()
![]()
配套的軟驅(qū)已經(jīng)沒有用武之地了,它來自1999年……
1999年過去了,我很懷念它。所以必須找到壓縮圖像的方法,否則數(shù)字圖像技術(shù)就是空談。
1986 年,ISO(國際標(biāo)準(zhǔn)化組織)與 IEC(國際電工委員會)聯(lián)合成立 JPEG 工作組,集結(jié)了 IBM、AT&T、富士通等12家企業(yè)的工程師,目標(biāo)是制定通用靜態(tài)圖像壓縮標(biāo)準(zhǔn)。這場任務(wù)被業(yè)內(nèi)戲稱為 “給數(shù)字圖像減肥”,卻沒人料到會引發(fā)持續(xù)十年的技術(shù)混戰(zhàn)。
2、路線問題
工作組剛成立就分裂成兩派:一派主張采用 “預(yù)測編碼”,以日本富士通為代表,算法簡單但壓縮率低;另一派力推 “離散余弦變換(DCT)”,由 IBM 工程師威拉德?博伊爾牽頭,理論壓縮率可達(dá) 10:1,但計(jì)算復(fù)雜度極高。
爭議焦點(diǎn)集中在 “實(shí)用性” 上。1987 年的工作組會議上,富士通代表當(dāng)眾質(zhì)疑:“DCT 算法需要大型計(jì)算機(jī)才能運(yùn)行,普通 PC 根本扛不住,這是實(shí)驗(yàn)室里的奢侈品!”
博伊爾團(tuán)隊(duì)沒有爭辯,而是帶來一臺改裝的 IBM PC/AT—— 他們用匯編語言重寫核心代碼,將一張 1MB 的風(fēng)景圖壓縮至 100KB,解壓后畫質(zhì)幾乎無差異。現(xiàn)場演示讓反對聲瞬間沉默,DCT 算法就此成為 JPEG 的技術(shù)核心。
這場勝利背后藏著更深遠(yuǎn)的布局:AT&T 實(shí)驗(yàn)室早已為DCT算法申請專利,卻承諾向 JPEG 標(biāo)準(zhǔn)免費(fèi)授權(quán) —— 其真正目的是通過標(biāo)準(zhǔn)壟斷后續(xù)硬件市場,這為后來視頻編碼的專利博弈埋下伏筆。
3、改變世界的 “.jpg”
1992 年,JPEG 標(biāo)準(zhǔn)正式發(fā)布,將圖像壓縮率穩(wěn)定在 5:1 至 20:1 之間,一張 10MB 的原始圖像可壓縮至 500KB 以內(nèi)。更關(guān)鍵的是,它首次實(shí)現(xiàn) “有損壓縮” 的智能權(quán)衡:通過忽略人眼不敏感的高頻色彩信息,在體積與畫質(zhì)間找到黃金平衡點(diǎn)。
標(biāo)準(zhǔn)落地瞬間引發(fā)產(chǎn)業(yè)地震:柯達(dá)相機(jī)率先支持 JPEG 格式,銷量半年內(nèi)翻倍;NASA 的遙感圖像傳輸效率提升 10 倍,火星探測計(jì)劃因此提前兩年啟動;互聯(lián)網(wǎng)雛形 ARPANET 上,JPEG 圖片占比從不足 1% 飆升至 35%。
“JPEG 不僅是個(gè)標(biāo)準(zhǔn),更是數(shù)字圖像的通行證。” 博伊爾在 1994 年接受采訪時(shí)說,他或許沒料到,自己研發(fā)的 DCT 算法會成為未來30年視頻編碼的技術(shù)基石。
![]()
4、從圖像到視頻
1988 年,就在 JPEG 即將定稿時(shí),ISO意識到:視頻本質(zhì)是 “連續(xù)的靜態(tài)圖像”,JPEG 的 DCT 算法完全可復(fù)用。于是 MPEG 工作組應(yīng)運(yùn)而生,目標(biāo)是制定視頻壓縮標(biāo)準(zhǔn)。
MPEG-1 標(biāo)準(zhǔn)(1993 年發(fā)布)的核心創(chuàng)新,就是在 JPEG 基礎(chǔ)上增加 “運(yùn)動估計(jì)” 模塊:通過對比相鄰幀的差異,只編碼變化部分,壓縮效率較單純的 JPEG 序列提升 3 倍。這個(gè) “靜態(tài)壓縮 + 運(yùn)動補(bǔ)償” 的組合,正是 H.261、H.264 等后續(xù)視頻標(biāo)準(zhǔn)的底層邏輯 —— 可以說,沒有 JPEG 的 DCT 算法,就沒有現(xiàn)代視頻編碼的誕生。
JPEG 的成功讓歐美企業(yè)嘗到 “標(biāo)準(zhǔn)壟斷” 的甜頭。盡管 JPEG 本身的核心專利免費(fèi),但配套的硬件解碼芯片被 IBM、德州儀器壟斷。90 年代末,中國彩電企業(yè)想支持 JPEG 顯示功能,每臺電視需額外支付 5 美元芯片專利費(fèi),這與后來 DVD 的18美元 “贖金” 如出一轍。
更隱蔽的是,JPEG 工作組在制定標(biāo)準(zhǔn)時(shí),故意預(yù)留了 “專利兼容接口”。2000 年 JPEG 2000 推出時(shí),歐美企業(yè)突然宣布:新格式的核心 “小波變換” 算法涉及 237 項(xiàng)專利,使用需繳納每臺設(shè)備 2 美元的授權(quán)費(fèi)。
這個(gè)舉動為H.265的專利混戰(zhàn)埋下了種子。
5、內(nèi)訌
2000 年,JPEG 工作組推出升級版 JPEG 2000,壓縮效率比 JPEG 提升 50%,還支持無損壓縮。但這場技術(shù)升級卻成了 “自殺式進(jìn)攻”:一方面,其編解碼速度僅為 JPEG 的 1/3,當(dāng)時(shí)的手機(jī)、相機(jī)根本無法適配;另一方面,專利費(fèi)分成引發(fā)內(nèi)訌 ——10 家企業(yè)各自成立專利池,收費(fèi)標(biāo)準(zhǔn)從每臺 1 美元到 5 美元不等,廠商根本不敢用。
最終,這個(gè)被工程師們追捧的 “技術(shù)優(yōu)等生”,僅在數(shù)字影院、火星探測等小眾領(lǐng)域存活。這場失敗印證了一個(gè)真理:技術(shù)再先進(jìn),若脫離產(chǎn)業(yè)實(shí)際,終將被市場拋棄,這與后來紅極一時(shí)的FLV因Flash衰落的命運(yùn)驚人相似(好像只有80后才懂)。
當(dāng)時(shí)央視推出一個(gè)叫《快樂驛站》的節(jié)目,很多春晚經(jīng)典小品都被做成Flash動畫,令人耳目一新。
![]()
6、中國如何破局?
2002 年DVD專利案暴發(fā)時(shí),來自中國的工程師突然發(fā)現(xiàn),JPEG 開創(chuàng)的 “DCT + 專利授權(quán)” 模式早已被歐美企業(yè)復(fù)制到視頻領(lǐng)域。AVS 工作組成立后,高文院士團(tuán)隊(duì)的第一個(gè)突破,就是在JPEG的DCT算法基礎(chǔ)上,發(fā)明 “整數(shù)變換” 技術(shù),這樣既保留了壓縮效率,又可以彎道超車,避開歐美專利。
2006年AVS1標(biāo)準(zhǔn)發(fā)布時(shí),專利費(fèi)定為每臺設(shè)備1元人民幣,僅為 JPEG 2000的1/14。
更巧妙的是,AVS3 標(biāo)準(zhǔn)中,團(tuán)隊(duì)將 JPEG 2000 的 “小波變換” 與 DCT 結(jié)合,創(chuàng)造出 “混合變換” 算法,壓縮效率比 H.265 再提升30%—— 這是對 JPEG 技術(shù)的繼承與超越。
7、4K~8K時(shí)代
JPEG用DCT算法打開了編碼世界的大門,而MPEG團(tuán)隊(duì)則沿著這條路,將靜態(tài)壓縮升級為動態(tài)編碼。1993年MPEG-1與JPEG 同時(shí)落地,前者成為 VCD的核心(還是80后才懂……),后者統(tǒng)治圖像領(lǐng)域 —— 兩條線索最終在H.264身上交匯。
H.264(AVC)于2003年由 ITU-T 與 ISO 聯(lián)合研發(fā),壓縮效率較前代提升 50%,基本是目前最常見的編碼,不過AVC不支持8K分辨率,它一般會封裝成mp4格式(比如“大姐姐.mp4”這種文件形式)。
H.265(HEVC)則是在2013年推出,支持4K/8K,但因?qū)@鞈?zhàn)(3個(gè)專利池收費(fèi)),未來會怎么樣還不好說,老蝸牛不敢妄加推斷。
2013 年谷歌推出了VP9開源編碼,性能比肩 H.265,不過只為了適配 Chrome和Android生態(tài),感覺難成大器。
2018 年AOM聯(lián)盟(谷歌、Netflix等)推出了一種勢頭強(qiáng)勁的開源編碼AV1,壓縮效率超過H.265而且還免專利費(fèi),經(jīng)常會用MKV封裝,發(fā)布在網(wǎng)絡(luò)視頻平臺,國外的禁止訪問就不說了,國內(nèi)的B站等可以看到。
![]()
作為開源編碼,AV1在同等畫質(zhì)下碼率比H.264(AVC)降低約50%,比 H.265(HEVC)降低約30%。例如,8K 60fps 視頻的AV1碼率可低至 10Mbps以下。
需要注意的是,用電腦播放的話,硬解AV1 需較新的 GPU 或核顯,比如Intel 11代及以上核顯(UHD 700 系、Iris Xe)、Arc A 系列獨(dú)顯;AMD RX 6000 系(除 6500XT)、RX 7000 系;NVIDIA RTX 30/40 系;Apple M4 芯片。 軟解解碼8K AV1的話,對CPU性能要求比較高,而且你會發(fā)現(xiàn)風(fēng)扇開始加速旋轉(zhuǎn),功耗顯著增加。
而新款專業(yè)的硬盤播放機(jī)反而比性能更強(qiáng)的普通PC更能流暢播放(畢竟術(shù)業(yè)有專攻),被動散熱片就可以輕松壓制。
![]()
當(dāng)然視頻編碼技術(shù)不僅僅是這些,還有很多影響力不是很大的,或者曇花一現(xiàn)的五花八門各種格式,普通家庭影院玩家和他們應(yīng)該也沒有什么交集,就不展開說了。
![]()
我們最常見的1080P藍(lán)光原盤ISO或BDMV里封裝的一般是H.264(AVC),一小部分是微軟主導(dǎo)的基于WMV9升級而來的VC-1,壓縮效率與H.264 接近,但解碼兼容性較弱,因?qū)@跈?quán)費(fèi)比較高,2013年后被 H.264全面取代。
2015年4K藍(lán)光標(biāo)準(zhǔn)發(fā)布后,H.265(HEVC)成為唯一法定編碼.4K 視頻分辨率是1080P的4倍,原始數(shù)據(jù)量達(dá)每秒1GB以上。H.265 通過64×64 可變編碼單元(H.264 僅16×16固定單元)實(shí)現(xiàn)更高壓縮效率,相同畫質(zhì)下碼率僅為H.264的50%。
借助 H.265 技術(shù),一部2小時(shí)的4K影片可壓縮到50GB(雙層藍(lán)光碟容量),而H.264 編碼需要100GB以上,目前的藍(lán)光碟片裝不下。
![]()
以上基本就是數(shù)字視頻信號編碼格式的演變簡史了,我覺得未來短時(shí)間內(nèi)AV1會成為主流8K視頻編碼標(biāo)準(zhǔn)。
但是只要三體人還沒打過來,技術(shù)就不會停滯,未來肯定還會有更好、更強(qiáng)大的視頻編碼技術(shù),也許是AV2,或者H.266……
至于媒體封裝格式,那又是另外一個(gè)故事了(有興趣的話可以留言,我們下次繼續(xù)說)。不管怎么樣,只要可以盡情地看電影就好,最后祝你玩得愉快。
免責(zé)聲明:文中大部分資料搜集自網(wǎng)絡(luò),如有謬誤歡迎批評指正,本頁面采用的相關(guān)圖文素材均來自公知平臺,未進(jìn)行版權(quán)審核,如存在侵權(quán)嫌疑,請權(quán)屬方及時(shí)提示,便于我們修正處理。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.