![]()

大約30年來,JPEG一直是萬維網(wǎng)的主要圖像格式。不過,網(wǎng)絡(luò)誕生之初所采用的圖像格式并不是JPEG。事實上,第一個主流圖像瀏覽器NCSA Mosaic最初并不支持嵌入式JPEG文件,只支持嵌入式GIF以及其他一些已經(jīng)被遺忘的格式。無論如何,相比被其取代的格式,JPEG有許多優(yōu)點。
![]()
盡管JPEG沒有隨著網(wǎng)絡(luò)瀏覽器一起出現(xiàn)(JPEG正式發(fā)布兩年后的1994年,使用JPEG標準的圖像才首次出現(xiàn)在了網(wǎng)景瀏覽器中),但JPEG和網(wǎng)絡(luò)瀏覽器還是自然而然地結(jié)合了起來。JPEG文件的圖像退化過程比GIF文件更優(yōu)雅,能夠保留圖片的更多原始形態(tài)。這種特性使其實現(xiàn)了更廣泛的成功應(yīng)用。雖然JPEG不能制作動畫,但它從使用調(diào)制解調(diào)器上網(wǎng)時代緩慢加載的格式起步,逐步發(fā)展成為足以用于高端專業(yè)攝影的圖像格式。
就互聯(lián)網(wǎng)的目的而言,雖然圖片退化很重要,但它并非JPEG在數(shù)字世界中實現(xiàn)巨大價值的唯一因素。還有一個重要的原因是,它是由眾多貢獻者共同構(gòu)建的文檔化標準。

想知道JPEG作為標準有多重要?可以先聽一個故事。
在史蒂夫·威爾海特(Steve Wilhite)因創(chuàng)造GIF格式而獲獎之前,2013年他接受了《紐約時報》的采訪,隨后無意中卷入了一場辯論。
簡單地說,就是沒有人知道他所倡導(dǎo)的圖像格式(Graphics Interchange Format)的首字母縮略詞怎么發(fā)音。他嘗試利用這個機會做出解釋:它的發(fā)音就像花生醬品牌,“是一個柔和的‘G’,讀作‘jif’,就是這樣。”他說。
當(dāng)時,我把威爾海特的這句話發(fā)布在了我很受歡迎的Tumblr頁面上,當(dāng)時這家社交媒體網(wǎng)站是應(yīng)用GIF的熱門網(wǎng)站。不久之后,我的帖子被轉(zhuǎn)發(fā)了數(shù)千次,幾乎所有的人都不同意威爾海特的觀點。很快,威爾海特的這句話成為了一個表情包。
這一插曲凸顯了一個事實,那就是,2022年去世的威爾海特并沒有通過正式的委員會機制發(fā)展他所創(chuàng)造的格式。1987年,他作為CompuServe的員工接手了這個項目,然后他創(chuàng)造了這種格式,僅此而已。他可以說它應(yīng)該讀作“jif”,因為這是他創(chuàng)造的。介紹其工作原理的初始文檔也非常簡單。38年過去了,我們還在使用GIF,但它從來沒有像JPEG那樣出名過。
大約5年后,JPEG正式出現(xiàn),該格式在很大程度上并不是由某一個人開發(fā)的。實際上,這是事實標準和實際標準之間的區(qū)別。事實證明,這對它最終的普及至關(guān)重要。

聯(lián)合圖像專家組(Joint Photographic Experts Group)與數(shù)十個利益相關(guān)者一起合作,目標是創(chuàng)造一種符合每個人需求的格式。確切地說,該格式的名稱是設(shè)計該格式的委員會的首字母縮寫。1992年,這種格式最終面世時,有一本600多頁的書以此為主題,這本書令人驚艷的封面展示了同一張JPEG圖片的一系列版本。
由IBM員工與JPEG組織利益相關(guān)者威廉姆·B.彭內(nèi)貝克(William B. Pennebaker)和瓊· L.米切爾(Joan L. Mitchell)撰寫的《JPEG:靜態(tài)圖像數(shù)據(jù)壓縮標準》(JPEG: Still Image Data Compression Standard,施普林格出版社,1992年)一書介紹了由于缺乏一種方法來平衡對圖像逼真度和即時性的需求,因此造成的多媒體圖像發(fā)展受限制的現(xiàn)象。他們認為,標準化可以解決這個問題。“問題不在于缺乏圖像壓縮的算法(因為該領(lǐng)域已經(jīng)有很悠久的技術(shù)工作歷史了),”作者寫道,“而是缺乏一個標準算法,一個允許在不同的應(yīng)用程序之間交換圖像的算法。”
他們的想法是正確的。30多年來,JPEG實現(xiàn)了高質(zhì)量、高分辨率圖片在操作系統(tǒng)中的廣泛應(yīng)用。盡管我們不再需要對JPEG進行極限壓縮,但這種能力正是現(xiàn)代互聯(lián)網(wǎng)發(fā)展不可或缺的推動力。
正如書中所述,米切爾和彭內(nèi)貝克得到了IBM的支持,得以跟蹤這項研究并與JPEG委員會合作。憑借這種支持,他們開發(fā)了許多JPEG格式的基礎(chǔ)專利。米切爾、彭內(nèi)貝克和兩位同事在1988年提交的專利文件中介紹了IBM以及美國電話電報公司(AT&T)和佳能等JPEG標準委員會的其他成員開發(fā)的方法,這些方法使用了壓縮技術(shù),從而使得高質(zhì)量圖像在受限環(huán)境下更易于傳輸。
![]()
委員會的每個成員都有自己的需求。顯然,佳能更注重打印機和攝影,而美國電話電報公司主要對數(shù)據(jù)傳輸感興趣。這些公司共同努力,形成了一個經(jīng)得起時間考驗的標準。
有趣的是,這一切意味著,能夠使用JPEG壓縮的程序最早并沒有出現(xiàn)在mac OS或Windows中,而是出現(xiàn)在了米切爾和彭內(nèi)貝克所屬的IBM公司所創(chuàng)建的OS/2這個優(yōu)秀但最終失敗的圖形操作系統(tǒng)中。早在1990年,OS/2就可以通過OS/2圖像支持應(yīng)用程序支持這種格式。

JPEG文件與PNG文件或GIF文件的區(qū)別在于數(shù)據(jù)壓縮的退化程度。JPEG圖像的目標是在完成所有壓縮處理后仍能保持照片般的視覺效果,即便需要壓縮至合理尺寸才能正常運行,這種格式也能讓你用更少的字節(jié)數(shù)盡量還原原始圖像。
或者,正如彭內(nèi)貝克和米切爾所說的那樣:“最有效的壓縮是通過近似原始圖像(而不是完全復(fù)制原始圖像)來實現(xiàn)的。”
其核心是一種名為離散余弦變換(DCT)的壓縮過程,這是一種有損的壓縮編碼形式,廣泛用于各種壓縮格式中,尤其是在數(shù)字音頻和信號處理中。(有損壓縮會永久性地刪除一些原始數(shù)據(jù),以便實現(xiàn)更小的文件;無損壓縮則會發(fā)現(xiàn)數(shù)據(jù)中的冗余以縮小文件大小,同時保留原始質(zhì)量。)從本質(zhì)上來說,DCT通過去除細節(jié)來提供低質(zhì)量的產(chǎn)品,同時通過近似來保留原始產(chǎn)品的核心。DTC越強,最終結(jié)果的壓縮程度越高。
20世紀70年代,研究人員開發(fā)的該算法采用了數(shù)據(jù)網(wǎng)格,并將其視為可通過旋鈕調(diào)節(jié)頻率的系統(tǒng)。控制數(shù)據(jù)的速率就像水龍頭控制水流一樣,需要的數(shù)據(jù)越多,設(shè)置的數(shù)據(jù)速率就越高。即便在高度壓縮的情況下,DCT仍然能維持少量數(shù)據(jù)流,盡管這意味著畫質(zhì)會略有降低。換言之,雖然壓縮過程中無法保留全部數(shù)據(jù),但DCT能確保數(shù)據(jù)的核心部分得以留存。
DCT無處不在。例如,觀看流媒體視頻或收聽在線廣播流時,由于帶寬突然下降而導(dǎo)致觀看或收聽質(zhì)量下降,這時DCT就大顯神通了。
正如《JPEG:靜態(tài)圖像數(shù)據(jù)壓縮標準》一書所解釋的那樣,JPEG文件并非只能通過一種方法來運用DCT:
JPEG標準描述了一系列圖像壓縮技術(shù),而不是單一的壓縮技術(shù)。它提供了壓縮技術(shù)的“工具包”,應(yīng)用程序可以從中選擇能夠滿足其特定需求的元素。
該工具包有4種模式:
順序DCT(Sequential DCT),這種模式會按順序顯示壓縮圖像,就像慢慢地放下窗簾一樣。
漸進式DCT(Progressive DCT),這種模式會以最低的分辨率顯示完整的圖像,然后隨著信息的增加而添加細節(jié)。
無損順序式(Sequential Lossless),這種模式使用了窗簾格式,但不會壓縮圖像。
分層式模式(Hierarchical Mode),這種模式結(jié)合了前3種模式,因此該模式可能會從漸進式模式開始,然后緩慢加載順序無損壓縮,之后達到無損的最終效果。
JPEG標準創(chuàng)建時,峰值速度為14.4千比特/秒的撥號調(diào)制解調(diào)器非常普遍。這意味著圖像加載緩慢,因此漸進式DCT成為了最適合早期互聯(lián)網(wǎng)的格式。隨著時間的推移,漸進式DCT越來越不常見,因為許多計算機可以輕松實現(xiàn)一次加載順序DCT。
使用DCT壓縮圖像時,在圖像中比較雜亂、紋理較多的區(qū)域(例如頭發(fā)或枝葉),變化往往不明顯。這些區(qū)域更難壓縮,因此這些區(qū)域能更長時間地保持完整性。在純色圖像中或從一種顏色急劇變化為另一種顏色的區(qū)域,壓縮造成的變化往往更明顯。截取社交媒體帖子的屏幕截圖后,圖像可能會布滿噪點,這就是一個制作JPEG文件的過程。
![]()
PNG等其他格式則在文本處理方面表現(xiàn)很好,因為其壓縮算法是無損的。PNG的壓縮格式Deflate是由菲爾·卡茨(Phil Katz)設(shè)計的,他還創(chuàng)建了ZIP格式。PNG使用Deflate的部分原因是,它是一種免許可的壓縮格式。事實證明,這位杰出的程序員雖然一直在與酗酒做斗爭,但他在不幸去世以前以多種方式改善了互聯(lián)網(wǎng)。
盡管JPEG歷史悠久且已經(jīng)成熟,但它仍然是我們在互聯(lián)網(wǎng)上分享照片的最佳選擇之一。雖然它并不是適用于任何環(huán)境的最佳工具,但就像我們有時會把扳手當(dāng)錘子用一樣,我們也經(jīng)常這樣利用JPEG。

20世紀90年代,JPEG之所以流行起來,不僅僅是因為這種格式有質(zhì)量優(yōu)勢。專利也發(fā)揮了作用,從1994年開始,科技公司Unisys就試圖對依賴GIF文件的個別網(wǎng)站收費,因為這些網(wǎng)站使用了該公司擁有的專利。這使得免費使用的JPEG更受歡迎了。(這種情況也促使了無專利的PNG格式的誕生。)
雖然JPEG以標準為基礎(chǔ),但由于專利系統(tǒng)的原因,它仍然可能面臨與GIF相同的命運。在JPEG格式出現(xiàn)的幾年前,Compression Labs的兩名員工提交了一份關(guān)于動態(tài)圖像壓縮的專利申請。不過,直到JPEG無處不在時,人們才發(fā)現(xiàn)它與JPEG壓縮很相似。
1997年,一家名為Forgent Networks的公司收購了Compression Labs。Forgent Networks公司最終發(fā)現(xiàn)了這項專利,并開始就此提起訴訟,這場意外收獲被該公司視為了天賜良機。
“從某些方面來說,這項專利就像是一張彩票,”Forgent的首席財務(wù)官杰伊·彼得森(Jay Peterson)在2005年向科技資訊網(wǎng)(CNET)表示,“如果5年前你告訴我‘你擁有JPEG專利’,我是不會相信的。”
雖然Forgent對JPEG壓縮算法的所有權(quán)主張站不住腳,但該公司最終在法律訴訟中取得了比Unisys更大的成功,并向數(shù)碼相機制造商和其他公司收取了超過1億美元的費用。此外,F(xiàn)orgent還試圖向個人電腦行業(yè)收取許可費;最終,該公司同意與大約30家電腦制造商達成800萬美元的和解協(xié)議。
隨著對其獲取的專利采取越來越激進的維權(quán)方式,該公司開始在輿論場和實際訴訟中接連受挫。批評者紛紛援引有關(guān)先前技術(shù)水平的例子,而法庭則將該專利的適用范圍限定在了視頻等動態(tài)用途。
2006年,F(xiàn)orgent Networks公司的壓縮專利過期,其商業(yè)訴訟模式隨之終結(jié)。同年,該公司更名為Asure Software,專注于薪酬與人力資源解決方案,由此徹底地轉(zhuǎn)型了。
JPEG為我們提供了很好的服務(wù)。要打破這種模式的地位很難。例如,JPEG 2000格式旨在通過提供無損選項和更好的性能來取代原始JPEG。雖然這種較新的格式在美國國會圖書館和美國互聯(lián)網(wǎng)檔案館等專業(yè)網(wǎng)站得到了廣泛的應(yīng)用,但作為終端用戶格式卻不太受歡迎。
其他圖像技術(shù)在突破JPEG格式的限制方面略有成效。谷歌支持的WebP受到了網(wǎng)站開發(fā)者的歡迎(但在終端用戶中存在爭議)。與此同時,與JPEG和JPEG 2000相比,同樣由標準機構(gòu)開發(fā)的格式AVIF和HEIC在技術(shù)上更先進。
目前,JPEG仍然很難被淘汰。從某種意義上說,這種格式的處境類似MP3音頻與ZIP壓縮,這兩種傳統(tǒng)格式都非常受歡迎,而且得到了廣泛的應(yīng)用,因此很難被淘汰。雖然其他格式能夠更好地壓縮文件,更高效地完成同樣的任務(wù),但要推翻一種領(lǐng)先30年的格式非常困難。
來源:悅智網(wǎng)
編輯:夜凌Ryelin
轉(zhuǎn)載內(nèi)容僅代表作者觀點
不代表中科院物理所立場
如需轉(zhuǎn)載請聯(lián)系原公眾號
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.