“印度阿三”是國人嘲諷和揶揄印度人的說法,可是在軟件業,當年我們可不敢嘲諷印度。
不但不敢嘲諷,還得去取經學習。
上世紀八九十年代,印度軟件業迅速崛起,印度位置(時區)很好,英語流利,工資低,印度人在流程控制,質量控制這一塊兒下了大功夫,迅速構建起龐大的外包產業。
像 InfoSys 這樣的企業,不僅員工數以萬計,還達到了業界最高的 CMM5級認證,成為全球軟件外包的標桿。
中國軟件業開始做外包的時候,學習的就是印度,諸如《計算機世界》等主流媒體,時常大篇幅報道印度的CMM 模型與質量管理體系。
在中國,哪怕是某家公司通過了CMM3級認證,也能成為業內大新聞。
而雷軍當年更是親自赴印度學習經驗,希望帶回先進的管理與開發模式。
![]()
不過,中國沒有走這種軟件工廠和外包的路線,而是抓住了互聯網的機會起飛,這是后話。
印度人也比中國人更早、更系統地進入美國的高校和科技公司,奔騰芯片之父Vinod Dham,1971年進入美國留學。
Raj Reddy,60年代就赴美,是AI領域的先驅人物,第一位獲得圖靈獎的印度裔,他的中國學生包括李開復、沈向洋、洪小文等。
![]()
印度人在硅谷的人多,又抱團,不斷帶動人脈與業務聯動,如今幾乎霸占了硅谷各大巨頭CEO的位置。
扯得有點兒遠了,主要想表達的是:進入這個行業的人多了,在IT飛速發展的時代,就有機會做出一些偉大的事情。
這也是本文的主題,印度人搞出的兩個影響世界的發明:
一個是阿賈伊·巴特發明的USB,統一了計算機外設的接口,之前已經講過:
第二個是納西爾·艾哈邁德教授發明的DCT算法,個人覺得它比USB更加偉大,它深刻地影響了全世界的每一個人的生活。
可以說,沒有DCT,我們的互聯網將會黯淡無光。
0 1
早在1961年,納西爾·艾哈邁德就來到美國讀書,當他快要完成博士學位的時候,他提出了DCT(Discrete Cosine Transform ,離散余弦變換)的想法。
![]()
DCT要解決的問題是圖像數據的壓縮,這是一個非常非常超前的想法。
當時互聯網還處于萌芽階段,美國軍方正在建設阿帕網,在這個網絡上能傳輸的只是文字,根本就沒有圖片。
![]()
因為圖片實在是太大了,比如一張簡單的512*512的灰度圖,就需要256KB的空間,當時的網絡和存儲來根本無法承受。
艾哈邁德堅信一定有辦法縮小數字文件的大小,加快處理速度。
1972年,已經是堪薩斯州立大學教授的納西爾·艾哈邁德,想利用暑假的幾個月時間,進一步推進他的想法。
他滿懷信心地寫了一份申請,希望能夠獲得NSF(美國國家科學基金會)的贊助,但讓他非常驚訝的是,評審人員認為這個想法太簡單,把它拒掉了。
這里必須要說一下,當時美國很多教授的工資是按照學年發放的,正常工資只覆蓋春季+秋季兩個學期(9個月),夏季的三個月沒有工資,教授如果想有收入,通常需要寫科研基金申請,或者去企業界做顧問。
艾哈邁德申請失敗,回到家里,和妻子商量:我們能在沒有任何薪水的情況下,支撐一個夏天三個月嗎?
妻子表示理解:沒關系,我們總會有辦法的。
![]()
于是艾哈邁德就在實驗室昏天黑地地研究起來,晚上經常很晚才能回家。
沒有錢,又無法和家人在一起,即使是一起吃個晚飯也不太可能。
一天晚上,當他10點才到家的時候,妻子又心疼又生氣,流著淚問他:“你到底在辦公室里做什么?比家人還重要?”
艾哈邁德還沉浸在研究中:“我離一個重大突破就差一點點了,至今還沒有人能高效地計算Karhunen–Loève 變換。所以我想到,或許可以用余弦變換來研究這個問題。”
妻子根本就聽不懂,她說:“你這么拼命,到底有什么意義?”
![]()
艾哈邁德想了想,說道:“如果你媽媽要一張邁克的照片,我們是不是需要把照片寄到阿根廷,她幾周后才能看到外孫子的照片,對吧?”
妻子點點頭。
“那如果她不用等郵件,幾乎瞬間能在電腦上看到那張照片,會怎么樣?”
“你是什么意思?這怎么可能?”
“軍方已經建立了一個遍布全球的計算機網絡,它們互相連接。假設有一天,這個網絡會普及到普通人手中。如果我的團隊能優化一種數據壓縮算法,大家就能在這個網絡上傳輸圖像了。”
“也就是說,你把照片放到電腦上,我媽媽在地球另一端,也能看到同一張照片。”
“對,想象一下,不僅僅是照片,有一天,你可以在屏幕上與人通話——就像打電話一樣,但還有視頻。”
當我看到這個小故事的時候,真是無比感慨,這是1972年,艾哈邁德已經預見了幾十年后的未來,他正在為人類全新的連接方式打造基礎。
0 2
在那個假期,艾哈邁德取得了技術的突破,又經過了兩年的嚴格測試以后,《離散余弦變換(DCT)》終于在IEEE 計算機學報上發表。
這里稍微解釋一下它的工作原理,圖像原本是像素構成的二維數組(矩陣),艾哈邁德采用的DCT技術,可以把這個像素矩陣轉化為波形,表示為一系列頻率不同的振蕩波。
![]()
艾哈邁德發現,低頻波通常對應圖像中“重要”或“高信息”的區域(圖像的大致輪廓、光影、主結構),而高頻波則代表圖像中“次要”或“可近似”的細節部分(紋理、邊緣、小細節),這樣就可以保留重要部分,舍棄細節部分,從而在保留視覺效果的同時,實現壓縮。
DCT 雖然是一種“有損壓縮”,但人眼幾乎察覺不出區別。
壓縮比非常驚人,達到了10:1。
40 年代克勞德·香農在信息論中預言可以用“有損壓縮”來傳輸信息,但幾十年來缺乏真正有效的方法,DCT的出現終于終結了這一局面。
唯一的問題是,DCT太過超前,那篇偉大的論文并沒有引發太大反響。
十年以后,隨著個人計算機和網絡的興起,對圖片的存儲和傳輸的需求越來越大,1986 年,ISO(國際標準化組織)和 CCITT(國際電報電話咨詢委員會) 聯合成立一個工作組:Joint Photographic Experts Group,簡稱 JPEG,目標是制定一個全球通用的壓縮靜態圖像的標準。
他們測試了已知的各種算法,包括哈夫曼編碼、向量量化、Walsh變換、離散傅里葉變換(DFT)等,最終發現有一種算法在壓縮效率與圖像質量之間取得了最好的平衡,這個算法就是艾哈邁德發明的DCT。
1992年,JPEG工作組正式發布JPEG標準,隨著數碼相機、網頁瀏覽、CD-ROM、多媒體軟件的普及,JPEG 幾乎成了數字圖像的代名詞。而DCT 也因此走向全球。
![]()
在90年代上過網的小伙伴肯定經歷過類似的事情:
一張圖片剛開始非常模糊,然后變得慢慢清晰,這叫做漸進式DCT。
或者一張圖片顯示的時候像窗簾一樣慢慢卷下來,這叫做順序DCT。
DCT不僅僅用于圖像,它還可以做音頻壓縮(MP3,AAC等),視頻壓縮(MPEG、H.264、HEVC等),凡是涉及到多媒體的領域,幾乎都能看到它的身影,它是大多數標準的基礎算法。
當你用抖音、快手、視頻號刷短視頻/看直播的時候,當你用手機攝像頭和遠方的親人聊天的時候,當你參加各種頻會議的時候,DCT算法就隱藏在背后,默默地工作。
![]()
0 3
盡管 DCT 是一項劃時代的技術發明,但它的締造者艾哈邁德教授卻幾乎被人遺忘。
直到 2020 年,一集名為《This is Us:In the Room》的美劇喚醒了人們的記憶——它動情地講述了 DCT 算法在新冠疫情封鎖期間,為全球數以億計的家庭帶來的安慰與連結。
隨后,Netflix 為他拍攝了一部紀錄片,年邁的艾哈邁德和妻子,第一次面對鏡頭,講述了那個酷暑中孤注一擲的決定,那段執著探索的時光。
![]()
紀錄片的最后一個鏡頭,是老兩口挽著手走在一條普通的街道上,身影安靜卻無比篤定。
![]()
沒有獎杯、沒有豪宅、也沒有耀眼的財富,但他們給世界帶來了光影與聲音,縮短了人與人之間的距離。
他們的故事,像 DCT 本身一樣——不喧囂,卻無處不在。
全文完,覺得不錯請三連吧!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.