![]()
“我們淘寶現在都開始盈利了,為什么2010年還要買小型機?
十多年前,阿里巴巴首席架構師王堅博士這么不經意的一問,像一顆投入湖面的石子,在時任淘寶技術保障部負責人劉振飛心中激起了千層浪。彼時,他剛接過一份預算,其中一項是花費800萬采購一臺IBM小型機。這在當時的技術圈看來是“標配”,甚至還是頗有性價比的明智之選。
當時,正值中國互聯網經濟如宇宙膨脹般迅猛增長,淘寶的交易量與數據量正經歷指數級攀升。王堅之問的背后是必須要做的產業抉擇:如果支撐業務的核心系統--數據庫,沒有掌握在自己的手中,那么不論是對阿里,還是對中國互聯網經濟而言,都要面臨長期受制于海外巨頭的戰略風險。
王堅之問就像一把刀子,劃開了溫室大棚的棚頂,拉開了中國互聯網史上波瀾壯闊的“去IOE”戰役的序幕,也無意間,為中國數據庫乃至整個基礎軟件的自主創新之路,寫下了生動的注腳。
時光流轉,親歷了國產數據庫生死突圍的劉振飛,作為北京科技大學的校友站在2025年全國大學生計算機系統能力大賽的現場,看著臺上臺下充滿活力的師弟師妹們,那段激情燃燒的崢嶸歲月,想必會再次涌上心頭。
只是這一次,戰場已從企業機房轉移到了校園賽場
十支隊伍會師決賽
北郵奪魁
近日,2025年全國大學生計算機系統能力大賽暨第五屆OceanBase數據庫大賽在北京科技大學落幕。本屆賽事吸引全國高校的1223支隊伍、2620名學生參賽。
正如系統能力培養研究專家組成員計衛星教授所指出的,大賽的核心價值在于用 “真實產業問題”牽引教學。這場比賽沒有“紙上談兵”,賽場即戰場。
進入到決賽階段,選手們面對的是與互聯網大廠研發團隊同等級別的挑戰。選手將基于Apache 2.0開源的AI原生混搜數據庫OceanBase seekdb,完成兩大賽題:一是在有限的硬件資源(8核16G)下,對開源的AI原生數據庫OceanBase Seakdb進行內核級調優,目標是讓“全文檢索+過濾”的混合查詢快到極致,同時保證高精度(召回率≥0.95)。二是用自己優化后的數據庫,現場搭建一個多模態RAG系統。它不僅要用大模型回答問題,更需要像人一樣,具備“思考”與精準檢索信息的能力,直擊當前AI應用中答案可追溯性與可信度的核心痛點。
在決賽現場,數據猿記者見證了十支隊伍的答辯過程。
來自中國數據庫領域的專家學者教授和產業界技術專家組成的評委團,與選手展開了技術含量很高的“交鋒”。評委們的提問往往直指要害,毫不留情:“當并發請求激增時,你的緩存策略如何避免雪崩?”“你的索引合并算法,在數據持續寫入的場景下,性能拐點在哪里?”
能堅持到決賽的隊伍,都有著不俗的實力。他們不僅能夠沉穩應對這些專業問題,還能偶爾提出讓人眼前一亮的創新思路,引得評委頻頻點頭。最終,來自北郵的「編程高手」隊憑借其在數據庫內核優化與AI應用開發兩個維度的綜合卓越表現,奪得冠軍,并捧回了10萬元真金白銀的獎金。
![]()
據了解,本屆大賽特設人才激勵機制:特等獎、一等獎、二等獎及三等獎獲得者可獲OceanBase招聘“綠色通道”,免線上筆試和初面,直通終面。公開信息顯示,自2021年以來,已有160余位學生通過校招加入OceanBase,其中20余人通過OceanBase數據庫大賽綠色通道入職,實現了從賽場到產業的“無縫銜接”。
數據庫從“記賬本”向
“數據賦能平臺”演進
在這場競賽中我們還看到了更深層的東西,華東師范大學數據學院教授、CCF數據庫專委會主任周傲英的闡述,為這場競賽注入了更深層的哲學思辨。
他揭示了人們對數據的認知有了一個深刻轉變:數據的意義不僅在于它的大和小,它已經成為生產要素,超越技術的范疇,成為經濟、社會的范疇。中國人傳統上理解數據,重在“以數為據”,作為決策和問責的依據。既然是依據,原則自然是“越少越好,夠用即可”,否則就會陷入“過度留痕”的形式主義。然而,當數據在當今時代被明確為關鍵“生產要素”時,邏輯發生了根本性的逆轉——數據變成了“越多越好”,因為其潛在的價值與創新可能性幾乎與規模成正比。
“這一轉變,徹底重構了數據庫的使命。”周傲英指出。數據庫不再僅僅是用于“存錢取錢記賬”的核心業務記錄系統,它必須演進為能夠釋放數據要素價值的“數據賦能平臺”。這場認知革命,正是大數據和AI浪潮帶給數據庫領域最根本的沖擊。
數據庫的發展歷程是典型的應用驅動創新:從實際問題出發,構建系統,形成抽象,再升華為理論,從而實現業務、技術與理論三者的協同演進。周傲英回憶,當年大數據概念出現時,數據庫領域許多學者和從業者起初是排斥甚至憤怒的,認為從抽象的層次來看這是一種倒退。經過一段時間的反思,他們才逐漸意識到問題所在:過去數據庫領域總試圖用一個系統解決所有問題,而實際上,不同的應用場景需要不同的系統支撐。
“我們依然在做抽象,但不再追求‘一刀切’,而是針對一類應用,構建最適合它的系統。這或許正是大數據時代給我們上的最重要的一課。”
伴隨著認知的革新,數據庫技術本身也經歷了一場深刻的形態演進。周傲英樂觀的認為,數據庫在未來將扮演更加重要的角色,其關鍵在于互聯網和人工質量帶來的應用大爆發。為應對海量數據與高并發,分布式數據庫應運而生;為追求極致的處理速度,并行數據庫不斷演進;為保證業務不間斷,高可用數據庫持續發展;為滿足實時決策需求,實時數據處理系統蓬勃興起。這些都不是憑空產生的,而是應用需求與技術能力相互推動、共同進步的結果。
云計算的普及,進一步從底層改變了數據庫的部署和使用方式。數據庫不再僅僅是獨立部署的軟件,越來越多的系統設計之初就是基于云原生的。云原生數據庫或數據平臺的核心使命,正是將數據庫技術大眾化——通過云服務的方式,降低使用門檻,讓每個人、每個組織都能便捷地獲取和使用數據能力。這標志著數據庫從一個由專業DBA掌控的“高級工具”,真正成為了普適化的基礎設施。
他表示,展望前路,中國數據庫乃至整個基礎軟件的發展,必須秉持徹底開放的理念:構建開放的架構,以開源的方式協同推進,并始終保持開明的心態。我們決不能固守過去的任何成功范式,被傳統數據庫時代的輝煌所束縛。在經歷了大數據與AI的劇烈沖擊與洗禮后,更應以最大的開放姿態,擁抱這個技術范式迭變的時代。
對此,劉振飛深有共鳴。
一場技術自主自強的接力賽
劉振飛在現場,回顧了阿里巴巴去IOE那段激動人心的歷史細節。這些故事今天聽起來,依然令人振奮。
他回憶,到了2013年,“去IOE”已經從王堅之問成為了技術團隊的共識。那年最關鍵的任務,是把支付寶的傳統商業數據庫給替換掉。6月份,第一臺小型機正式下線,團隊還去機房搞了個小小的儀式。說到這,劉振飛還提到了一個有趣的細節,“有意思的是,負責這件事的很多同學,都很年輕。但正是有了阿里的這個業務戰場練手,他們才有機會成長為真正的技術骨干。”
這件事對團隊和公司產生了極大的振奮。支付寶當時還發了一條微博作為紀念:“再見,親愛的小型機”。產業的蝴蝶效應自此開始產生,沒多久,IBM中國就傳出裁員的消息了。
現在回頭看,“去IOE”能做成,有幾個關鍵因素:
一是業務倒逼。當時,淘寶和支付寶的業務量每年翻著倍漲,傳統架構根本扛不住,成本也受不了。這是最現實的驅動力。
二是技術信仰。相比較技術能力,更大的挑戰在于改變人的觀念。在幾乎處于空白的領域,有敢于超越國外最先進技術的勇氣,是需要一定的信仰支撐的。
三是用時間換空間。不要一開始就動核心交易系統,從邊緣業務做起,做出標桿,樹立信心,再逐步推進。
四是時代給了機會。那幾年,PC服務器性能快速提升,SSD硬盤開始普及,開源生態日漸成熟,讓我們有了“換道”的可能性。
五是雙11這個“練兵場”。每年雙11的流量洪峰,逼著技術系統快速迭代。2010年,淘寶一秒只能處理400筆訂單,支付寶一秒處理200筆;到了2018年,這個數字變成了幾十萬筆。沒有自主技術,根本不可能實現。
![]()
“去年我看到Oracle創始人拉里·埃里森的一次采訪,他說:‘我們不能讓中國培養出比美國還多的工程師。’”劉振飛坦言,“這句話聽起來帶有競爭色彩,但反而讓我更堅信,我們這條路走對了。真正的技術自主,不是關起門來搞發明,而是在中國這片擁有世界上最復雜、最宏大應用場景的土地上,解決真實世界提出的難題,并在過程中錘煉出一支能打硬仗的隊伍。”
他最后引用了恩格斯說過一句話:社會一旦有技術上的需要,這種需要就會比十所大學更能把科學推向前進。
從王堅那句石破天驚的叩問,到如今上萬名大學生的技術競賽。數據庫自主自強的這條路,始于強烈而真實的應用需求,興于開放協同的開源生態,成于一代代技術人的接續奮斗。而這場發生在校園與產業之間的接力,正是這條路上最富活力、也最具希望的風景。
就像今天這場競賽,從校園到產業的距離,其實并不遠。那些在數據庫自主創新道路上,刻下豐碑的人,很多也都是剛褪去校園的稚嫩,在時代需求和產業革命的歷史機遇下,走上了前臺。
大會現場,評委們嚴格發問的場景,恍惚間讓人產生一些聯想。有時候,改變歷史的,可能就是一個正確的問題,在正確的時間,被正確的人提了出來。
從未來回看今天,決賽現場的一些發問,也許已經在某些同學心中激蕩起了漣漪。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.