![]()
探索宇宙奧秘 · 理性思考
想象一下,你是一位頂尖的建筑師,設計出了一棟美輪美奐的摩天大樓。但現在,你得帶著這沓圖紙,分別跑到只用鋼筋、只用木頭、只用石頭的工地上,讓工人們蓋出一模一樣的樓來。你是不是得給每個工地都重新畫一整套圖?
這就是中國超算科學家們過去幾年面臨的“幸福的煩惱”。手里握著“神威”這樣的國產頂尖硬件,但軟件卻像個“水土不服”的外鄉人。不過,這個局面正在被改寫。
到底什么是swKokkos?要理解它,得先明白超算的“心”有多復雜。
今天的超算,早已不是一堆相同CPU的簡單堆砌。它更像一個異構的“特種部隊”,有擅長指揮的(CPU),有擅長重復計算的(GPU或神威的從核)。但問題來了,不同的超算,架構天差地別。
給A超算寫的程序,拿到B超算上,輕則跑得慢如蝸牛,重則直接“罷工”。這就是高性能計算領域最難纏的敵人之一——性能不可移植。
中科院這次搞定的swKokkos,本質上是一個“性能可移植”的編程后端。它的高明之處在于,為神威處理器那個獨特的“主從核”架構(可以理解為一個大腦指揮數萬個勤雜工),引入了一套“并行執行抽象” 。程序員不用再去記神威那套繁瑣的原生指令(Athread),而是用更通用的“語言”寫代碼,swKokkos自動幫你在神威的“勤雜工”們之間分配任務、搬運數據。
光說概念可能有點虛,咱們看點硬核的數據。
swKokkos有多好用?研究團隊用幾個最基礎的數學測試(AXPY、數值求解器)做了檢驗。結果讓人眼前一亮:它的性能達到了神威原生編程模型Athread的99%以上。
這是個什么概念?相當于一個同聲傳譯,不僅把話翻譯過去了,連原講話人的語氣、停頓、情緒都還原了99%。對于程序員來說,這意味著巨大的“無痛感”——幾乎不需要為了遷就新硬件去重寫代碼,就能享受到硬件本身的大部分算力。
更牛的還在后面。他們把我國自主研發的海洋模型LICOM拿出來“練手”。這個模型在超過10萬核的規模上,不僅穩定運行,還實現了顯著加速。10萬核,相當于同時指揮10萬個“勤雜工”挖一條運河,不僅沒亂套,反而比原先靠人海戰術推土還快。
放眼全球,性能可移植性也是塊難啃的硬骨頭。國際主流走的是一條“統一生態”的路子,比如美國的Kokkos和RAJA框架 。它們試圖定義一個“通用標準”,讓Intel、AMD、NVIDIA的芯片都來遵守。
![]()
所以,swKokkos的突破,不僅僅是跟進國際潮流,更是一次“精準滴灌”。它不是簡單地把Kokkos拿過來用,而是針對神威的“獨特性格”(硬件約束)做了深度改造。比如它引入的向量化哈希索引和FDSL快速調度庫,就是為了解決神威從核啟動任務太慢、緩存容易堵車的“水土不服”問題 。
無獨有偶,就在同一個月,北京大學的楊超教授團隊也在性能可移植模型上亮出了自己的方案——Leonid,不僅能跑CPU和GPU,同樣也支持了神威平臺,還搞出了“自動算子融合” 。
這兩件事放一起看,信號就很明確了:中國超算界正在集體攻關,試圖在“軟”的一面,為國產“硬”件構建起一道護城河。
swKokkos的意義,其實超越了這一個軟件本身。它像是一面鏡子,照出了中國超算戰略重心的微妙轉移。
過去十年,我們癡迷于在全球超算TOP500榜單上爭第一,比誰的運算速度更快,那是“堆硬件”的蠻力時代。但速度再快,如果應用軟件跑不上去,超算就是一個昂貴的“電子花瓶”。
現在,我們已經有了神威、曙光等國產重器,下一步的關鍵是:如何讓千千萬萬的科學家,能像用水用電一樣,輕松地用上這些國之重器?
swKokkos的出現,正是為了解決這個“最后一公里”的難題。它試圖把程序員從繁瑣的硬件細節中解放出來,讓他們專注于科學問題本身——是模擬氣候變化,還是設計新藥分子。
這不只是方便,更是生態的萌芽。當一個工具能讓你用一套代碼,同時跑在神威和GPU集群上,而且效率損耗極小的時候,開發者才愿意留下來,應用生態才能繁榮起來。
從某種意義上說,我們對超算的評價標準,正在從“它算得有多快”,轉向“用它編程有多爽,跑應用有多順”。這,才是真正從超算大國邁向超算強國的必經之路。
當我們的程序員不再需要為一個循環是放在主核還是從核而撓頭,當我們的海洋模型可以輕松地在國產超算上模擬出每一朵浪花,到那時,我們才能真正地說:這不僅是中國的算力,更是中國創新的底氣。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.