<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      這家中國公司,讓GPU利用率飆升!全球AI圈熱議

      0
      分享至

      最近,我遇到一個十分頭疼的問題,K哥團隊有一組集群機器,配了4張GPU顯卡,平時主要用來測評大模型、開發(fā)AI應用。本來應該是夠用了,但是在使用GPU的時候經(jīng)常是獨占式的,一個任務占了整張卡,利用率卻只有30%,別的任務就要排隊。

      一邊是GPU大把閑置,一邊是開發(fā)人員排隊等資源。就像餐廳里明明有空位,但因為每桌只坐了一個人,后面的客人還得等位。造成了算力資源的浪費,很多企業(yè)應該都面臨類似的困境。

      01

      GPU資源管理困局

      關于GPU資源管理的問題,其實遠不止利用率不高這一點,在使用過程中普遍會遇到以下四個問題:

      1、資源顆粒度太粗。如前面說的場景,一張16GB的T4卡,只能整卡分配,利用率只有30%,白白浪費11G多。

      2、調(diào)度機制不夠智能。K8s原生調(diào)度只知道“有卡”或“沒卡”,不知道卡上還剩多少顯存、算力,就好比一個停車場雖然車位滿了,但是還能夠塞進很多輛摩托車。

      3、資源隔離難。開發(fā)、測試、生產(chǎn)環(huán)境混在一起,沒法給不同團隊單獨的工作區(qū)間,避免相互干擾。

      4、管理成本高。傳統(tǒng)的資源申請要走人工審批,出了問題也要排查很久,導致管理成本很高。

      如何才能更高效地管理GPU資源,難道以上問題就沒有更好的解決方案嗎?

      02

      OrionX社區(qū)版,初體驗

      一次偶然的機會,我了解到OrionX社區(qū)版。這是由趨動科技開發(fā)的,OrionX的輕量級部署版本,幫助用戶構(gòu)建數(shù)據(jù)中心級AI算力資源池、降本增效。它的核心理念是:用軟件定義AI算力,讓GPU資源像云計算一樣靈活。

      原理也不復雜,就是把顯卡、算力按很小的粒度進行切分,然后根據(jù)用戶實際需要進行組合。傳統(tǒng)的GPU管理就像飯店的包間,你一個人也得開一間,而OrionX社區(qū)版把包間改成拼桌,來幾個人就坐幾個位子,靈活調(diào)整,絕不浪費。

      OrionX社區(qū)版究竟能不能解決GPU管理的困境呢?我上手做了個測評,下面跟隨我一起來體驗吧。

      首先,從官網(wǎng)上提交申請,掃碼填寫信息:

      審核通過后,會收到一封確認郵件,獲取授權(quán)碼、下載地址。



      下載安裝文件,上傳到服務器,準備開始安裝。



      安裝的過程很簡單,主要是基于K8S環(huán)境進行部署。開始部署前需要對安裝環(huán)境做基礎檢查,包括:

      GPU驅(qū)動檢查:nvidia-smi

      Kubernetes環(huán)境檢查:get node -owide

      Nvidia Container Toolkit檢查:

      docker info | grep 'Default Runtime'







      狀態(tài)正常,就可以開始部署了。

      1)部署文件上傳

      上傳OrionX部署文件yaml.tar.gz至K8S管理節(jié)點任意位置,并解壓.



      2)K8S節(jié)點標記

      編輯部署文件tools/label.sh腳本,按資源規(guī)劃修改如下內(nèi)容,然后對執(zhí)行K8S集群節(jié)點進行標記:



      3)創(chuàng)建命名空間和配置信息對象

      執(zhí)行如下操作,創(chuàng)建名為orionx的命名空間,創(chuàng)建OrionX配置信息ConfigMap對象,命令如下:

      kubectl apply -f base/

      4)部署orionx-ocenter-all-in-one組件

      執(zhí)行如下操作,部署orionx-ocenter-all-in-one組件,命令如下:

      kubectl apply -f deploy/orionx-ocenter-all-in-one.yaml

      5)導入License

      通過瀏覽器訪問http://,打開OrionX GUI管理頁面,通過激活頁面,添加激活文件按鈕導入License,導入后會顯示證書信息,如下圖所示:

      :30125



      6)部署orionx-k8s-scheduler組件

      執(zhí)行如下操作,部署orionx-k8s-scheduler組件,命令如下:

      kubectl apply -f deploy/orionx-k8s-scheduler-extender.yaml

      7)部署orionx-server組件

      部署orionx-server組件,修改配置文件如下,并執(zhí)行命令:

      kubectl apply -f deploy/orionx-gpu-server.yaml



      8)部署orionx-k8s-device-plugin組件

      執(zhí)行如下操作,部署orionx-k8s-device-plugin組件,命令行:

      kubectl apply -f deploy/orionx-k8s-device-plugin.yaml

      9)部署orionx-gpu-exporter組件

      執(zhí)行如下操作,部署orionx-gpu-exporter組件,會部署于所有OrionX GPU計算節(jié)點:

      kubectl apply -f deploy/orionx-gpu-exporter.yam

      10)部署orionx-k8s-admission-webhooks組件

      執(zhí)行如下命令,部署orionx-k8s-admission-webhooks組件:

      kubectl apply -f deploy/orionx-k8s-admission-webhooks.yaml

      11)部署orionx-container-runtime組件

      執(zhí)行如下操作,部署orionx-container-runtime組件:

      kubectl apply -f deploy/orionx-container-runtime.yaml

      現(xiàn)在就可以開始使用Orion社區(qū)版了,整體安裝過程很絲滑,下面就可以到后臺去操作了。瀏覽器訪問http://地址,打開OrionX GUI,進行登錄,初始用戶名密碼見安裝手冊。

      :30125

      進入節(jié)點詳情頁面可以查看該節(jié)點GPU資源使用率監(jiān)控統(tǒng)計圖。



      還可以進行節(jié)點管理。在OrionX GUI左側(cè)導航欄選擇“節(jié)點”,在節(jié)點信息頁面可以禁用或啟用節(jié)點。



      整個安裝過程很順滑,只要具備基本的Linux使用能力,就可以輕松完成。

      03

      輕松管理你的GPU資源池

      下面談談我對OrionX社區(qū)版的總體使用感受,主要有四點體會:

      1、資源分配靈活,告別“大鍋飯”。更細粒度地分配GPU資源,提高資源利用率,這就解決了我們團隊遇到的GPU獨占的問題,而且申請資源無須再等待,提升了日常管理效率。

      2、智能調(diào)度,讓資源分配更合理。GPU的調(diào)度是智能化的,可以做到節(jié)點均勻,設備緊湊,節(jié)點優(yōu)先,這就解決了一些節(jié)點負載高、一些負載低的問題,并且策略是可配置的。

      3、超分,榨干GPU每一滴性能。很多任務不是一直滿負荷用GPU,推理任務經(jīng)常是突發(fā)式的,通過統(tǒng)一內(nèi)存管理和算力復用,可以分配出更多vGPU,合理使用超分功能可以進一步提升GPU效能。

      4、可視化管理,一目了然。Orion社區(qū)版的GUI界面做得很不錯,資源監(jiān)控很直觀,點進某個節(jié)點,可以看到詳細的監(jiān)控曲線、GPU利用率曲線(最近24小時)、顯存使用趨勢。

      04

      立刻開啟GPU資源池化時代

      OrionX社區(qū)版通過構(gòu)建算力資源池,將粗放的管理轉(zhuǎn)變?yōu)榫毣\營,這是中國科技企業(yè)在AI基礎設施領域的突破。正如凱文·凱利在《必然》中所說:“技術的真正力量,不在于它能做什么,而在于它讓更多人能做什么。”AI算力池化技術的價值,恰恰在于讓研發(fā)團隊也能用得起、用得好AI算力,打破算力壟斷的壁壘。

      如果你的團隊也面臨GPU資源管理困境,立即掃碼申請使用OrionX社區(qū)版。



      有興趣的朋友提交上面表單信息后,也可以添加下方小助手微信進行交流。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      鄭麗文訪陸在即,連戰(zhàn)家族突然充當監(jiān)軍,公開反對鄭麗文做一事

      鄭麗文訪陸在即,連戰(zhàn)家族突然充當監(jiān)軍,公開反對鄭麗文做一事

      滄海旅行家
      2026-04-06 14:55:09
      冠心病去世的人越來越多?醫(yī)生強調(diào):寧可打打牌,建議別做這6事

      冠心病去世的人越來越多?醫(yī)生強調(diào):寧可打打牌,建議別做這6事

      醫(yī)學原創(chuàng)故事會
      2026-04-07 00:18:03
      重磅!大連2026年舊改+動遷全面來襲!

      重磅!大連2026年舊改+動遷全面來襲!

      科學發(fā)掘
      2026-04-07 17:44:51
      美俄曾聯(lián)手阻撓,如今圖160重啟生產(chǎn)線,俄對華求購態(tài)度仍然未變

      美俄曾聯(lián)手阻撓,如今圖160重啟生產(chǎn)線,俄對華求購態(tài)度仍然未變

      小莜讀史
      2026-04-04 11:03:12
      一路走好!清明假期3位名人離世,最年輕者僅26歲,孩子才一歲

      一路走好!清明假期3位名人離世,最年輕者僅26歲,孩子才一歲

      叨嘮
      2026-04-06 19:36:29
      世界名畫:日本男乒全隊冷漠死死盯著王楚欽慶祝 張本智和呆若木雞

      世界名畫:日本男乒全隊冷漠死死盯著王楚欽慶祝 張本智和呆若木雞

      風過鄉(xiāng)
      2026-04-07 07:01:02
      大限已到!所有人都以為大戰(zhàn)即將結(jié)束,伊朗突然打出了最猛導彈雨

      大限已到!所有人都以為大戰(zhàn)即將結(jié)束,伊朗突然打出了最猛導彈雨

      阿紿聊社會
      2026-04-07 12:42:32
      月入兩萬上交一萬八,竟被罵巨嬰?妻子憑實力把金飯碗砸了個稀碎

      月入兩萬上交一萬八,竟被罵巨嬰?妻子憑實力把金飯碗砸了個稀碎

      番外行
      2026-04-07 12:55:25
      西方要合圍中國?馬克龍拒邀G7,德日聯(lián)合聲明妄言插手臺海局勢!

      西方要合圍中國?馬克龍拒邀G7,德日聯(lián)合聲明妄言插手臺海局勢!

      軍機Talk
      2026-04-06 15:11:34
      Windows用戶苦等10年,這哥們一行代碼解決了

      Windows用戶苦等10年,這哥們一行代碼解決了

      我是一個養(yǎng)蝦人
      2026-04-07 13:25:12
      鄭麗文將訪問大陸,重啟什么,開創(chuàng)什么?

      鄭麗文將訪問大陸,重啟什么,開創(chuàng)什么?

      新民周刊
      2026-03-31 09:08:20
      廣州市中心正在悄悄 “搬家”?這 2 個區(qū)域正在強勢崛起!

      廣州市中心正在悄悄 “搬家”?這 2 個區(qū)域正在強勢崛起!

      記錄生活日常阿蜴
      2026-04-07 17:03:25
      每吃一次,猝死就快一步?醫(yī)生:這4物是心源性猝死的“催化劑”

      每吃一次,猝死就快一步?醫(yī)生:這4物是心源性猝死的“催化劑”

      健康科普365
      2026-04-03 22:00:07
      當年為什么查辦褚時健?

      當年為什么查辦褚時健?

      百曉生談歷史
      2025-08-20 21:55:53
      教育部發(fā)布“教師二十嚴禁”!這回,老師不準做的事,全寫清楚了

      教育部發(fā)布“教師二十嚴禁”!這回,老師不準做的事,全寫清楚了

      笑熬漿糊111
      2026-04-05 00:05:25
      韓媒:瀕臨崩盤的中國兵乓躲過恥辱;日媒:團體賽擊敗中國不是夢

      韓媒:瀕臨崩盤的中國兵乓躲過恥辱;日媒:團體賽擊敗中國不是夢

      林子說事
      2026-04-07 00:23:34
      江蘇一地10名領導干部,擬任新職

      江蘇一地10名領導干部,擬任新職

      揚子晚報
      2026-04-07 09:45:30
      高校官宣:教師,沒有“非升即走”!

      高校官宣:教師,沒有“非升即走”!

      軟科
      2026-04-07 18:35:58
      確認不打了!廣東第一外援接近常規(guī)賽報銷,杜鋒迎來下課倒計時?

      確認不打了!廣東第一外援接近常規(guī)賽報銷,杜鋒迎來下課倒計時?

      緋雨兒
      2026-04-07 14:50:06
      花200萬購到奔馳山寨車遭三省法院“踢皮球”:我們沒有管轄權(quán)!

      花200萬購到奔馳山寨車遭三省法院“踢皮球”:我們沒有管轄權(quán)!

      兵叔評說
      2026-04-06 12:38:28
      2026-04-07 19:40:49
      技術領導力 incentive-icons
      技術領導力
      Mr.K,出過書,做過CTO
      78文章數(shù) 587關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      英媒:伊朗最高領袖病重昏迷 無法參與任何國家決策

      頭條要聞

      英媒:伊朗最高領袖病重昏迷 無法參與任何國家決策

      體育要聞

      官宣簽約“AI球員”,這支球隊被罵慘了...

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產(chǎn)

      財經(jīng)要聞

      10萬億財政轉(zhuǎn)移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態(tài)體驗

      態(tài)度原創(chuàng)

      健康
      家居
      數(shù)碼
      藝術
      教育

      干細胞抗衰4大誤區(qū),90%的人都中招

      家居要聞

      雅致愜意 感知生活之美

      數(shù)碼要聞

      榮耀多款新品PC定檔,方飛透露WIN游戲本將成為三角洲聯(lián)賽指定本

      藝術要聞

      美麗風光看不盡

      教育要聞

      高校官宣:教師,沒有“非升即走”!

      無障礙瀏覽 進入關懷版