<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      如何在Kubernetes上運行AI/ML?

      0
      分享至

        在機器學(xué)習(xí)(ML)領(lǐng)域,訓(xùn)練出高性能模型只是第一步,真正的挑戰(zhàn)在于如何將模型快速、可靠且經(jīng)濟、高效地部署到生產(chǎn)環(huán)境中進行推理。特別是在大規(guī)模場景下,GPU資源管理、延遲優(yōu)化、批處理策略、模型版本控制、可觀測性以及輔助服務(wù)(如預(yù)處理器、特征存儲庫和向量數(shù)據(jù)庫)的編排,都是亟待解決的難題。Kubernetes作為容器編排領(lǐng)域的佼佼者,為AI/ML應(yīng)用提供了一個可擴展、可移植的平臺,不僅能夠有效管理GPU等計算資源,還能自動調(diào)整工作負載規(guī)模,以應(yīng)對批處理任務(wù)以及實時推理的不同需求。

        Kubernetes,一個為AI/ML高效分配資源的理想平臺

        Kubernetes通過其強大的調(diào)度能力,能夠高效分配GPU和其他計算資源,實現(xiàn)工作負載的緊密打包和自動伸縮。同時,還能協(xié)調(diào)包含模型服務(wù)器、預(yù)處理器、向量數(shù)據(jù)庫和特征存儲在內(nèi)的復(fù)雜系統(tǒng),確保低延遲端點的穩(wěn)定運行。容器化技術(shù)為模型環(huán)境提供了可重復(fù)性和一致性,使得模型的持續(xù)集成與持續(xù)部署(CI/CD)成為可能。Kubernetes內(nèi)置的滾動更新、流量分割以及指標(biāo)追蹤功能,進一步增強了生產(chǎn)環(huán)境的安全性和可靠性。

        對于追求操作簡便性的團隊,托管端點服務(wù)或許是一個選擇,但在需要高度控制、可移植性、高級編排以及實時服務(wù)能力的場景下,Kubernetes無疑是首選。

        典型ML推理設(shè)置,KServe在Kubernetes上的應(yīng)用

        使用KServe在Kubernetes上進行機器學(xué)習(xí)推理,有一個典型架構(gòu),那就是客戶端(如數(shù)據(jù)科學(xué)家、應(yīng)用程序或批處理作業(yè))通過Ingress向KServe的InferenceService發(fā)送請求。內(nèi)部,通過可選的Transformer組件負責(zé)預(yù)處理輸入數(shù)據(jù),預(yù)測器用來加載模型并提供預(yù)測功能,而可選的解釋器則提供模型洞察。模型工件從模型存儲中提取,并通過TensorFlow、PyTorch、scikit-learn、ONNX或Triton等運行時進行處理。整個系統(tǒng)運行在Knative/Kubernetes之上,支持CPU和GPU計算層,并可與AWS、Azure、Google Cloud等云服務(wù)提供商集成。


        至于,MLFlow與KServe的集成如何操作?MLFlow是一個開源的機器學(xué)習(xí)框架,旨在解決模型從實驗到生產(chǎn)過程中遇到的常見問題,如實驗數(shù)據(jù)丟失、結(jié)果重現(xiàn)困難以及模型版本管理混亂。它通過跟蹤運行情況、保存環(huán)境代碼和管理模型版本,為模型部署提供了有序的流程。MLFlow還支持將模型打包為Docker鏡像,便于分發(fā)到Kubernetes等服務(wù)平臺。

        MLFlow與Kubernetes的集成,有一個關(guān)鍵點需要注意,雖然MLFlow提供了基于FastAPI的推理服務(wù)器,并通過mlflow models build-docker命令支持容器化部署,但這種方法在大規(guī)模生產(chǎn)環(huán)境中可能不夠高效。FastAPI的輕量級特性使其難以應(yīng)對極端并發(fā)或復(fù)雜的自動伸縮模式。相比之下,KServe(前身為KFServing)為TensorFlow、XGBoost、scikit-learn和PyTorch等主流機器學(xué)習(xí)庫提供了高性能、可擴展且與框架無關(guān)的推理平臺。

        更好地托管AutoML,把Azure ML轉(zhuǎn)為AKS

        首先,Azure ML與AKS進行集成。Azure ML是一個全面的機器學(xué)習(xí)生命周期管理平臺,支持實驗跟蹤、模型注冊表、訓(xùn)練、部署和監(jiān)控。對于需要高度控制運行時、擴展和網(wǎng)絡(luò)的場景,Azure Kubernetes Service(AKS)是一個理想的選擇。它允許自定義運行時、進行嚴格的性能調(diào)整,并與現(xiàn)有Kubernetes基礎(chǔ)設(shè)施集成。

        其次,進行分步操作,在AKS上部署Azure ML AutoML模型。

        讓Kubernetes上的LLM服務(wù)更好地運行,還需要vLLM與KServe的集成。接下來的問題是,如何把LLM與Kubernetes進行結(jié)合?在Kubernetes上運行大型語言模型(LLM)可以實現(xiàn)可靠、可擴展且可重復(fù)的推理。Kubernetes提供了GPU調(diào)度、自動伸縮和基本功能編排,而vLLM等優(yōu)化運行時則提供了高通量、高內(nèi)存效率的推理能力。通過結(jié)合請求批處理和可觀測性(指標(biāo)、日志記錄和健康檢查),可以提供低延遲的API服務(wù)。

        使用vLLM和KServe部署LLM的步驟如下:

        1.準(zhǔn)備集群和KServe。配置Kubernetes集群(AKS/GKE/EKS或本地),并安裝KServe。

        2.獲取vLLM??寺LLM倉庫,安裝vLLM,并在本地測試vllm serve命令。

        3.創(chuàng)建vLLM服務(wù)運行時/容器。構(gòu)建容器鏡像,或使用KServe支持的vLLM服務(wù)時間配置。

        4.部署InferenceService。應(yīng)用KServe InferenceService YAML文件,引用vLLM服務(wù)的運行時和模型存儲。

        5.驗證和調(diào)諧。通過Ingress/負載均衡器調(diào)用端點,測量延遲/吞吐量,并調(diào)整vLLM批處理/令牌緩存設(shè)置和KServe自動伸縮規(guī)則。

        另外, vLLM、KServe,還要與BentoML進行集成。vLLM,作為高通量、GPU高效的推理引擎,負責(zé)實際執(zhí)行LLM;BentoML,封裝模型加載、自定義預(yù)處理/后處理以及穩(wěn)定的REST/gRPC API,構(gòu)建可重復(fù)的Docker鏡像或工件;KServe,作為Kubernetes控制平面,部署B(yǎng)ento鏡像或vLLM鏡像,并處理自動伸縮、路由、健康檢查和生命周期管理。最終,通過BentoML打包模型和請求邏輯,KServe將該容器以InferenceService的形式運行,提供自動伸縮、流量控制和可觀測性。

        值得一提的是,不同的技術(shù)路線選擇,都有自己的優(yōu)缺點。KServe作為Kubernetes-原生機器學(xué)習(xí)服務(wù)與編排框架,提供了豐富的路由、內(nèi)置遙測和解釋器集成以及多運行時支持,但學(xué)習(xí)曲線較陡,操作面較大。BentoML以Python為中心,提供了出色的開發(fā)者人體工學(xué)設(shè)計和可重復(fù)的圖像,但集群原生控件較少。NVIDIA Triton推理服務(wù)器則以其出色的GPU吞吐量和混合幀支持著稱,但同樣需要額外的設(shè)置來實現(xiàn)自動伸縮和高級Kubernetes操作。

        結(jié)論

        在生產(chǎn)環(huán)境中運行可靠、低延遲的AI/ML應(yīng)用,同時控制成本、性能和可重復(fù)性,是每個ML團隊的目標(biāo)。Kubernetes通過其強大的編排能力,為模型及其支持服務(wù)提供了所需的資源管理和自動伸縮功能。結(jié)合優(yōu)化的運行時、服務(wù)層和推理引擎,我們可以在保持高輸入性能的同時,獲得生產(chǎn)級操作控制。從小處著手,使用單個模型進行驗證,然后根據(jù)清晰的SLO選擇符合性能和操作需求的服務(wù)棧,最終迭代出彈性且可擴展的服務(wù)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      “戲混子”又來霍霍年代?。坷蠚鈾M秋、演技拉胯,難怪觀眾不買賬

      “戲混子”又來霍霍年代???老氣橫秋、演技拉胯,難怪觀眾不買賬

      風(fēng)月得自難尋
      2026-03-29 03:27:16
      4名U23首秀+10名小將!國足這場大變臉,把世界杯球隊跑抽筋了!

      4名U23首秀+10名小將!國足這場大變臉,把世界杯球隊跑抽筋了!

      看透足球?qū)?/span>
      2026-03-28 08:17:40
      上海今最高23.3℃!緊隨春暖花開后的是大雨、大風(fēng)和雷電

      上海今最高23.3℃!緊隨春暖花開后的是大雨、大風(fēng)和雷電

      文匯報
      2026-03-28 19:21:18
      女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

      女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

      帶你感受人間冷暖
      2026-01-27 00:20:06
      巴曙松集資案,是對股市一次精準(zhǔn)的“黑天鵝”

      巴曙松集資案,是對股市一次精準(zhǔn)的“黑天鵝”

      法經(jīng)社
      2026-03-28 18:25:53
      以色列想不通,短短幾個月,為何伊朗變得如此強大了呢?

      以色列想不通,短短幾個月,為何伊朗變得如此強大了呢?

      農(nóng)夫史記
      2026-03-27 20:54:52
      養(yǎng)肥了再宰?蒙古對西方巨頭下手了,這一刀也給中國提了個醒

      養(yǎng)肥了再宰?蒙古對西方巨頭下手了,這一刀也給中國提了個醒

      財經(jīng)保探長
      2026-03-19 19:39:45
      現(xiàn)實生活中,間諜都是怎么暴露的?網(wǎng)友:百密一疏呀

      現(xiàn)實生活中,間諜都是怎么暴露的?網(wǎng)友:百密一疏呀

      夜深愛雜談
      2026-03-27 20:48:13
      美國“最強導(dǎo)彈”,擊落了美國“最強戰(zhàn)機”

      美國“最強導(dǎo)彈”,擊落了美國“最強戰(zhàn)機”

      中國新聞周刊
      2026-03-28 12:05:18
      33歲男星暴尸泰國水溝,最新疑點披露

      33歲男星暴尸泰國水溝,最新疑點披露

      大風(fēng)新聞
      2026-03-28 20:57:04
      做教培的閨蜜:張雪峰身價8億,為啥還吃外賣?她的回答讓我沉默

      做教培的閨蜜:張雪峰身價8億,為啥還吃外賣?她的回答讓我沉默

      藍色海邊
      2026-03-27 18:08:02
      奪命電飯煲已被曝光!米飯進去秒變毒藥,內(nèi)膽是肝癌催化劑?

      奪命電飯煲已被曝光!米飯進去秒變毒藥,內(nèi)膽是肝癌催化劑?

      岐黃傳人孫大夫
      2026-03-16 18:47:19
      2小時閉門激戰(zhàn)!心腹當(dāng)場倒戈?馬英九急撤殺招,藍營內(nèi)斗迎3結(jié)局

      2小時閉門激戰(zhàn)!心腹當(dāng)場倒戈?馬英九急撤殺招,藍營內(nèi)斗迎3結(jié)局

      杰絲聊古今
      2026-03-29 00:06:40
      iPhone4回收價從5元暴漲到400元

      iPhone4回收價從5元暴漲到400元

      都市快報橙柿互動
      2026-03-27 00:31:22
      金價一夜變天!2026年3月28日最新報價,全國金價竟然差這么多?

      金價一夜變天!2026年3月28日最新報價,全國金價竟然差這么多?

      趣味萌寵的日常
      2026-03-28 13:02:06
      《逐玉》張凌赫被嘲“粉底液將軍”,央視都看不下去了,發(fā)文力挺

      《逐玉》張凌赫被嘲“粉底液將軍”,央視都看不下去了,發(fā)文力挺

      娛樂故事
      2026-03-26 17:11:11
      初選結(jié)果出爐:徐欣瑩50.63%險勝楊瓊櫻,差距僅1%

      初選結(jié)果出爐:徐欣瑩50.63%險勝楊瓊櫻,差距僅1%

      琨玉秋霜
      2026-03-28 22:55:57
      美媒:對不起殲-20和殲-35,“新款”F-22戰(zhàn)斗機已經(jīng)揭開神秘面紗

      美媒:對不起殲-20和殲-35,“新款”F-22戰(zhàn)斗機已經(jīng)揭開神秘面紗

      零度Military
      2026-03-26 22:20:35
      破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭什么?

      破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭什么?

      川渝視覺
      2026-03-23 19:26:44
      特朗普撂挑子不干了,以色列卻冒險轟炸俄羅斯大樓,普京有言在先

      特朗普撂挑子不干了,以色列卻冒險轟炸俄羅斯大樓,普京有言在先

      興史興談
      2026-03-29 02:56:38
      2026-03-29 04:08:49
      ITPUB學(xué)院
      ITPUB學(xué)院
      分享技術(shù)干貨,了解最新動態(tài)
      1190文章數(shù) 629關(guān)注度
      往期回顧 全部

      科技要聞

      華為盤古大模型負責(zé)人王云鶴確認離職

      頭條要聞

      美媒:和歐盟"外長"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

      頭條要聞

      美媒:和歐盟"外長"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

      體育要聞

      “我是全家最差勁的運動員”

      娛樂要聞

      陳牧馳陳冰官宣得子 曬一家三口握拳照

      財經(jīng)要聞

      臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

      汽車要聞

      置換補貼價4.28萬起 第五代宏光MINIEV正式上市

      態(tài)度原創(chuàng)

      時尚
      親子
      藝術(shù)
      本地
      軍事航空

      和田曦薇一樣嫩嘟嘟,這3個變美技巧你一定不能錯過!

      親子要聞

      小孩子能口無遮攔到什么程度!網(wǎng)友:恨不得當(dāng)場找個地縫鉆進去

      藝術(shù)要聞

      不可思議的芭蕾之美,竟讓人屏息凝視!

      本地新聞

      在濰坊待了三天,沒遇到一個“濰坊人”

      軍事要聞

      美軍中東基地損失最新披露

      無障礙瀏覽 進入關(guān)懷版