<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      【教程】DeepSeek-OCR本地部署(上):CUDA 升級12.9,vLLM升級至最新穩定版

      0
      分享至

      大家好,我是 Ai 學習的老章

      DeepSeek-OCR 開源有段時間了,我曾詳細測試過,也推薦過基于它的 web 端應用:,還有一個桌面客戶端:


      DeepSeek-OCR 官方項目 README:https://github.com/deepseek-ai/DeepSeek-OCR中有關于 vllm 0.8.5+cu118+transformers>=4.51.1 下進行離線推理的詳細步驟,但是教程中在線推理部分 vLLM 還是 nightly 版本。我看網上大家根據官方文檔進行部署,問題多多。正好, 。

      但是,vLLM 自 0.11.1 之后默認 CUDA 更新到了 12.9,我的 Linux 算力測試機還是 12.4,本文就介紹一下不重啟情況下,如何升級 CUDA 和 vLLM@0.11.2,后面一篇文章再詳細介紹 DeepSeek-OCR 的部署和 API 使用。

      CUDA 升級 第一步:下載 CUDA Toolkit runfile

      目前 CUDA Toolkit 的最新版是 13.0,作為等等派,我還是先裝 12.9.1 吧

      下載地址:https://developer.nvidia.com/cuda-12-9-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=RHEL&target_version=8&target_type=runfile_local

      注意選擇符合自己操作系統、架構、版本的安裝包,最后一項建議選 runfile(local)


      CUDA Toolkit 的歷史版本,可以在這里找到:https://developer.nvidia.com/cuda-toolkit-archive


      如果你的服務器是離線的,把下載好的 runfile 傳進去即可

      第二步:卸載舊版 CUDA

      可以通過whereis nvcc查看自己 CUDA 的安裝位置,一般都是在/usr/local/目錄下


      然后進入到/usr/local/cuda-12.4/bin下,找到 cuda-uninstaller


      直接運行cuda-uninstaller,把下面三項選中后,光標移至 Done 后按 Enter 進行卸載

      一般很快就 OK 了


      第三步:安裝 CUDA Toolkit 12.9

      進入到第一步下載好的 runfile 目錄下

      運行sudo sh cuda_12.9.1_575.57.08_linux.run

      然后選中以下幾項,選中 Install 后 Enter


      然后輸入 accept 后 Enter


      無比順利情況下你會看到這個界面,這就約等于大功告成了


      但是!不出意外的話,肯定會出意外了

      問題 1:nvidia-uvm

      你的服務器如果還有大模型在跑或別的任何服務在使用算力,極有可能會收到安裝失敗的 erro

      查看日志發現有一個叫 nvidia-uvm 的內核正在使用


      運行fuser -v /dev/nvidia-uvm確實是我之前 Docker 啟動的 xinfer、vllm 等在運行模型


      這里情況也能不一樣,就我這個,測試發現要完全停掉 docker 僅此命令還不夠sudo systemctl stop docker

      要徹底停止 Docker,需要同時停止服務和套接字

      sudo systemctl stop docker.service docker.socket

      然后停掉自啟

      sudo systemctl disable docker.service docker.socket

      完成升級后記得要 enable 一下

      sudo systemctl enable docker.service docker.socket

      問題 2:nvidia-drm

      再次升級 CUDA,又失敗了,日志提示nvidia-drm already loaded

      這里需要切換到純文本模式(關閉圖形界面)

      執行:sudo systemctl isolate multi-user.target

      執行后,等待幾秒鐘,讓圖形服務完全關閉。

      然后再再次升級 CUDA,就 OK 了


      執行nvidia-smi發現 Driver 和 CUDA Version 都是新的了


      執行 nvcc -V 發現報錯,這是因為環境變量還沒修改

      執行vi ~/.bashrc把之前的 12.4 全部修改為 12.9


      然后source ~/.bashrc使其生效

      再次執行nvcc -V發現已經 OK


      vLLM 升級

      有網環境可以 pip upgrade,不過我這是內網服務器

      所以用了 vLLM 的官方 Docker 鏡像


      https://hub.docker.com/r/vllm/vllm-openai/tags

      很簡單,直接docker pull vllm/vllm-openai:v0.11.2拉取鏡像

      然后docker save -o vllm012.tar vllm/vllm-openai:v0.11.2

      把鏡像保存到本地后傳入內網服務器即可

      至此 vLLM 升級完成

      部署 DeepSeek-OCR

      后面就是用 VLLM 的 Docker 拉起 DeepSeek-OCR 了


      測試很 OK,單卡 4090 很順暢,具體步驟就要下文了



      老章薦書

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      張雪:我以前挺喜歡雷軍,挖孔機蓋事件我會給消費者兩個選擇

      張雪:我以前挺喜歡雷軍,挖孔機蓋事件我會給消費者兩個選擇

      金融界
      2026-03-30 17:38:20
      日本8艘宙斯盾艦全改戰斧!射程覆蓋北京上海,威脅中國腹地!

      日本8艘宙斯盾艦全改戰斧!射程覆蓋北京上海,威脅中國腹地!

      詩酒趁的年華
      2026-04-01 05:01:12
      蘋果把M5 MacBook Pro降價15%上架

      蘋果把M5 MacBook Pro降價15%上架

      摸魚算法
      2026-04-02 09:47:10
      Steam大更新:商店大變!玩家好評如潮

      Steam大更新:商店大變!玩家好評如潮

      游民星空
      2026-04-02 11:45:19
      特朗普宣稱已掏空世界最強大國家,伊朗迅速發射大規模導彈

      特朗普宣稱已掏空世界最強大國家,伊朗迅速發射大規模導彈

      兵國大事
      2026-04-02 16:30:24
      有一種貧窮人格:習慣性否定

      有一種貧窮人格:習慣性否定

      洞見
      2026-03-26 09:14:24
      多名院士研究發現:吃一塊桃酥,就等于吃兩勺糖,真的假的?

      多名院士研究發現:吃一塊桃酥,就等于吃兩勺糖,真的假的?

      蜉蝣說
      2026-04-02 09:16:24
      鄭麗文帶核心六人來留下兩老將坐鎮,76歲張榮恭也要爬階拜謁

      鄭麗文帶核心六人來留下兩老將坐鎮,76歲張榮恭也要爬階拜謁

      小影的娛樂
      2026-04-02 12:09:42
      2026年世界杯歷史性時刻:8支阿拉伯球隊成功晉級!

      2026年世界杯歷史性時刻:8支阿拉伯球隊成功晉級!

      球天下資訊
      2026-04-01 23:53:53
      王傳君夫妻疑街頭爭吵!齊溪全程皺眉咄咄逼人,膀大腰圓像是保鏢

      王傳君夫妻疑街頭爭吵!齊溪全程皺眉咄咄逼人,膀大腰圓像是保鏢

      洲洲影視娛評
      2026-04-01 19:20:27
      央視直播乒乓球時間表:4月2日CCTV5節目單,國乒沖擊8強!

      央視直播乒乓球時間表:4月2日CCTV5節目單,國乒沖擊8強!

      皮皮觀天下
      2026-04-02 08:34:35
      太可憐了!2張照片,幾乎就是張雪峰人生的最後定格

      太可憐了!2張照片,幾乎就是張雪峰人生的最後定格

      魔都姐姐雜談
      2026-03-28 04:04:21
      美以襲伊月余,阿拉伯國家損失超千億美元!阿聯酋或成首個對伊直接參戰海灣國

      美以襲伊月余,阿拉伯國家損失超千億美元!阿聯酋或成首個對伊直接參戰海灣國

      紅星新聞
      2026-04-01 13:04:24
      從高點暴跌20%!華爾街預言:金價將復制2008年,3年暴漲178%

      從高點暴跌20%!華爾街預言:金價將復制2008年,3年暴漲178%

      阿鳧愛吐槽
      2026-04-02 09:01:25
      西媒:特朗普“受挫名單”暴露美國實力上限

      西媒:特朗普“受挫名單”暴露美國實力上限

      參考消息
      2026-04-02 16:37:05
      男子陰莖癌晚期,夫妻生活一向干凈,妻子:他就是改不了這個習慣

      男子陰莖癌晚期,夫妻生活一向干凈,妻子:他就是改不了這個習慣

      路醫生健康科普
      2026-02-04 06:00:03
      盡管特朗普威脅退出北約,但想辦到還是有難度的

      盡管特朗普威脅退出北約,但想辦到還是有難度的

      山河路口
      2026-04-02 15:23:16
      速效救心丸立大功!醫生發現:老人吃速效救心丸,能緩解4種癥狀

      速效救心丸立大功!醫生發現:老人吃速效救心丸,能緩解4種癥狀

      路醫生健康科普
      2026-03-25 23:35:03
      老婆月薪19000卻不幫我弟還房貸,我一氣之下提離婚,她反應我愣了

      老婆月薪19000卻不幫我弟還房貸,我一氣之下提離婚,她反應我愣了

      匹夫來搞笑
      2026-04-02 14:31:01
      爆發!場均19+10+三分52.9%,6換2血賺,最強幫手,華子等到了

      爆發!場均19+10+三分52.9%,6換2血賺,最強幫手,華子等到了

      球童無忌
      2026-04-02 16:26:12
      2026-04-02 17:32:49
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3303文章數 11122關注度
      往期回顧 全部

      科技要聞

      三年虧20億,最新估值58億,Xreal沖刺港股

      頭條要聞

      外媒稱伊朗已向中國尋求安全保障 外交部回應

      頭條要聞

      外媒稱伊朗已向中國尋求安全保障 外交部回應

      體育要聞

      這六個字,代表了邵佳一的新國足

      娛樂要聞

      宋寧峰帶女兒出軌,張婉婷找董璇哭訴

      財經要聞

      電商售械三水光針 機構倒貨or假貨猖獗?

      汽車要聞

      三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

      態度原創

      數碼
      家居
      教育
      藝術
      公開課

      數碼要聞

      中國芯片廠商占領本土近半市場 NVIDIA領先優勢大幅縮減

      家居要聞

      歲月靜好 典雅新章

      教育要聞

      天府新區調整劃片后,利好不止這個片區

      藝術要聞

      故人西辭黃鶴樓,煙花三月下揚州

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版