<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

騰訊混元OCR大模型，本地部署，實測

2025-12-04 23:08:32　來源: 機器學習與Python社區

北京舉報

0

分享至

大家好，我是章北海

前文我升了 CUDA、部署了 DeepSeek-OCR
重寫的 API 也支持 PaddleOCR-VL

然后騰訊也來了：，文中我提到想等等看新版 vLLM 來了再部署

可是看到 N 多同學部署失敗，還有 HunyuanOCR 到底需要多少顯存可以跑起來有點疑問。

前文我就提到，可能是官方文檔寫錯了現存和磁盤空間，當時寫的是需要 80GB 顯存

后來修改成了 20GB

官方文檔將顯存需求從 80GB 改成了 20GB，即便如此也有點離譜，畢竟只是 1B 的模型安裝及模型啟動 - 官方教程

我沒有使用官方教程，感覺。。。太麻煩了

1 是失敗概率蠻高，依賴太多，安裝環境不能用 pip，必須使用 uv

2 是我是在離線環境部署，所以下面方式對我無效

uv venv hunyuanocr
source hunyuanocr/bin/activate


uv pip install -U vllm --pre --extra-index-url https://wheels.vllm.ai/nightly

模型啟動就簡單了，只要前面 vLLM 安裝順利，下面就幾乎不會出問題

出問題，大概率是 CUDA 版本太低造成的，建議 12.9 以上，畢竟未來 vLLM 0.11.1 之后版本默認就要 12.9 起步了

下載好 HunyuanOCR 模型文件后正常啟動就行

# 模型啟動-官方教程
vllm serve tencent/HunyuanOCR \
    --no-enable-prefix-caching \
    --mm-processor-cache-gb 0 \
    --gpu-memory-utilization 0.2

安裝及模型啟動 - 我的方式

最省心，省事兒，離線最友好的方式必須是 Docker

第一步，拉取 vllm/vllm-openai 官方鏡像，選最近的一個 nightly 即可

docker pull vllm/vllm-openai:nightly

直達：https://hub.docker.com/r/vllm/vllm-openai/tags

第二步，保存鏡像到內網，如果本機測試那就沒這一步了

第三步，啟動模型，核心參數和官方教程沒啥區別

docker run --rm --runtime=nvidia --name Hunyuan-ocr --ipc=host --gpus '"device=1"' -p 5000:8000 -v /data/llm-models:/models vllm/vllm-openai:nightly
--model /models/HunyuanOCR --port 8000  --no-enable-prefix-caching --mm-processor-cache-gb 0

我的顯卡是 24GB 的 4090

模型只占 1.9GB，其他都是 KV cache 占用

官方教程中的模型調用貌似也不太友好啊，我還是用了為 DeeoSeekOCR 寫的 API，簡單修改后依然很好用

速度飛快，5 頁的 PDF 也是秒秒鐘搞定

回到最開始問題，啟動模型加上參數 --gpu-memory-utilization 0.66，也就是 16GB 啟動模型，依然是 OK 的

而且速度絲毫沒有下降

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

性能真的不重要了嗎？Jeff Dean給出反常答案

新智元 2025-12-28 17:20:51
0 跟貼 0
成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0

大模型API的大眾點評來了：7×24小時實測，毫秒級延遲智能路由

量子位 2026-02-02 11:48:44
0 跟貼 0

推理新范式：動態效能算法讓算力資源實現最大化

智東西 2025-11-12 19:58:10
0 跟貼 0
不上云、不租卡，如何優雅地在本地微調Qwen-VL-30B？

機器之心Pro 2026-01-13 12:57:27
0 跟貼 0

親兒子也照罰！微信封禁元寶鏈接，網友直呼六親不認

時光流轉追夢人 2026-02-11 17:32:53
0 跟貼 0

讓兩個大模型在線吵架，跑通全網95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0
特斯拉騰訊首次合作，新老Model 3/Y車主爽到了

智能車參考 2026-02-11 14:39:36
61 跟貼 61

到底還有多少游戲在用騰訊會議開黑啊！

游戲動力ATK 2026-02-12 04:31:31
0 跟貼 0
重塑軟件工程：從Vibe Coding走向Spec Coding

鈦媒體APP 2026-02-11 09:37:53
17 跟貼 17
被大量涂黑的愛潑斯坦文件只能是黑對手的工具而不是透明（一）

王小東 2026-02-11 20:04:34
29 跟貼 29
俄羅斯與歐盟會打起來嗎？

新民晚報 2026-02-11 10:51:31
23806 跟貼 23806
騰訊虛幻5單機項目《Project T》曝光！Epic宣布《堡壘之夜》反作弊再升級

游戲頭條 2026-02-12 08:06:38
0 跟貼 0
從里海出擊：伊朗的死穴，不在波斯灣；一文看懂美伊軍事部署

柳北 2026-02-07 20:10:35
144 跟貼 144
大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0
讓爸媽用百度文庫做PPT，他們提前給我發了個大紅包

AI異類 2026-02-11 23:00:16
0 跟貼 0
QQ發布27周年總結報告，經典功能回歸成年度亮點

財經網科技 2026-02-10 13:00:18
0 跟貼 0
永輝超市CEO發全員信：在追求規模的道路上，欲望超越了能力，今年戰略聚焦三大方向

紅星資本局 2026-02-11 11:59:45
566 跟貼 566
天下苦CUDA久矣，又一國產方案上桌了

量子位 2026-01-30 21:59:52
3 跟貼 3
國補資金625億元就位

財聯社 2026-02-11 10:44:08
1425 跟貼 1425
刪除黑賬不犯法，刪文件才犯法

海韻影視劇 2026-02-11 17:44:56
1 跟貼 1
因“太像人”而被迫消失？OpenAI為何永久關停GPT-4o

華爾街見聞官方 2026-02-10 15:44:28
3 跟貼 3
南科大不是985？畢業生卻被華為騰訊瘋搶！

老蓋實話升學 2026-02-12 04:04:16
0 跟貼 0
實測：這款能“訓練”血管的血壓計，是黑科技還是智商稅？

吳糖氣泡水呀 2026-02-10 15:51:41
2 跟貼 2
美方指控中方曾于2020年6月開展核爆炸試驗中方回應

財聯社 2026-02-11 15:54:18
140 跟貼 140
風云T11探店實測，限時立減1萬！大六座豪華 SUV 到底值不值沖？

科技客評 2026-02-11 14:23:40
2 跟貼 2
女子騎電動車獨自從上海返回廣西南寧，歷時近兩個月，行程3000多公里

極目新聞 2026-02-11 15:30:38
181 跟貼 181
祝賀！長征十號一級箭體安全濺落預定海域（新華網）

北青網-北京青年報 2026-02-11 17:35:35
433 跟貼 433
Deepseek、智譜、MiniMax，集體宣布上新

每日經濟新聞 2026-02-12 07:49:04
0 跟貼 0
遼寧GDP增速，為什么全國倒第一？

中國日報網 2026-02-11 11:43:05
473 跟貼 473
RLinf-USER發布！別再用仿真，真實世界訓練也能極致效率與系統化

機器之心Pro 2026-02-11 11:35:03
0 跟貼 0
浙江寧波一餐廳大圓桌可坐55人，網友調侃“有些菜，一旦錯過就不再”；餐廳回應：年底人多，需提前3天預定

極目新聞 2026-02-11 13:09:25
5010 跟貼 5010
全國首個！超3萬卡國產AI算力上線，喂飽萬億參數大模型

新智元 2026-02-12 03:40:05
0 跟貼 0
接好運！貴陽一公司把10元刮刮樂當開單獎，員工隨手一刮中30萬元，當事人：將作為孩子的教育基金

揚子晚報 2026-02-11 12:39:39
3863 跟貼 3863
哥倫比亞總統險遭暗殺攜子女緊急改道繞飛4小時逃生

中國新聞周刊 2026-02-11 20:49:03
93 跟貼 93
女子和男友生氣，直接給自己氣成模型了，男友差點笑進ICU

甜心萌物醬i 2026-02-08 16:31:24
0 跟貼 0
女子將敬酒服穿臟后，將吊牌重新焊接退貨退款，商家：估計學的電焊專業

大象新聞 2026-02-11 19:45:21
533 跟貼 533
山西一高速路邊發現一只小獅子，當地：動物園運輸途中出逃，“很小很溫順”，已經歸還

瀟湘晨報 2026-02-11 18:23:20
44 跟貼 44
生活的一道獨特風景

制造原理v 2026-02-11 12:08:37
0 跟貼 0
26號！適馬35mm F1.4 DG II | Art鏡頭

相機Beta 2026-02-12 01:23:28
0 跟貼 0

愛潑斯坦案亞裔受害者發聲：被帶進紅房間，被逼迫帶女孩同行

愛潑斯坦案亞裔受害者發聲：被帶進紅房間，被逼迫帶女孩同行

法老不說教

2026-02-11 17:08:59

精神小妹的生活原來是這樣的！網友：終于知道她們為啥都這么瘦了

精神小妹的生活原來是這樣的！網友：終于知道她們為啥都這么瘦了

深度報

2026-02-11 23:35:03

陶琳回應特斯拉中國銷量下滑真相！還預告了FSD入華進展

陶琳回應特斯拉中國銷量下滑真相！還預告了FSD入華進展

車東西

2026-02-09 18:43:34

破案了！看了牢A的直播后，終于知道宋祖兒為什么會被全網黑了！

破案了！看了牢A的直播后，終于知道宋祖兒為什么會被全網黑了！

樂悠悠娛樂

2026-01-22 08:57:21

央視動真格了！2026春晚大換血，趙本山當年的狠話終于應驗

央視動真格了！2026春晚大換血，趙本山當年的狠話終于應驗

絢麗的畫卷

2026-02-07 13:53:12

冠軍聯賽三連冠+賽季第三冠！塞爾比輕取吳宜澤斬獲巡回賽第41冠

冠軍聯賽三連冠+賽季第三冠！塞爾比輕取吳宜澤斬獲巡回賽第41冠

世界體壇觀察家

2026-02-12 06:33:50

清算終于開始了！一個要求，震動東京：中國要求日本限期內歸還

清算終于開始了！一個要求，震動東京：中國要求日本限期內歸還

壹知眠羊

2026-01-28 22:03:28

隨著利物浦1-0，曼城3-0，維拉1-0，英超最新積分榜出爐

隨著利物浦1-0，曼城3-0，維拉1-0，英超最新積分榜出爐

側身凌空斬

2026-02-12 06:34:40

美股三大股指收盤普跌美光科技漲近10%

美股三大股指收盤普跌美光科技漲近10%

每日經濟新聞

2026-02-12 05:10:06

巨力索具：網傳“中標4.58億海南火箭海上回收系統項目”等不實

巨力索具：網傳“中標4.58億海南火箭海上回收系統項目”等不實

界面新聞

2026-02-11 20:42:45

地點：內蒙古！“拍蠅打虎”一晚四連擊！

地點：內蒙古！“拍蠅打虎”一晚四連擊！

看看新聞Knews

2026-02-11 17:52:04

罪有應得！官方徹查后，閆學晶再迎噩耗，她最擔心的事還是發生了

罪有應得！官方徹查后，閆學晶再迎噩耗，她最擔心的事還是發生了

來科點譜

2026-01-23 11:08:02

王晶談萬梓良晚年凄涼！稱其不懂江湖規矩，演戲夸張對手很難接

王晶談萬梓良晚年凄涼！稱其不懂江湖規矩，演戲夸張對手很難接

小徐講八卦

2026-02-11 11:40:12

光速打臉，弗蘭克賽后說自己1000%會繼續帶隊，不到24h就下課

光速打臉，弗蘭克賽后說自己1000%會繼續帶隊，不到24h就下課

懂球帝

2026-02-11 19:25:06

拓媒：楊瀚森在場上太笨拙，這樣很難在NBA生存

拓媒：楊瀚森在場上太笨拙，這樣很難在NBA生存

懂球帝

2026-02-11 17:37:02

已婚也逃不過！在愛潑斯坦的安排下，比爾蓋茨和安妮·海瑟薇會面

已婚也逃不過！在愛潑斯坦的安排下，比爾蓋茨和安妮·海瑟薇會面

全球風情大揭秘

2026-02-09 18:41:27

加拿大2000人小鎮唯一中學突發槍案10死，女槍手穿連衣裙作案，疑自殺身亡

加拿大2000人小鎮唯一中學突發槍案10死，女槍手穿連衣裙作案，疑自殺身亡

紅星新聞

2026-02-11 12:09:14

直線拉升！黃金、白銀再度爆發！倫敦金現 COMEX黃金均重回5100美元/盎司上方

直線拉升！黃金、白銀再度爆發！倫敦金現 COMEX黃金均重回5100美元/盎司上方

每日經濟新聞

2026-02-12 00:07:14

被無數人吐槽的“反人類設計”，知道正確用法后我集體破防了……

被無數人吐槽的“反人類設計”，知道正確用法后我集體破防了……

暢談裝修

2026-02-10 18:08:05

和謝賢分手7年后，40歲Coco胖到認不出，拿著巨額分手費周游世界

和謝賢分手7年后，40歲Coco胖到認不出，拿著巨額分手費周游世界

小熊侃史

2026-02-11 12:57:49

機器學習與Python社區

機器學習算法與Python

3247文章數 11085關注度

往期回顧全部

科技要聞

傳蘋果新Siri再遇挫多項AI功能或推遲發布

頭條要聞

牛彈琴：德國真急了要學習中國好榜樣中國要防幺蛾子

頭條要聞

牛彈琴：德國真急了要學習中國好榜樣中國要防幺蛾子

體育要聞

搞垮一個冬奧選手，只需要一首歌?

娛樂要聞

大孤山風波愈演愈烈超50位明星扎堆

財經要聞

這個春節，中美AI“隔空開打”

汽車要聞

比亞迪最美B級SUV? 宋Ultra這腰線美翻了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

旅游

健康

藝術

家居

手機要聞

請更新：蘋果iOS / iPadOS 26.3已修復37個安全漏洞

旅游要聞

呂梁市2026年春節主題旅游線路

轉頭就暈的耳石癥，能開車上班嗎？

藝術要聞

這幅草書14個字，您能認全嗎？顏柳歐趙品析，唯鐘歐體氣節

家居要聞

簡雅閑居靜享時光柔

寧靜港灣靈動與詩意
山院煥新雅聚悅親朋
現代輕奢溫馨治愈系

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sub id="ojsin"><tfoot id="ojsin"></tfoot></sub>

<sub id="ojsin"><p id="ojsin"></p></sub><cite id="ojsin"></cite>

<sub id="ojsin"></sub>

<style id="ojsin"><table id="ojsin"></table></style>

<cite id="ojsin"></cite>

<sub id="ojsin"><i id="ojsin"></i></sub>