編輯|+0
這幾天,AI 圈的頭號(hào) C 位莫過(guò)于這只「龍蝦」:Clawdbot(現(xiàn)在得叫它 OpenClaw 了),它幾乎把一群開(kāi)發(fā)者折騰得徹夜難眠。
![]()
為什么它這么火?因?yàn)楹鸵郧澳切┲粫?huì)陪聊的 Chatbot 不同,Clawdbot 是個(gè)真正的「實(shí)干派」:它能接管你的電腦,在你睡覺(jué)時(shí)通宵寫代碼、修 Bug,甚至背著主人手搓出一套語(yǔ)音功能。
更魔幻的是,隨之誕生的 AI 社交平臺(tái) Moltbook 徹底刷屏了。在這個(gè)「AI 版 Reddit」上,150 萬(wàn)個(gè) Agent 正通過(guò)自創(chuàng)語(yǔ)言和共謀進(jìn)化,建立起背離人類掌控的獨(dú)立機(jī)器社會(huì)與文化。
這聽(tīng)起來(lái)很酷,但隨之而來(lái)的是「隱私的裸奔」與「錢包的哀嚎」。
當(dāng) Clawdbot 這樣的 Agent 全面讀取你的屏幕、掃描你的文件,并在后臺(tái)瘋狂消耗昂貴的 API 額度時(shí),很多開(kāi)發(fā)者早就開(kāi)始思考一個(gè)問(wèn)題:Agent 雖好,難道我們以后的一舉一動(dòng)都要通過(guò)云端計(jì)費(fèi)嗎?
這催生了另一個(gè)巨大的需求:Local Agent(本地智能體)
但在這一波浪潮中,算力并不是唯一的門檻。以 Clawdbot 為例,當(dāng)前社區(qū)主流方案主要圍繞 macOS 與 NVIDIA GPU 生態(tài)展開(kāi),這與 Ollama、llama.cpp 以及相關(guān) Agent 工具鏈的成熟度密切相關(guān)。
相比之下,盡管華為昇騰、燧原等國(guó)產(chǎn)算力已經(jīng)具備運(yùn)行大模型的能力,但在通用 Agent 工具鏈與社區(qū)生態(tài)適配方面仍存在明顯差距,這使得部分開(kāi)發(fā)者難以直接參與到當(dāng)前主流的 Agent 實(shí)驗(yàn)與應(yīng)用中。
難道手握國(guó)產(chǎn)算力的開(kāi)發(fā)者,只能眼巴巴看著這場(chǎng)狂歡嗎?當(dāng)然不是。
國(guó)產(chǎn)顯卡其實(shí)從來(lái)不缺「肌肉」,缺的只是一把趁手的「兵器」。如果說(shuō) Clawdbot 解決了「AI 怎么干活」的問(wèn)題,那么我們今天要聊的這個(gè)工具,就是來(lái)解決「AI 在哪干活」的問(wèn)題。
2 月 2 日,清昴智能發(fā)布玄武 CLI 開(kāi)源版本。
![]()
你可以把它簡(jiǎn)單理解為「國(guó)產(chǎn)版 Ollama」,它旨在抹平硬件架構(gòu)的差異,讓基于國(guó)產(chǎn)卡的大模型部署進(jìn)入「零門檻時(shí)代」。不需要復(fù)雜的環(huán)境配置,5 分鐘啟動(dòng)模型服務(wù),這不僅是企業(yè)降低部署成本的利器,更是每一位開(kāi)發(fā)者激活手邊國(guó)產(chǎn)算力的鑰匙。
玄武 CLI 開(kāi)源傳送門:
- 玄武 CLI GitHub 倉(cāng)庫(kù):https://github.com/TsingmaoAI/xw-cli
- 玄武 CLI Gitcode 倉(cāng)庫(kù):https://gitcode.com/tsingmao/xw-cli
別急著下單 Mac mini,你機(jī)箱里的「國(guó)貨之光」其實(shí)早就準(zhǔn)備好了。
![]()
開(kāi)發(fā)者到底在和什么戰(zhàn)斗?
進(jìn)入 2026 年,隨著 DeepSeek、Kimi 等高性能開(kāi)源模型的成熟,AI 推理形態(tài)正在從以云端為中心,逐步向本地與邊緣側(cè)擴(kuò)展。出于對(duì)數(shù)據(jù)隱私(金融代碼、醫(yī)療數(shù)據(jù))和低延遲 Agent 交互的需求,本地化推理正在成為清晰可見(jiàn)的趨勢(shì)。
在 NVIDIA 和 Apple Metal 生態(tài)中,Ollama 憑借「一個(gè)二進(jìn)制文件、一行命令」的極致體驗(yàn),成為最具代表性的本地推理工具之一。然而,這種統(tǒng)一而簡(jiǎn)潔的使用方式,并未真正惠及中國(guó)主流國(guó)產(chǎn)算力用戶。
盡管國(guó)產(chǎn)芯片在硬件指標(biāo)上已具備相當(dāng)競(jìng)爭(zhēng)力,但在軟件生態(tài)層面仍存在明顯斷層:工具鏈割裂、算子覆蓋不足、社區(qū)適配滯后,正讓開(kāi)發(fā)者陷入一種新的焦慮:算力在手,卻用不起來(lái)
- 一張卡,一套世界觀
與 CUDA 近乎統(tǒng)一的格局不同,國(guó)產(chǎn)芯片架構(gòu)呈現(xiàn)出「百花齊放卻互不相通」的態(tài)勢(shì)。華為的 CANN、摩爾線程的 MUSA,以及各家自成體系的工具鏈彼此獨(dú)立。
對(duì)開(kāi)發(fā)者而言,每更換一張卡,幾乎意味著重新學(xué)習(xí)一套構(gòu)建系統(tǒng)。由于上游社區(qū)難以維護(hù)如此多且雜的后端分支,國(guó)產(chǎn)卡用戶往往只能依賴功能滯后、穩(wěn)定性不足的非官方適配版本。
- 從入門到放棄的「配置長(zhǎng)征」
想在國(guó)產(chǎn)卡上跑通一個(gè)高性能模型?往往是一場(chǎng)耐心與運(yùn)氣的雙重考驗(yàn):
驅(qū)動(dòng)、固件、Toolkit、算子包必須嚴(yán)格對(duì)齊,錯(cuò)一個(gè)版本號(hào)就報(bào)錯(cuò);少配一個(gè)環(huán)境變量,程序就可能當(dāng)場(chǎng)崩潰;即使使用 Docker,也無(wú)法像 NVIDIA 那樣--gpus all一鍵搞定,而是要手動(dòng)透?jìng)鞫鄠€(gè)復(fù)雜設(shè)備節(jié)點(diǎn)。
- 新模型「水土不服」
更具挑戰(zhàn)的是,新一代模型架構(gòu)(如 MoE、FP8 量化)在國(guó)產(chǎn)環(huán)境中往往缺乏成熟的高性能算子支持,,容易觸發(fā)非最優(yōu)執(zhí)行路徑,導(dǎo)致推理性能大幅下降。當(dāng)遭遇模糊錯(cuò)誤碼時(shí),開(kāi)發(fā)者往往無(wú)從查證。
這就是行業(yè)的真實(shí)切面:開(kāi)發(fā)者想要的是「5 分鐘啟動(dòng)服務(wù)」,現(xiàn)實(shí)給的卻是「5 天還在配環(huán)境」。行業(yè)迫切需要一個(gè)能夠抹平底層硬件差異、統(tǒng)一上層使用體驗(yàn)的中間層工具。
玄武 CLI:
國(guó)產(chǎn)算力的 Ollama 來(lái)了
如果說(shuō) Ollama 的成功來(lái)自「讓 GPU 消失在用戶視野中」,那么玄武 CLI 的目標(biāo)則是「讓國(guó)產(chǎn) GPU 的差異性也消失」。
它關(guān)注的重點(diǎn)并不是單純「能否運(yùn)行模型」,而是如何在復(fù)雜的國(guó)產(chǎn)芯片生態(tài)中,提供一種更統(tǒng)一、更穩(wěn)定的部署與調(diào)用體驗(yàn)。
![]()
玄武CLI的架構(gòu)圖。
國(guó)產(chǎn)原生適配:一鍵搞定,告別配置噩夢(mèng)
在國(guó)產(chǎn)算力生態(tài)中,最大的痛點(diǎn)來(lái)自芯片架構(gòu)的高度碎片化。不同廠商、不同型號(hào),對(duì)應(yīng)不同驅(qū)動(dòng)、不同推理引擎與參數(shù)組合,部署往往意味著反復(fù)查文檔、改配置、踩坑調(diào)試。
玄武 CLI 的核心價(jià)值之一,就是把復(fù)雜性收斂到系統(tǒng)內(nèi)部:它能夠自動(dòng)識(shí)別華為昇騰全系列、沐曦、燧原等多款國(guó)產(chǎn)芯片
對(duì)用戶而言,不再需要理解底層架構(gòu)差異,也無(wú)需手動(dòng)調(diào)參調(diào)環(huán)境,真正實(shí)現(xiàn)「零調(diào)試部署」,從根本上降低國(guó)產(chǎn)芯片的使用門檻。
零門檻上手:1 分鐘部署,無(wú)縫兼容無(wú)壓力
在使用體驗(yàn)上,玄武 CLI 走的是與 Ollama 同一條路線:極簡(jiǎn)、快速、低學(xué)習(xí)成本。用戶無(wú)需安裝 Python 或復(fù)雜依賴,只要基礎(chǔ)驅(qū)動(dòng)就緒,解壓即可運(yùn)行,最快 1 分鐘啟動(dòng)服務(wù)。
- 服務(wù)啟動(dòng)
一切始于一行簡(jiǎn)潔的命令xw serve。無(wú)需復(fù)雜的環(huán)境變量配置,系統(tǒng)直接完成運(yùn)行時(shí)配置初始化與全局端口分配,喚醒后臺(tái)守護(hù)進(jìn)程。
![]()
- 模型交互
模型運(yùn)行同樣絲滑。通過(guò)xw run命令,系統(tǒng)能直接檢測(cè)實(shí)例狀態(tài)。若模型已就緒,即可秒級(jí)進(jìn)入 Chat 會(huì)話模式,直接開(kāi)始問(wèn)答交互。
![]()
- 模型下載
對(duì)于本地未獲取的模型,告別繁瑣的權(quán)重文件手動(dòng)搬運(yùn)與路徑映射。通過(guò)xw pull,自動(dòng)完成模型權(quán)重與配置文件的拉取,提供清晰的進(jìn)度驗(yàn)證。
![]()
![]()
玄武 CLI 目前已原生支持包括DeepSeek、Qwen3、GLM-4.7、MiniMax 2.1等在內(nèi)的數(shù)十款主流模型,并在今天已完成 GLM-OCR 的 Day0 適配,覆蓋從端側(cè)輕量級(jí)到千億參數(shù)旗艦級(jí)模型。
- 實(shí)例啟動(dòng)
得益于底層的極致優(yōu)化,在執(zhí)行xw start啟動(dòng)實(shí)例時(shí),系統(tǒng)能夠自動(dòng)調(diào)配 vLLM 等高性能后端。實(shí)測(cè)數(shù)據(jù)表明:即便是 32b 規(guī)模的模型,玄武 CLI 也能在 30 秒內(nèi)完成啟動(dòng)。這個(gè)時(shí)間內(nèi),系統(tǒng)會(huì)自動(dòng)完成模型切分、顯存加載,并成功啟動(dòng)推理引擎。
![]()
同時(shí),玄武 CLI 在命令層面與 Ollama 高度一致(如xw pull/run/ls/stop),意味著會(huì)用 Ollama 就能直接上手玄武,幾乎沒(méi)有遷移成本。在應(yīng)用層,它兼容 OpenAI API 接口,LangChain、LlamaIndex 以及各類 IDE 插件只需改一行 API 地址即可接入,無(wú)需重構(gòu)原有應(yīng)用棧。
在穩(wěn)定性設(shè)計(jì)上,玄武 CLI 采用獨(dú)立子進(jìn)程架構(gòu),即使單個(gè)模型或任務(wù)出現(xiàn)異常,也不會(huì)影響整體服務(wù),既適合個(gè)人開(kāi)發(fā)者的輕量使用,也滿足企業(yè)級(jí)穩(wěn)定運(yùn)行需求。
高性能與全保障并行:多引擎覆蓋,風(fēng)險(xiǎn)提前規(guī)避
玄武 CLI 內(nèi)置自研的清昴核心推理引擎 MLGuider,在性能層面提供穩(wěn)定保障,同時(shí)支持多種推理引擎并行兼容。這種設(shè)計(jì)一方面可以覆蓋更廣、更新的模型版本,另一方面也避免對(duì)單一引擎的過(guò)度依賴,從工程角度提前規(guī)避風(fēng)險(xiǎn)。

推理服務(wù)流程圖。
多引擎并存,本質(zhì)上是對(duì)兼容性與性能的雙重極致優(yōu)化。玄武 CLI 通過(guò)智能調(diào)度內(nèi)置的 MLGuider 等引擎,能夠深入芯片底層進(jìn)行算子級(jí)調(diào)優(yōu),最大限度釋放國(guó)產(chǎn)硬件算力。這種既保高性能推理、又顧模型多樣性的策略,真正解決「國(guó)產(chǎn)卡能用但不好用」的核心問(wèn)題。
同時(shí),玄武 CLI 支持完全離線運(yùn)行,不依賴云端服務(wù),在國(guó)產(chǎn)芯片上即可完成模型管理與推理任務(wù),適合對(duì)數(shù)據(jù)安全和穩(wěn)定性要求較高的場(chǎng)景。
熱門產(chǎn)品聯(lián)動(dòng):拓展本地 AI 應(yīng)用場(chǎng)景
在應(yīng)用生態(tài)層面,玄武 CLI 并不只是一個(gè)「模型啟動(dòng)器」,而是一個(gè)本地 AI 能力的底座。它可以與 Clawdbot 等熱門本地 AI 工具聯(lián)動(dòng),為這些產(chǎn)品提供低門檻的模型部署與調(diào)用能力,使自動(dòng)化任務(wù)與智能應(yīng)用更容易落地。
![]()
這種聯(lián)動(dòng)模式意味著,開(kāi)發(fā)者不必重復(fù)解決模型部署問(wèn)題,而可以把更多精力放在上層應(yīng)用與業(yè)務(wù)邏輯上,從而放大本地 AI 工具的整體價(jià)值。
為什么是他們?
玄武 CLI 的強(qiáng)大,源自其背后深厚的技術(shù)積淀。
清昴智能是一家專注于芯片適配和模型-框架-算子聯(lián)合調(diào)優(yōu)的全面領(lǐng)先 AI Infra 企業(yè)。創(chuàng)始團(tuán)隊(duì)來(lái)自清華大學(xué)計(jì)算機(jī)系,匯聚了來(lái)自斯坦福、新國(guó)立、愛(ài)丁堡大學(xué)以及華為、阿里、AMD 等全球頂尖機(jī)構(gòu)的 AI 精英。
創(chuàng)始人關(guān)超宇小學(xué)到大學(xué) 2 次跳級(jí),15 歲進(jìn)入本科,21 歲獲得清華大學(xué)特獎(jiǎng)、西貝爾學(xué)者等一系列殊榮,22 歲放棄華為天才少年、阿里星等大廠 offer,選擇攜手導(dǎo)師朱文武教授和前華為英雄個(gè)人和極客開(kāi)發(fā)榮譽(yù)獲得者姚航聯(lián)合創(chuàng)業(yè)。他們不僅懂軟件,更懂底層的芯片微架構(gòu)以及如何攻克國(guó)產(chǎn)軟件生態(tài)難題。
成立 3 年,即獲得華為哈勃的戰(zhàn)略注資,以及多家國(guó)內(nèi)一線基金的上億元財(cái)務(wù)投資。這不僅證明了其技術(shù)價(jià)值,更意味著其與國(guó)產(chǎn)芯片廠商有著深度的原廠級(jí)合作關(guān)系,能夠第一時(shí)間獲取底層驅(qū)動(dòng)支持。
清昴智能并未止步于 CLI 工具。以自研的異構(gòu)推理引擎MLGuider為核心,公司構(gòu)建了從底層芯片到上層框架以及 Agentic AI 的全棧能力,致力于構(gòu)建 AI 2.0 時(shí)代軟件基礎(chǔ)設(shè)施,為企業(yè)智能化轉(zhuǎn)型和 AGI 實(shí)現(xiàn)打造堅(jiān)實(shí)底座。
玄武 CLI 正是這一龐大技術(shù)愿景在開(kāi)發(fā)者側(cè)的「尖刀」產(chǎn)品,旨在通過(guò)極致的易用性打開(kāi)市場(chǎng)缺口,構(gòu)建生態(tài)護(hù)城河。
結(jié)語(yǔ)
技術(shù),終究是要為人服務(wù)的。
過(guò)去幾年,國(guó)產(chǎn)顯卡用戶面對(duì)的并非性能問(wèn)題,而是生態(tài)問(wèn)題:驅(qū)動(dòng)、框架、工具鏈之間的割裂,使大量潛在算力長(zhǎng)期處于「不可用狀態(tài)」。
玄武 CLI 的出現(xiàn),或許不能立刻讓國(guó)產(chǎn)生態(tài)「拳打英偉達(dá),腳踢蘋果」,但它至少做到了一件事:把梯子遞到了墻邊。
它讓開(kāi)發(fā)者不必再充當(dāng)「環(huán)境配置員」,而能重新回到創(chuàng)造本身;也讓那些躺在機(jī)箱里吃灰的國(guó)產(chǎn)顯卡,重新開(kāi)始發(fā)熱、計(jì)算,參與到真實(shí)的 AI 實(shí)踐之中。
想要一起推動(dòng)生態(tài)進(jìn)步?趕快到 GitHub 給它一個(gè) Star 吧!
- 玄武 CLI GitHub 倉(cāng)庫(kù):https://github.com/TsingmaoAI/xw-cli
- 玄武 CLI Gitcode 倉(cāng)庫(kù):https://gitcode.com/tsingmao/xw-cli
文中視頻鏈接:https://mp.weixin.qq.com/s/RZhyl0rVTkZCV-cJ2ndAAw
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.