大家好,我是已經擺爛了好幾天的冷逸。
今天上號了,給大家帶來一篇AI手機 的部署教程,手把手教學,教不會退網。
最近我開始琢磨 ROI 的事情,不知道是在哪個地方看到了這樣一句話:提高自己高 ROI 的付出,減少自己低 ROI 的內耗。
ROI 是什么?投資回報率。在一些低價值的地方內耗自己、禁錮自己,不值當。比如,預定會議發給領導,全網搜同款商品比價,規劃行程并同步到社交賬戶。
我就想,這些事為什么不能交給 AI 呢?
于是我折騰了好幾天,今天給大家帶來了答案,先看效果。
我讓 AI 給我預定今天的會議,并把會議鏈接發到工作室群里。左邊是真機的執行效果,右邊是AI跑的全過程。
所有過程,0接管,全自動。
為了防止有人杠,我還錄了幾段視頻。


這種看著手機自己干活的感覺,像極了當初老板在辦公室看我干活的樣子,有一種莫名的爽感。
對了,這里面的所有數據都是在本地跑的,不上網,非常安全。
![]()
一手教程
怎么做的?先簡單說一下要用到的模型、環境、工具以及關鍵步驟。
跟大象裝進冰箱一樣,這個 AI手機 的部署也是分為三步:
1、搭建大模型推理環境(小白建議用Ollama,高手用vllm)。
2、搭建安卓執行環境(抱歉,尊貴的iOS用戶暫時還不能體驗)。
3、搭建GUI Agent運行環境。
需要用到的模型和工具有:
0、前置環境:Python。
1、推理模型:GELab-Zero-4B-preview,來自階躍星辰,非常能打的GUI模型。
2、模型運行:Ollama。
3、安卓連電腦的工具:ADB。
4、運行Agent:GELab-Zero Agent(支持MCP),也是階躍出品。
5、電腦配置:GPU≥8GB。
6、一根USB數據線。
看到這里,先別方。接下來,我會逐字逐句的詳細講解,并全程配有演示截圖。
0)安裝Python環境
首先,要確保自己安裝得有3.12以上版本的 Python。
可以先在命令行里輸入這段命令,查看你的Python版本號。
python --version什么?你不知道什么是命令行界面(CLI),也不知道在哪里調用?
行,我今天就教你一個 coding 秘籍,在任意文件夾的地址欄里輸入 cmd ,可以快捷調用命令行(這點記住了,后面要考),然后在這個“黑底代碼框”里輸入 python --version 就可以查看版本號了。

當然,高手是按Win+R鍵直接調出運行框,輸入cmd進入。
對了,本文大部分我都是以 Windows 視角來講的,蘋果電腦也基本差不多,把一些關鍵按鍵替換一下就好了。
如果已安裝了 Python(已裝過Trae、VS code、Claude Code的,大概率都裝過Python),命令行會這樣顯示。
![]()
如果沒有安裝 Python,推薦使用miniforge來安裝。安裝過程需要注意勾選,并將 conda 加入 path 的選項(后面會講如何設置變量),以確保 conda 能夠被正確激活。
詳細過程見Install部分:
https://github.com/conda-forge/miniforge
安裝后需要激活 conda,在 powershell (按Win+R輸入powershell)輸入:
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser注意!別把,那是解釋這段命令的。
Mac 和 Linux 用戶,則用這個命令下載并安裝 miniforge:
bash Miniforge3-$(uname)-$(uname -m).sh安裝完成后,新建并激活一個 Python 環境:
conda activate gelab-zero1)搭建大模型推理環境
安裝好 Python 環境后,接下來就是在你的電腦里裝一個大模型,讓它能夠對手機的 GUI 界面進行識別、推理。
一般,本地大模型的部署主要通過Ollama和vllm。Ollama 適合個人,vllm 適合企業或有一定技術背景的人。
我知道,你肯定只想了解 Ollama。
跟大象裝進冰箱一樣,Ollama 就是大模型的冰箱,它把大模型分配到 GPU/CPU 里進行運算、干活。
記得,一定要讓Ollama開著,不能關掉。別問為什么,因為我吃過虧——我把 Ollama 從后臺關掉了,然后 CLI 那邊就拼命報錯……
安裝 Ollama,非常簡單。直接前往ollama.com,下載安裝,就可以了。
![]()
裝好后,記得設置一下Ollama的本地模型文件夾,別讓它默認放在C盤。不然你C盤要爆的。
![]()
然后,下載并部署gelab-zero-4b-preview模型,建議通過 huggingface cli的方式下載。
如果沒有安裝過huggingface cli,先執行這個命令:
pip install huggingface_hub![]()
然后,從huggingface下載gelab-zero-4b-preview 模型權重,命令是:
hf download --no-force-download stepfun-ai/GELab-Zero-4B-preview --local-dir gelab-zero-4b-preview![]()
模型下載好了,是這樣的頁面。
![]()
接著,將模型導入到Ollama。先輸入這個命令。
cd gelab-zero-4b-preview再輸這個命令:
ollama create gelab-zero-4b-preview -f Modelfile這里,可能大部分人都會報錯,這是因為Ollama.exe地址不對。
![]()
建議自己在C盤找或者搜一下Ollama.exe這個文件,一般在AppData文件夾下的Local文件夾里。
找到后,復制這段路徑。
![]()
然后重新輸入命令:
C:\Users\Administrator\AppData\Local\Programs\Ollama\Ollama.exe create gelab-zero-4b-preview -f Modelfile模型數據就開始往Ollama導了。
![]()
4B模型,建議GPU在12GB以上,跑得比較順暢。當然,8G也能跑,就是會有點慢。
如果GPU算力不夠,建議你做一些量化處理。
ollama create -q f16 gelab-zero-4b-preview等它導入完成后,模型就安裝好了。已經可以在Ollama里用了。
打開Ollama,可以看到模型里多了一個“gelab-zero-4b-preview”,你可以隨便問幾個問題測試一下。
![]()
它能正常吐token,那就代表gelab-zero-4b-preview模型已部署成功。
![]()
u1s1,階躍這個GUI模型是真滴強,在多個GUI bench上拿到SOTA表現。
![]()
而且,才4B,非常實用,非常平民了。
2)搭建安卓設備執行環境
有了Python環境,也有了本地模型,接下來就是給手機和電腦牽線搭橋了,這一步很關鍵。
簡單來說就是,一在手機里打開開發者模式,二在電腦里安裝ABD工具。這樣,就能夠通過電腦直接操作手機/模擬器。
首先,打開一臺任意的安卓機,進入「設置」頁面。
找到「我的設備」或「關于手機」選項,狂點版本號5次以上,直到出現“您已處于開發者模式”為止。
![]()
然后返回「設置」頁面,找到或搜索「開發者選項」,點擊進入。
![]()
在「開發者選項」中,找到并開啟「USB調試」功能。接下來,屏幕會出現一些重要提示,全部同意。
![]()
接下來,給電腦安裝ABD(Android Debug Bridge,安卓調試橋)工具,它是鏈接電腦與 Android 設備的通信渠道。
Windows用戶,直接下載ABD工具壓縮包,然后解壓并加入系統環境變量即可。
下載地址:
https://dl.google.com/android/repository/platform-tools-latest-windows.zip
如何設置環境變量呢?跟大象裝進冰箱一樣還是分為三步。
首先,找到電腦的「高級系統設置」。
![]()
其次,點「環境變量」,找到「Path」變量。
![]()
然后,編輯Path變量,點「新建」創建一個新變量,把你的ABD工具壓縮包地址添加進來就可以了。
![]()
之后,陸續點「確定」,保存更改,關閉頁面。
Mac或Linux用戶的話,則建議通過 Homebrew(Mac)或系統自帶包管理器(Linux)來安裝 ADB 工具。
如果沒有安裝 Homebrew,可以先執行:
ruby -e $(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)然后,輸入命令安裝 ADB 工具:
brew cask install android-platform-tools到這里,手機的開發者模式和電腦的ADB工具都搞定了。
接下來,用USB數據線將手機鏈接到電腦,然后在命令行里輸入:
adb devices如果鏈接成功,你會看到這樣的提示。
![]()
首次鏈接,手機上會出現這樣一段提示,點「確定」即可。
![]()
3)搭建GELab-Zero Agent 運行環境
模型配好了,電腦與手機的連接器也弄好了,接下來就是搭建模型的運行環境,也就是GUI Agent。
階躍已經把這個GUI智能體封裝好了,并且還做了開源,我們只需要克隆過來就可以了。
打開CLI輸入命令:
git clone https://github.com/stepfun-ai/gelab-zero這一步可能會比較慢(GitHub比較考驗上網環境),耐心等一下。
克隆完成后,輸入命令進入gelab-zero agent。
cd gelab-zero安裝一下依賴。
pip install -r requirements.txt安裝完成后,它會這樣顯示。
![]()
到此,就可以正常使用了。使用命令參考:
python examples/run_single_task.py 你的任務比如,我們讓它預定一個會議,并把會議鏈接分享到微信群。
python examples/run_single_task.py 打開騰訊會議,預定12月31日0點0分的會議,然后把會議鏈接分享到微信群“冷逸工作室”。AI就開始自己在手機上跑起來了。
![]()
它會識別手機的每個界面,然后一步步地往下走。
![]()
這個任務一共執行了14步,我把完整的工作記錄放在這里了。
(可上下滑動,查看全圖)
4)搭建軌跡可視化環境(可選)
所有的任務軌跡,都會默認保存在 running_log/server_log/os-copilot-local-eval-logs/ 目錄下。
如果你想查看任務軌跡,可以使用 streamlit 來對軌跡進行可視化。
先輸入命令:
cd gelab-zero然后輸入命令:
streamlit run --server.address 127.0.0.1 visualization/main_page.py --server.port 33503![]()
然后,在瀏覽器中訪問http://localhost:33503,輸入session ID即可查看任務的工作過程。
每次任務執行都會生成唯一的 session ID,在任務結束后可以得到。
5)llama部署(可選)
階躍的Step GUI,也支持llama.cpp部署。
詳細參考階躍在Github上的教程:
https://github.com/stepfun-ai/gelab-zero/blob/main/README_CN.md
llama部署后,可以在Jan等任意支持llama的本地客戶端里拉起API服務。
6)MCP配置(可選)
如果你嫌本地模型慢,想用云端模型,也可以把GELab-Zero Agent封裝成MCP server,在其他客戶端里調用MCP進行使用。
先啟動gelab-zero。
cd gelab-zero然后打開MCP服務。
python mcp_server/detailed_gelab_mcp_server.py你如果看到了這樣的界面,就代表MCP Server配置好了。
![]()
接下來,在Chabot等客戶端中直接調用MCP Server就行。
比如,MCP用Gelab-MCP-Server,模型用GPT-5.1,這速度、質量簡直起飛。
![]()
這種端云協同帶來的好處是,它可以在保障隱私安全的同時,極大程度地拓展 GUI Agent 的能力邊界。
云端大模型專注高級規劃和復雜意圖理解,本地模型負責具體GUI執行和原子操作,以確保所有具體操作和執行軌跡都留在本地。
這對于企業來說,非常重要。
![]()
更多用例
階躍的Step GUI系列模型,既包括端側模型Step-GUI Edge(原GELab-Zero-4B)、云側模型(Step-GUI ),也包含MCP協議,支持的場景非常豐富,可在200個APP中順利執行,是同類模型的4倍。
給大家看一些其他開發者搓的用例。
在多個電商平臺搜同款比價。
規劃周末的旅行計劃,并同步到社交賬戶。
自動發公眾號文章(by好友@Brad強)。
最有意思的是,有個叫@圖圖 的開發者給機械手接上Step-GUI模型,讓它自己邊玩手機邊刷抖音,這是GUI直接進入物理世界了。
這種通過外接具身智能的方式,可以跳過很多終端的權限,有著更高的自由度。

是不是還挺有趣的,現在就想手搓一個?建議你立即行動起來!
不到半小時,就能搓出一部自己的AI手機。
如果你覺得步驟麻煩,不想自己動手,也可以直接調用他們的Step-GUI Chat API接口。
Model Name: step-gui目前,API正限時免費體驗中。
API接入指引:
https://ai.feishu.cn/wiki/BfVHwghPdiyp2ckS3HfcJZAmnsc
![]()
今天,Manus作價數10億美元賣給Meta,創下了Meta第三大收購的紀錄。
大半個AI圈都在慶祝,這驗證了Agent領域有著極大的市場,而且是一個全新的藍海市場。GUI Agent作為消費終端Agent的重要形態,同樣有著不可估量的市場空間。
而且,它是AI Agent能否真正實現“智能代理”的關鍵。
階躍星辰這次開源的Step-GUI系列模型,既有GUI基模,也有GUI Agent,還支持MCP、API(限時免費中)。我感覺它是接入門檻最低的,也是生態最全的,拉起了GUI從“模型-應用”的整個流程。
這波開源真的很贊,值得大家的Star。
![]()
開源地址:
https://github.com/stepfun-ai/gelab-zero
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.