瀏覽器自動化工具!開源 AI 瀏覽器助手讓你效率翻倍 前言
在 AI 自動化快速發展的當下,瀏覽器早已不再只是“用來點點點”的工具。越來越多的網頁任務——信息抓取、表單填寫、跨站流程處理——都開始依賴自動化來提升效率。而最近,一款開源的瀏覽器自動化工具 Nanobrowser 引起了不少技術圈的關注。
它不僅免費、開源,還能在本地瀏覽器中直接運行 AI 自動化流程,讓網頁操作真正做到“像人一樣執行”。如果你正在尋找一款安全、靈活、可控的瀏覽器自動化工具,那么它絕對值得一試。
![]()
Nanobrowser是什么?
Nanobbrowser 是一款基于瀏覽器擴展運行的開源 AI 自動化工具,定位類似于 OpenAI Operator 的免費替代方案。它的核心理念是:讓多個 AI 代理協同工作,自動完成復雜的網頁任務。
它的特點非常鮮明:
核心優勢
? 完全免費 :無需訂閱,只需使用自己的 LLM API Key。
? 隱私安全 :所有操作在本地瀏覽器執行,敏感信息不會上傳云端。
? 多模型支持 :兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。
? 開源透明 :自動化邏輯完全公開,可審計、可擴展。
? 多代理協作 :Planner 規劃、Navigator 執行、Validator 校驗,流程清晰可控。
相比傳統的腳本自動化(如 Selenium),Nanobrowser 更像是“AI 驅動的智能瀏覽器助手”,無需寫代碼即可完成復雜任務。
安裝方式:三種模式
Nanobrowser 提供三種安裝方式,適合不同用戶需求。
1. Chrome Web Store(推薦)
適合普通用戶,安裝即用。
![]()
2. 手動安裝最新版本
適合想體驗最新功能的用戶:
? 從 GitHub Releases 下載 zip
? 解壓后,打開 Chrome 瀏覽器,進入
chrome://extensions/? 開啟右上角 “開發者模式”,點擊 “加載已解壓的擴展程序”,選擇解壓后的
nanobrowser文件夾;? 配置 API Key 和模型即可使用
適合二次開發或想深度定制的用戶。
實際使用體驗安裝 Node.js(v22.12.0+)和 pnpm(v9.15.1+)
git clone https://github.com/nanobrowser/nanobrowser.git
cd nanobrowser
:
pnpm install
:
pnpm build(構建結果在dist目錄)
:參考手動安裝步驟,選擇dist文件夾(可選):
pnpm dev
安裝完成后,只需打開側欄,添加模型服務商,即可開始使用。
點擊“open settings” 添加大模型
![]()
![]()
Windows 下設置 OLLAMA_ORIGINS 步驟 1:打開系統環境變量
1. 按 Win + S 搜索:
環境變量2. 點擊: “編輯系統環境變量”
3. 在彈出的窗口中點擊: “環境變量(N)…”
在“系統變量”區域點擊 新建:
? 變量名:
OLLAMA_ORIGINS? 變量值:
chrome-extension://*點擊 確定 保存。
![]()
步驟 3:重啟 Ollama 服務
你可以直接重啟電腦,或者手動重啟 Ollama:
Windows 下設置(臨時生效)
如果你只想當前 PowerShell 會話生效,可以用:
powershell:
setx OLLAMA_ORIGINS "chrome-extension://*"?? 注意: setx 會寫入注冊表,但不會影響當前窗口,需要 重新打開 PowerShell 或重啟電腦 才生效。
如何驗證是否設置成功?
打開新的 PowerShell:
echo $env:OLLAMA_ORIGINS chrome-extension://*說明設置成功。
例如輸入 搜索“人工智能”,AI 會自動:
1. 分析當前網頁結構
2. 識別可操作元素
3. 自動執行瀏覽、抓取、整理等步驟
4. 最終輸出結構化結果
整個過程無需你手動點擊,AI 會像一個熟練的網頁操作員一樣完成任務。
打開閑魚
大模型: ollama,qwen3b:20b
給它一個指令“打開閑魚,搜索2T硬盤,并得到結果”。
![]()
改成
打開“https://www.goofish.com/” 搜索2T硬盤,并得到結果使用大模型: kimi
![]()
報錯:你使用的模型不支持 Structured Output
Planning failed: Failed to invoke gpt-oss:20b with structured output:
Could not parse response with structured output例如:
?
gpt-oss:20b? 某些本地模型(Ollama)
? 某些開源模型(Qwen、Llama、Mixtral 的部分版本)
這些模型 能聊天,但不能嚴格按 JSON / Schema 輸出,導致 Planner 解析失敗。
解決方案
把 Planner 模型 換成一個支持結構化輸出的模型,例如:
? GPT-4 系列
? GPT-4o 系列
? Claude 3 系列
? Gemini 2 系列
? Qwen2.5(部分版本支持)
不要用本地模型當 Planner。
Nanobrowser的缺點 1.模型兼容性限制明顯(最大痛點)
Planner 必須使用支持 Structured Output 的模型
? 本地模型(Ollama)大多不支持
? Kimi(Moonshot)不支持
? 大部分開源模型不支持
? 代理 API(如 gpt-oss)也不完全兼容
導致:Planner 只能用 GPT-4o / Claude / Gemini 等強模型,成本較高。
2. Structured Output 錯誤頻發
常見報錯:
? Could not parse response
? Invalid json_schema
? Unsupported keywords: $schema
這些都來自模型不兼容。
總結
Nanobrowser 作為一款開源、免費、隱私友好的 AI 瀏覽器自動化工具,正在重新定義網頁操作方式。
開源地址:https://github.com/nanobrowser/nanobrowser
? 它更適合:
不太適合:
? 完全小白
? 企業級 RPA 場景
? 需要高穩定性的任務
? 技術用戶
? 自動化愛好者
? 需要本地隱私的場景
? 想用 AI 做網頁自動化的開發者
無論你是技術愛好者、數據采集人員、運營從業者,還是想提升效率的普通用戶,它都能帶來顯著的效率提升。
如果你想體驗真正的 AI 自動化瀏覽器,不妨試試 Nanobrowser。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.