網易首頁 > 網易號 > 正文申請入駐

瀏覽器自動化工具！開源 AI 瀏覽器助手讓你效率翻倍

2026-01-05 13:58:07　來源: 星哥說事

廣東舉報

分享至

瀏覽器自動化工具！開源 AI 瀏覽器助手讓你效率翻倍前言

在 AI 自動化快速發展的當下，瀏覽器早已不再只是“用來點點點”的工具。越來越多的網頁任務——信息抓取、表單填寫、跨站流程處理——都開始依賴自動化來提升效率。而最近，一款開源的瀏覽器自動化工具 Nanobrowser 引起了不少技術圈的關注。

它不僅免費、開源，還能在本地瀏覽器中直接運行 AI 自動化流程，讓網頁操作真正做到“像人一樣執行”。如果你正在尋找一款安全、靈活、可控的瀏覽器自動化工具，那么它絕對值得一試。

Nanobrowser是什么？

Nanobbrowser 是一款基于瀏覽器擴展運行的開源 AI 自動化工具，定位類似于 OpenAI Operator 的免費替代方案。它的核心理念是：讓多個 AI 代理協同工作，自動完成復雜的網頁任務。

它的特點非常鮮明：

核心優勢

? 完全免費 ：無需訂閱，只需使用自己的 LLM API Key。
? 隱私安全 ：所有操作在本地瀏覽器執行，敏感信息不會上傳云端。
? 多模型支持 ：兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。
? 開源透明 ：自動化邏輯完全公開，可審計、可擴展。
? 多代理協作 ：Planner 規劃、Navigator 執行、Validator 校驗，流程清晰可控。

相比傳統的腳本自動化（如 Selenium），Nanobrowser 更像是“AI 驅動的智能瀏覽器助手”，無需寫代碼即可完成復雜任務。

安裝方式：三種模式

Nanobrowser 提供三種安裝方式，適合不同用戶需求。

1. Chrome Web Store（推薦）

適合普通用戶，安裝即用。

2. 手動安裝最新版本

適合想體驗最新功能的用戶：

? 從 GitHub Releases 下載 zip
? 解壓后，打開 Chrome 瀏覽器，進入 chrome://extensions/
? 開啟右上角 “開發者模式”，點擊 “加載已解壓的擴展程序”，選擇解壓后的 nanobrowser 文件夾；
? 配置 API Key 和模型即可使用

3. 源碼構建（開發者模式）

適合二次開發或想深度定制的用戶。

                                                           安裝 Node.js（v22.12.0+）和 pnpm（v9.15.1+）

 git clone https://github.com/nanobrowser/nanobrowser.git 
cd nanobrowser

 ：
pnpm install

 ：
pnpm build（構建結果在dist目錄）

 ：參考手動安裝步驟，選擇dist文件夾

 （可選）：
pnpm dev

實際使用體驗

安裝完成后，只需打開側欄，添加模型服務商，即可開始使用。

點擊“open settings” 添加大模型

Windows 下設置 OLLAMA_ORIGINS 步驟 1：打開系統環境變量

1. 按 Win + S 搜索： 環境變量
2. 點擊： “編輯系統環境變量”
3. 在彈出的窗口中點擊： “環境變量(N)…”

步驟 2：新增系統變量

在“系統變量”區域點擊新建：

? 變量名：

                                                           OLLAMA_ORIGINS

? 變量值：

                                                           chrome-extension://*

點擊確定保存。

步驟 3：重啟 Ollama 服務

你可以直接重啟電腦，或者手動重啟 Ollama：

Windows 下設置（臨時生效)

如果你只想當前 PowerShell 會話生效，可以用：

                                                           powershell:
setx OLLAMA_ORIGINS "chrome-extension://*"

?? 注意： setx 會寫入注冊表，但不會影響當前窗口，需要 重新打開 PowerShell 或重啟電腦 才生效。

如何驗證是否設置成功？

打開新的 PowerShell：

                                                           echo $env:OLLAMA_ORIGINS

                                                           chrome-extension://*

說明設置成功。

例如輸入搜索“人工智能”，AI 會自動：

1. 分析當前網頁結構
2. 識別可操作元素
3. 自動執行瀏覽、抓取、整理等步驟
4. 最終輸出結構化結果

整個過程無需你手動點擊，AI 會像一個熟練的網頁操作員一樣完成任務。

打開閑魚

大模型： ollama，qwen3b:20b

給它一個指令“打開閑魚，搜索2T硬盤，并得到結果”。

改成

                                                           打開“https://www.goofish.com/” 搜索2T硬盤，并得到結果

使用大模型： kimi

報錯：你使用的模型不支持 Structured Output

                                                           Planning failed: Failed to invoke gpt-oss:20b with structured output: 
Could not parse response with structured output

例如：

? gpt-oss:20b
? 某些本地模型（Ollama）
? 某些開源模型（Qwen、Llama、Mixtral 的部分版本）

這些模型 能聊天，但不能嚴格按 JSON / Schema 輸出，導致 Planner 解析失敗。

解決方案

把 Planner 模型 換成一個支持結構化輸出的模型，例如：

? GPT-4 系列
? GPT-4o 系列
? Claude 3 系列
? Gemini 2 系列
? Qwen2.5（部分版本支持）

不要用本地模型當 Planner。

Nanobrowser的缺點 1.模型兼容性限制明顯（最大痛點）

Planner 必須使用支持 Structured Output 的模型

? 本地模型（Ollama）大多不支持
? Kimi（Moonshot）不支持
? 大部分開源模型不支持
? 代理 API（如 gpt-oss）也不完全兼容

導致：Planner 只能用 GPT-4o / Claude / Gemini 等強模型，成本較高。

2. Structured Output 錯誤頻發

常見報錯：

? Could not parse response
? Invalid json_schema
? Unsupported keywords: $schema

這些都來自模型不兼容。

總結

Nanobrowser 作為一款開源、免費、隱私友好的 AI 瀏覽器自動化工具，正在重新定義網頁操作方式。

開源地址：https://github.com/nanobrowser/nanobrowser

? 它更適合：
不太適合：
- ? 完全小白
- ? 企業級 RPA 場景
- ? 需要高穩定性的任務
- ? 技術用戶
- ? 自動化愛好者
- ? 需要本地隱私的場景
- ? 想用 AI 做網頁自動化的開發者

無論你是技術愛好者、數據采集人員、運營從業者，還是想提升效率的普通用戶，它都能帶來顯著的效率提升。

如果你想體驗真正的 AI 自動化瀏覽器，不妨試試 Nanobrowser。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.