網易首頁 > 網易號 > 正文申請入駐

美團AI瀏覽器，被龍蝦截胡了

2026-03-09 13:02:00　來源: 政法頻道

上海舉報

分享至

繼騰訊、阿里、百度、360、微軟、谷歌、ChatGPT等國內外科技巨頭推出AI瀏覽器后，美團也加入了戰局。

3月2日，美團旗下光年之外團隊上線AI瀏覽器Tabbit，并開啟免費公測，這一舉動很快在業內引發廣泛關注。

畢竟，與多數入局者不同，美團既沒有瀏覽器產品的歷史積累，也沒有搜索業務作為基礎設施，從“AI原生”的定位直接切入這一賽道顯得有些激進。

產品上線后不久，Tabbit即卷入一場抄襲爭議。獨立開發者“夢溪睡了嗎”指出，Tabbit與其開源項目“陪讀蛙”（ReadFrog）在界面設計、快捷鍵乃至內部文件名等方面高度相似，并質疑Tabbit未嚴格遵守GPL開源協議。隨后，Tabbit回應稱對開源協議理解不足，已移除相關代碼并開源了修改后的版本，雙方幾輪公開發聲后，事件最終告一段落。

拋開爭議，更值得關注的是美團的戰略選擇。在老牌搜索公司和AI創業公司扎堆的AI瀏覽器賽道，一家以本地生活起家的平臺入局，是否具備勝算？更為重要的是，當OpenClaw這類系統級Agent已經開始直接操控電腦時，AI瀏覽器是否還是一個有價值的入口？

Tabbit實測：一款中規中矩的AI瀏覽器

AI瀏覽器的概念，從去年開始升溫。與傳統瀏覽器的最大區別在于，面對用戶拋出的問題，它往往會直接給出總結后的答案，而非甩出一串鏈接。

從技術路線上看，可以分成兩類，一是集成技術路線，在管理網頁的基礎上，加上AI能力和Chatbot式交互，谷歌、微軟以及國內絕大多數大廠屬于這類；二是AI原生路線，在開發時就基于AI原生架構打造，國外代表為Comet、Dia、Fellou AI、ChatGPT的Atlas，國內的Tabbit與夸克AI瀏覽器（以下簡稱夸克）也屬于這類。

綜合多位Agent從業者的說法，目前無論是集成路線還是原生路線，AI瀏覽器功能的實現難度，大致可分為三個等級:

初級：信息提取與結構化、精確操作與指令跟隨；
中級：視覺-語言協同、多步規劃與頁面導航；
高級：長上下文記憶、自主決策與容錯能力。

Tabbit對外宣稱具備智能對話、智能代理、標簽組管理和快捷操作支持等主要功能。為了適配不同行業，它還提供妙招（Skill）和腳本（Script）功能：妙招功能允許用戶將反復使用的提問方式、格式規范和工作流程保存為一鍵調用的快捷指令；腳本功能則讓不懂編程的人也能輕松定制瀏覽器。這些能力基本符合當前AI瀏覽器產品的普遍形態，但整體來看并未展現出突破性創新。

為了更直觀地了解其實際表現，「AIX財經」選取了三個相同場景，對Tabbit與夸克這兩款同屬AI原生路線的產品進行測試。

場景一：讓AI瀏覽器打開雪球網行情頁面，提取今日漲幅前10的股票名稱、代碼、漲幅百分比，生成表格。

結果顯示，Tabbit完成了一半任務，給出了前十漲幅表格，但將范圍自動縮小到了A股，夸克則在嘗試自動化提取雪球網實時行情數據時出現了問題，顯示無法直接提取。

Tabbit成功提取但范圍不準確

夸克直接顯示無法提取

我們進一步降低指令難度。讓它們訪問豆瓣電影Top250頁面（https://movie.douban.com/top250），提取前10部電影的電影名稱、導演、上映年份、評分，生成Markdown表格。需要指出的是，夸克依托的是千問大模型和千問助手，且千問已深度融合到夸克中，執行回郵件、跨標簽分析等眾多智能化功能。

夸克整理的電影排名

Tabbit整理的電影排名

測試結果顯示，Tabbit與夸克均成功完成了數據抓取并生成了表格，但兩者輸出的內容存在差異。在第三部電影《泰坦尼克號》的數據上出現了分歧。

核查后，我們發現該片在豆瓣的實際評分為9.5分，與Tabbit的抓取結果一致，夸克存在偏差。這一輪，Tabbit表現更優。

場景二：讓AI瀏覽器在京東、天貓、拼多多搜索iPhone16Pro 256GB的價格和庫存，需識別現貨、缺貨、預售等不同表述，選擇有貨且價格最低的平臺，加入購物車但不支付。

測試結果顯示，Tabbit與夸克均無法直接完成加入購物車的自動化操作，但兩者呈現出不同的應對策略。

夸克明確提示無法直接訪問電商平臺，更無法執行加購操作，轉而給出的代替方案是，根據公開資料整理了一份iPhone16Pro 256GB的各平臺報價清單。

Tabbit則呈現出“能訪問但執行失敗”的狀態。界面顯示其能夠訪問京東、天貓等平臺，并結合了部分數據資料，生成了“加入購物車”的操作按鈕。

然而，當用戶點擊執行該操作時，系統顯示報錯，實際并未完成加購流程。這表明Tabbit的Agent能力并不穩定，最終仍需用戶手動跳轉至電商平臺完成購買。

Tabbit顯示系統錯誤

場景三：讓AI瀏覽器連續3天上午10點打開某基金凈值頁面，并復制數字到表格上，如果網頁打不開，等1小時再試；如果連續3次打不開，就放棄并報錯。

夸克無法執行定時任務

Tabbit無法執行定時任務

結果顯示，Tabbit與夸克均無法執行該任務，表示不具備定時任務和后臺自動訪問網頁的能力。

綜合三組測試結果可以看出，Tabbit在信息提取和基礎指令執行方面具備一定能力，但在復雜網頁環境、跨平臺操作等場景下，仍存在不足。這種表現也與當前AI瀏覽器整體的發展階段相符，它們能在部分場景中提升效率，但距離真正的“數字員工”還存在明顯差距。

既搶入口，也練Agent

在不少從業者看來，當前無論是國內還是國外，AI瀏覽器仍是一個技術復雜、尚未成熟的領域，商業模式也遠未清晰。即便如此，美團依然選擇推出Tabbit，背后與其想要搶占AI時代的入口有關。

相比其在本地生活領域穩固的地位，美團在AI產品尤其是C端產品上的存在感始終不強。

近兩年，美團在B端的AI應用上已取得一定進展，比如面向商家的AI應用有“袋鼠參謀”、“袋鼠管家”，但在面向普通消費者的C端，始終缺乏一款具有代表性的產品。無論是此前推出的AI助手“LongCat”，還是美團App內的智能搜索入口“問小團”，都未能形成明顯的用戶心智。

與此同時，AI助手的競爭已經進入新的階段。以字節跳動的豆包、阿里的千問、騰訊的元寶為代表的產品，正在從“能用”走向“好用”，并不斷向具體場景延伸。大廠的競爭焦點已不再是誰的AI更聰明，而是看誰能成為用戶日常使用AI的主要入口。

在這樣的背景下，AI瀏覽器成為一個被重新審視的形態。

與封閉的應用不同，瀏覽器天然連接整個互聯網信息環境，這使其具備一種獨特的能力：在同一界面中完成信息獲取、決策參考乃至后續操作。疊加AI能力后，理論上可以讓用戶在瀏覽網頁的過程中直接調用智能助手完成任務。

有技術人員以點奶茶舉例，用戶在千問APP中點奶茶，通常是通過API接口完成，只能獲取阿里生態或合作方開放的結構化數據（如店名、價格、庫存）。而AI瀏覽器模式一旦走通，可直接抓取網頁上的公開信息，包括各外賣平臺的實時價格，以及社交媒體上的用戶評價做參考，最終讓用戶在一個界面內完成查看攻略-比價?-下單的全流程。

當然，正如前文測試中的表現那樣，這一能力距離完全成熟仍有距離。但對于像美團這樣同時擁有大量商家資源與消費場景的平臺來說，如果AI瀏覽器形態能逐步走通，未來確實有可能串聯起龐大的B端商家與豐富的C端消費場景，構建起一個從信息決策到交易的完整閉環。

除了入口意義，AI瀏覽器也是美團展示Agent能力的重要載體。

資深Agent領域專家趙江杰指出，Agent技術已成為當前AI與軟件行業最受關注的方向之一。對美團而言，公司需要一個合適的平臺來展示其大模型在任務規劃、自主執行等方面的能力，但美團App功能相對固化、場景集中，并非理想的測試環境。同時，美團還需權衡Agent的自主決策對平臺現有商業模式（如廣告分發和流量閉環）可能產生的沖擊。因此，選擇更通用、更開放的瀏覽器作為入口，自然成為技術落地的新方向。

同樣還是以“點奶茶”為例，當用戶向千問發出指令時，得到的通常只是一個直接的奶茶推薦結果，用戶無法知曉其篩選和決策的過程，而Tabbit這類AI瀏覽器的核心優勢在于，它能將任務執行過程可視化。即隨著技術的成熟，用戶可以親眼看到AI是如何一步步操作的：先打開外賣平臺頁面，輸入“奶茶”，然后根據設定的條件（如價格、評分）進行篩選，最終將選定的商品加入購物車。這種交互形式，比封閉的對話式響應更透明、更可信。

從技術布局來看，趙江杰認為，美團自研的LongCat大模型基礎能力不錯，但因為起步較晚，與國內頭部梯隊相比仍有一定距離，但其在Agent方向上投入堅決、聚焦明確，此次推出Tabbit，是其將模型能力與實際應用場景結合的一次重要嘗試。

AI瀏覽器，沒趕上好時候？

雖然Tabbit被視為美團的一次重要嘗試，但從市場反饋來看，并沒有在行業激起太大水花。

產品上線首日，不少業內人士試用后的評價是“與市面上現有的AI瀏覽器功能差異不大”；次日引發廣泛討論，則是因陷入了抄襲開源代碼的爭議。

但許多從業者認為，行業的冷靜并不完全是Tabbit本身的問題，更重要的原因在于，當前行業的注意力已經發生轉移。

近期，無論國內還是海外，AI領域的關注焦點已明顯轉向能夠深度操控操作系統的Agent，討論度最高的就是OpenClaw。其展示出的廣闊想象空間，讓仍停留在應用層的AI瀏覽器顯得聲勢不足。

簡單來說，OpenClaw這類產品的目標，是讓AI像人一樣操作整臺電腦：打開軟件、填寫表格、發送郵件，甚至在不同應用之間完成復雜任務流程。

盡管技術路徑不同，但在“替代人工完成重復操作”這一目標上，AI瀏覽器與系統級Agent確實存在一定重疊。

比如，當用戶需要處理一份數據表格時，AI瀏覽器可以操作網頁版Excel，但如果任務涉及多個本地應用，例如處理Excel后再發送到微信，目前還難以獨立完成。而OpenClaw可以直接操作本地Excel文件，并在不同軟件之間切換，完成整個流程。

這種能力差異的背后，是兩類產品在技術架構上的不同。

許多AI瀏覽器執行操作時，會截圖再由視覺模型理解畫面，最后決策并執行這一套流程，需花費較長時間。

而且在處理圖表、游戲等復雜頁面時，由于無法解析底層代碼，只能依賴像素猜測，導致結果準確率大大降低。此外，各大網站的防爬機制也限制了瀏覽器的自動化操作。

相比之下，OpenClaw 選擇了一條不同的技術路徑。它并非AI瀏覽器，而是一個運行在本地的通用AI Agent，其核心能力之一是控制瀏覽器。它的獨特之處在于，并非依賴多模態視覺模型對頁面截圖進行理解，而是通過獲取系統的“輔助功能樹”（Accessibility Tree）快照來解析頁面。這些快照會轉換為包含按鈕、鏈接、文本框等元素的文本化頁面結構描述，大語言模型（LLM）通過閱讀這些文本來“看見”并理解界面。

簡而言之，如果說傳統AI瀏覽器是從“系統外部”猜測界面，那么OpenClaw則是從“系統內部”直接理解界面。這種更接近底層、更結構化的理解方式，也是許多用戶感覺OpenClaw表現更為智能的主要原因。

不過，能力越強，也意味著更高的風險與門檻。

一方面，系統級Agent需要獲得更高的操作權限，一旦指令理解出現偏差，就可能造成誤操作，造成失控風險。有用戶曾報告其OpenClaw因指令異常，自動刪除郵箱郵件，這也讓安全問題成為業內討論的焦點。

另一方面，OpenClaw的使用門檻也較高。其部署過程復雜，對普通用戶不夠友好，甚至催生了從數百元到數千美元不等的付費教安裝服務。而且持續調用大模型API將產生高昂費用，一些重度用戶每月開銷可達數百美元，被戲稱為“貸款上班”。

從更長遠的視角看，AI瀏覽器與系統級Agent或許并不是簡單的替代關系，而更像是Agent發展的兩條不同路徑：前者依托瀏覽器這一成熟入口，更容易觸達普通用戶并快速規模化；后者能力邊界更大，但在安全、成本上仍有門檻。

在這樣的行業背景下，Tabbit的處境也頗為微妙。它既是在探索AI瀏覽器這一尚未定型的賽道，也不得不面對一個現實，行業注意力正被更具想象空間的系統級Agent所吸引。Tabbit能否突圍，就得看產品進化的速度能不能跟得上大家的期待了。

來自鈦媒體，作者:AIX財經,原文鏈接:https://www.tmtpost.com/7905069.html

〖免責申明〗本文僅代表作者個人觀點，其圖片及內容版權僅歸原所有者所有。如對該內容主張權益請來函或郵件告之，本賬號將迅速采取措施，否則與之相關的糾紛本賬號不承擔任何責任。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.