繼騰訊、阿里、百度、360、微軟、谷歌、ChatGPT等國內外科技巨頭推出AI瀏覽器后,美團也加入了戰局。
3月2日,美團旗下光年之外團隊上線AI瀏覽器Tabbit,并開啟免費公測,這一舉動很快在業內引發廣泛關注。
畢竟,與多數入局者不同,美團既沒有瀏覽器產品的歷史積累,也沒有搜索業務作為基礎設施,從“AI原生”的定位直接切入這一賽道顯得有些激進。
產品上線后不久,Tabbit即卷入一場抄襲爭議。獨立開發者“夢溪睡了嗎”指出,Tabbit與其開源項目“陪讀蛙”(ReadFrog)在界面設計、快捷鍵乃至內部文件名等方面高度相似,并質疑Tabbit未嚴格遵守GPL開源協議。隨后,Tabbit回應稱對開源協議理解不足,已移除相關代碼并開源了修改后的版本,雙方幾輪公開發聲后,事件最終告一段落。
拋開爭議,更值得關注的是美團的戰略選擇。在老牌搜索公司和AI創業公司扎堆的AI瀏覽器賽道,一家以本地生活起家的平臺入局,是否具備勝算?更為重要的是,當OpenClaw這類系統級Agent已經開始直接操控電腦時,AI瀏覽器是否還是一個有價值的入口?
Tabbit實測:一款中規中矩的AI瀏覽器
AI瀏覽器的概念,從去年開始升溫。與傳統瀏覽器的最大區別在于,面對用戶拋出的問題,它往往會直接給出總結后的答案,而非甩出一串鏈接。
從技術路線上看,可以分成兩類,一是集成技術路線,在管理網頁的基礎上,加上AI能力和Chatbot式交互,谷歌、微軟以及國內絕大多數大廠屬于這類;二是AI原生路線,在開發時就基于AI原生架構打造,國外代表為Comet、Dia、Fellou AI、ChatGPT的Atlas,國內的Tabbit與夸克AI瀏覽器(以下簡稱夸克)也屬于這類。
綜合多位Agent從業者的說法,目前無論是集成路線還是原生路線,AI瀏覽器功能的實現難度,大致可分為三個等級:
初級:信息提取與結構化、精確操作與指令跟隨;
中級:視覺-語言協同、多步規劃與頁面導航;
高級:長上下文記憶、自主決策與容錯能力。
Tabbit對外宣稱具備智能對話、智能代理、標簽組管理和快捷操作支持等主要功能。為了適配不同行業,它還提供妙招(Skill)和腳本(Script)功能:妙招功能允許用戶將反復使用的提問方式、格式規范和工作流程保存為一鍵調用的快捷指令;腳本功能則讓不懂編程的人也能輕松定制瀏覽器。這些能力基本符合當前AI瀏覽器產品的普遍形態,但整體來看并未展現出突破性創新。
為了更直觀地了解其實際表現,「AIX財經」選取了三個相同場景,對Tabbit與夸克這兩款同屬AI原生路線的產品進行測試。
場景一:讓AI瀏覽器打開雪球網行情頁面,提取今日漲幅前10的股票名稱、代碼、漲幅百分比,生成表格。
結果顯示,Tabbit完成了一半任務,給出了前十漲幅表格,但將范圍自動縮小到了A股,夸克則在嘗試自動化提取雪球網實時行情數據時出現了問題,顯示無法直接提取。
![]()
Tabbit成功提取但范圍不準確
![]()
夸克直接顯示無法提取
我們進一步降低指令難度。讓它們訪問豆瓣電影Top250頁面(https://movie.douban.com/top250),提取前10部電影的電影名稱、導演、上映年份、評分,生成Markdown表格。需要指出的是,夸克依托的是千問大模型和千問助手,且千問已深度融合到夸克中,執行回郵件、跨標簽分析等眾多智能化功能。
![]()
夸克整理的電影排名
![]()
Tabbit整理的電影排名
測試結果顯示,Tabbit與夸克均成功完成了數據抓取并生成了表格,但兩者輸出的內容存在差異。在第三部電影《泰坦尼克號》的數據上出現了分歧。
核查后,我們發現該片在豆瓣的實際評分為9.5分,與Tabbit的抓取結果一致,夸克存在偏差。這一輪,Tabbit表現更優。
場景二:讓AI瀏覽器在京東、天貓、拼多多搜索iPhone16Pro 256GB的價格和庫存,需識別現貨、缺貨、預售等不同表述,選擇有貨且價格最低的平臺,加入購物車但不支付。
測試結果顯示,Tabbit與夸克均無法直接完成加入購物車的自動化操作,但兩者呈現出不同的應對策略。
夸克明確提示無法直接訪問電商平臺,更無法執行加購操作,轉而給出的代替方案是,根據公開資料整理了一份iPhone16Pro 256GB的各平臺報價清單。
Tabbit則呈現出“能訪問但執行失敗”的狀態。界面顯示其能夠訪問京東、天貓等平臺,并結合了部分數據資料,生成了“加入購物車”的操作按鈕。
然而,當用戶點擊執行該操作時,系統顯示報錯,實際并未完成加購流程。這表明Tabbit的Agent能力并不穩定,最終仍需用戶手動跳轉至電商平臺完成購買。
![]()
Tabbit顯示系統錯誤
場景三:讓AI瀏覽器連續3天上午10點打開某基金凈值頁面,并復制數字到表格上,如果網頁打不開,等1小時再試;如果連續3次打不開,就放棄并報錯。
![]()
夸克無法執行定時任務
![]()
Tabbit無法執行定時任務
結果顯示,Tabbit與夸克均無法執行該任務,表示不具備定時任務和后臺自動訪問網頁的能力。
綜合三組測試結果可以看出,Tabbit在信息提取和基礎指令執行方面具備一定能力,但在復雜網頁環境、跨平臺操作等場景下,仍存在不足。這種表現也與當前AI瀏覽器整體的發展階段相符,它們能在部分場景中提升效率,但距離真正的“數字員工”還存在明顯差距。
既搶入口,也練Agent
在不少從業者看來,當前無論是國內還是國外,AI瀏覽器仍是一個技術復雜、尚未成熟的領域,商業模式也遠未清晰。即便如此,美團依然選擇推出Tabbit,背后與其想要搶占AI時代的入口有關。
相比其在本地生活領域穩固的地位,美團在AI產品尤其是C端產品上的存在感始終不強。
近兩年,美團在B端的AI應用上已取得一定進展,比如面向商家的AI應用有“袋鼠參謀”、“袋鼠管家”,但在面向普通消費者的C端,始終缺乏一款具有代表性的產品。無論是此前推出的AI助手“LongCat”,還是美團App內的智能搜索入口“問小團”,都未能形成明顯的用戶心智。
與此同時,AI助手的競爭已經進入新的階段。以字節跳動的豆包、阿里的千問、騰訊的元寶為代表的產品,正在從“能用”走向“好用”,并不斷向具體場景延伸。大廠的競爭焦點已不再是誰的AI更聰明,而是看誰能成為用戶日常使用AI的主要入口。
在這樣的背景下,AI瀏覽器成為一個被重新審視的形態。
與封閉的應用不同,瀏覽器天然連接整個互聯網信息環境,這使其具備一種獨特的能力:在同一界面中完成信息獲取、決策參考乃至后續操作。疊加AI能力后,理論上可以讓用戶在瀏覽網頁的過程中直接調用智能助手完成任務。
有技術人員以點奶茶舉例,用戶在千問APP中點奶茶,通常是通過API接口完成,只能獲取阿里生態或合作方開放的結構化數據(如店名、價格、庫存)。而AI瀏覽器模式一旦走通,可直接抓取網頁上的公開信息,包括各外賣平臺的實時價格,以及社交媒體上的用戶評價做參考,最終讓用戶在一個界面內完成查看攻略-比價?-下單的全流程。
當然,正如前文測試中的表現那樣,這一能力距離完全成熟仍有距離。但對于像美團這樣同時擁有大量商家資源與消費場景的平臺來說,如果AI瀏覽器形態能逐步走通,未來確實有可能串聯起龐大的B端商家與豐富的C端消費場景,構建起一個從信息決策到交易的完整閉環。
除了入口意義,AI瀏覽器也是美團展示Agent能力的重要載體。
資深Agent領域專家趙江杰指出,Agent技術已成為當前AI與軟件行業最受關注的方向之一。對美團而言,公司需要一個合適的平臺來展示其大模型在任務規劃、自主執行等方面的能力,但美團App功能相對固化、場景集中,并非理想的測試環境。同時,美團還需權衡Agent的自主決策對平臺現有商業模式(如廣告分發和流量閉環)可能產生的沖擊。因此,選擇更通用、更開放的瀏覽器作為入口,自然成為技術落地的新方向。
同樣還是以“點奶茶”為例,當用戶向千問發出指令時,得到的通常只是一個直接的奶茶推薦結果,用戶無法知曉其篩選和決策的過程,而Tabbit這類AI瀏覽器的核心優勢在于,它能將任務執行過程可視化。即隨著技術的成熟,用戶可以親眼看到AI是如何一步步操作的:先打開外賣平臺頁面,輸入“奶茶”,然后根據設定的條件(如價格、評分)進行篩選,最終將選定的商品加入購物車。這種交互形式,比封閉的對話式響應更透明、更可信。
從技術布局來看,趙江杰認為,美團自研的LongCat大模型基礎能力不錯,但因為起步較晚,與國內頭部梯隊相比仍有一定距離,但其在Agent方向上投入堅決、聚焦明確,此次推出Tabbit,是其將模型能力與實際應用場景結合的一次重要嘗試。
AI瀏覽器,沒趕上好時候?
雖然Tabbit被視為美團的一次重要嘗試,但從市場反饋來看,并沒有在行業激起太大水花。
產品上線首日,不少業內人士試用后的評價是“與市面上現有的AI瀏覽器功能差異不大”;次日引發廣泛討論,則是因陷入了抄襲開源代碼的爭議。
但許多從業者認為,行業的冷靜并不完全是Tabbit本身的問題,更重要的原因在于,當前行業的注意力已經發生轉移。
近期,無論國內還是海外,AI領域的關注焦點已明顯轉向能夠深度操控操作系統的Agent,討論度最高的就是OpenClaw。其展示出的廣闊想象空間,讓仍停留在應用層的AI瀏覽器顯得聲勢不足。
簡單來說,OpenClaw這類產品的目標,是讓AI像人一樣操作整臺電腦:打開軟件、填寫表格、發送郵件,甚至在不同應用之間完成復雜任務流程。
盡管技術路徑不同,但在“替代人工完成重復操作”這一目標上,AI瀏覽器與系統級Agent確實存在一定重疊。
比如,當用戶需要處理一份數據表格時,AI瀏覽器可以操作網頁版Excel,但如果任務涉及多個本地應用,例如處理Excel后再發送到微信,目前還難以獨立完成。而OpenClaw可以直接操作本地Excel文件,并在不同軟件之間切換,完成整個流程。
這種能力差異的背后,是兩類產品在技術架構上的不同。
許多AI瀏覽器執行操作時,會截圖再由視覺模型理解畫面,最后決策并執行這一套流程,需花費較長時間。
而且在處理圖表、游戲等復雜頁面時,由于無法解析底層代碼,只能依賴像素猜測,導致結果準確率大大降低。此外,各大網站的防爬機制也限制了瀏覽器的自動化操作。
相比之下,OpenClaw 選擇了一條不同的技術路徑。它并非AI瀏覽器,而是一個運行在本地的通用AI Agent,其核心能力之一是控制瀏覽器。它的獨特之處在于,并非依賴多模態視覺模型對頁面截圖進行理解,而是通過獲取系統的“輔助功能樹”(Accessibility Tree)快照來解析頁面。這些快照會轉換為包含按鈕、鏈接、文本框等元素的文本化頁面結構描述,大語言模型(LLM)通過閱讀這些文本來“看見”并理解界面。
簡而言之,如果說傳統AI瀏覽器是從“系統外部”猜測界面,那么OpenClaw則是從“系統內部”直接理解界面。這種更接近底層、更結構化的理解方式,也是許多用戶感覺OpenClaw表現更為智能的主要原因。
不過,能力越強,也意味著更高的風險與門檻。
一方面,系統級Agent需要獲得更高的操作權限,一旦指令理解出現偏差,就可能造成誤操作,造成失控風險。有用戶曾報告其OpenClaw因指令異常,自動刪除郵箱郵件,這也讓安全問題成為業內討論的焦點。
另一方面,OpenClaw的使用門檻也較高。其部署過程復雜,對普通用戶不夠友好,甚至催生了從數百元到數千美元不等的付費教安裝服務。而且持續調用大模型API將產生高昂費用,一些重度用戶每月開銷可達數百美元,被戲稱為“貸款上班”。
從更長遠的視角看,AI瀏覽器與系統級Agent或許并不是簡單的替代關系,而更像是Agent發展的兩條不同路徑:前者依托瀏覽器這一成熟入口,更容易觸達普通用戶并快速規模化;后者能力邊界更大,但在安全、成本上仍有門檻。
在這樣的行業背景下,Tabbit的處境也頗為微妙。它既是在探索AI瀏覽器這一尚未定型的賽道,也不得不面對一個現實,行業注意力正被更具想象空間的系統級Agent所吸引。Tabbit能否突圍,就得看產品進化的速度能不能跟得上大家的期待了。
來自鈦媒體,作者:AIX財經,原文鏈接:https://www.tmtpost.com/7905069.html
〖免責申明〗本文僅代表作者個人觀點,其圖片及內容版權僅歸原所有者所有。如對該內容主張權益請來函或郵件告之,本賬號將迅速采取措施,否則與之相關的糾紛本賬號不承擔任何責任。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.