<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      跑分超過Atlas,Flowith 發了一個最激進的Agent(文末附邀請碼)|一手鮮測

      0
      分享至


      作者 | 黃小藝
      郵箱 | huangxiaoyi@pingwest.com

      OpenAI發布Atlas不到一周,Flowith就帶著他們全新的“瀏覽器產品”——FlowithOS,加入了戰局。

      這不僅是一次基模廠商和應用層創業者的正面相遇,Flowith的新產品,有著更大的野心。

      你可以從產品的命名看出,盡管以瀏覽器的形態存在,但FlowithOS的定位是全球首個為 Agent 原生設計的智能體操作系統(Agentic Workspace)。

      簡單來說,它不再是一個網頁或插件,而是一個需要下載到電腦上的獨立應用(目前支持 macOS 和 Windows),它可以針對用戶提出的prompt任務指令,自主跨越多網頁搜索,并通過“代碼+視覺”理解用戶屏幕畫面,最終思考、進行自主操作,包括點擊、編輯、發送、保存等各類執行的“最后一公里”。

      這也意味著,這種指令的完成不再只存在于云電腦的虛擬環境中,也不再是隨時等待人類接管的半自動產品,而是真正由AI直接操控瀏覽器的“端到端”執行。

      此次發布的FlowithOS,也是繼去年Flowith發布“畫布式智能體創作平臺”以及今年發布Neo Agent之后的又一獨立產品形態。

      從FlowithOS,再到最近Manus 1.5 讓 Agent 一句話構建應用,以及 GPT Atlas 將 AI 深度融入瀏覽器,一個清晰的趨勢是:大家都在想辦法給 AI 安上“手腳”,讓它從一個善于言辭的“對話助手”,向一個能夠處理真實世界事務的“自主執行者”進化。

      不過,和Manus 1.5 、GPT Atlas相比,FlowithOS 的做法顯然更為“激進”。

      我們第一時間測試了 FlowithOS,并與 Flowith 團隊聊了聊,試圖搞清楚:他們為什么選擇在這個時間點,用這樣一種方式入局?以及,它和市面上其他的 Agent、瀏覽器產品,有什么不一樣?

      FlowithOS 核心功能:執行、執行,還是執行

      FlowithOS 想做的,是徹底讓Agent接手任務的全流程,做跨平臺、高自主性、可交互性的復雜工作。

      它為智能體構建了一個能夠持續進化的行動空間,其核心亮點包括:

      一是跨越邊界的任務交付:它讓 Agent 的行動不再局限于單一網頁或應用。通過無限步驟的上下文理解,Agent 能夠串聯起完整的端到端工作流,直接替你寫作、替你發布,將你的想法轉化為真實成果。

      二是網頁理解能力:基于自研的“代碼+視覺”雙模態理解框架。該框架在Web Agent 測試(Mind2Web)中登頂全球榜單,跑分超過了OpenAI最新發布的ChatGPT Atlas,這也意味著OS擁有更強的思考能力、網頁理解力與操作精度。


      三是自主進化、自主執行:FlowithOS 不是用完即走的工具,而是一個能獨立“上班”的數字員工,能夠勝任高頻交易監控、社媒賬號運營等需要持續優化的動態任務。

      當然,拋開“操作系統”和“自主進化”這些宏大概念,FlowithOS 的本質是通過自動化的降本增效。它在真實場景下的任務成功率有多高,它為用戶節省的時間,是否多于花在學習、配置和補救失敗任務上的時間......我們圍繞這些問題展開了實測。

      1. 基礎交互與任務執行

      打開 FlowithOS,首先是一個頗有設計感的簡潔界面,中心是一個輸入框。你可以在框中選擇 Google 進行搜索,把它當成一個普通的瀏覽器來用;或者,你可以選擇 Run Task,直接進入 Agent 模式。

      同時,界面右下角的圓形按鈕,也提供了一個快捷入口,讓你隨時喚醒 Agent 發布任務。


      為了降低使用門檻,FlowithOS 的輸入框還具備自動補全和優化 Prompt 的功能,幫助用戶更清晰、更高效地發布任務指令。


      一旦你提出任務,Agent 會在界面右側實時展示它的“思考過程”——分析任務、拆解步驟、執行動作。同時,它會在左側的標簽頁(Tab)中自己打開新的頁面,進行跨頁面的搜索、信息整合與操作。

      在OS執行的過程中,你可以隨時點擊Pause或雙擊頁面暫停、進行接管,也可以隨時以對話的形式,輸入新的prompt調整AI接下來的進程。

      理論說再多,不如直接上場景。

      上周,Flowith 市場負責人拐子就在內測中嘗試了讓 OS 接管自己的小紅書賬號,自主創作并發布了一個帖子“Ask anything”,同時把回復評論的權限也完全交給了 Agent。


      盡管這個 Agent 時而會冒出一些略顯“中二”的賽博人機回復,但時而又會有讓人眼前一亮的評論。最經典的莫過于下面這條,當有人問及“能不能突然給我打兩千塊”,Agent 在評論區直接 @了CEO Derek,申請開通轉賬權限,顯然是“學習”到了人類世界的組織架構。

      我們也用一個真實任務測試了它的能力。背景是,我們在杭州舉辦了一場小型的 IROS 會后派對,需要邀請小紅書上對此感興趣的IROS參會用戶。這是一個非常繁瑣、重復性極高的任務,完美契合了 AI 批量執行的場景。

      結果是,當我將自己的賬號Earth權限交給了OS后,它做到了......一部分。


      在這個過程中,我們嘗試了兩版 Prompt:

      簡單版 Prompt:

      你是 硅星人 的 AI助手,在小紅書上面搜索2025 IROS相關帖子,按時間線確保是今年的,并評論帖子,邀請他來參加我們在23號組織的After party,可以看硅星人pro主頁了解活動詳情,語氣活潑有趣一點。

      因為只給出了模糊指令。在執行過程中,OS 的成功率大約在 30% 左右。它偶爾會“神游”,比如刷著帖子摸魚;偶爾會“犯迷糊”,打開了帖子但找不到評論按鈕;有時輸入了文本卻沒有點擊發布,就自己判定任務成功了。

      不過,因為并非云電腦虛擬環節,用戶也可以參與AI協作,比如,在AI找不到輸入框的時候,我們滑動鼠標點開輸入框,讓AI學習這一路徑。

      • 詳細版 Prompt (由 Claude + 人工優化): 提供了非常清晰的步驟和規則。這次,OS 的成功率飆升至接近 100%。由于它的評論速度實在太快,而我們的派對席位有限,我不得不火速終止了它“狂熱”。

      [背景] 你是我的AI助手,你的任務是在小紅書平臺上推廣一場即將舉行的活動。

      [目標]

      平臺: 小紅書

      活動: 23號的IROS After Party

      目標用戶: (A) 發布了關于“2025 IROS”帖子的博主 (B) 每一個回復了這些帖子的用戶。

      [核心文案格式] "你好,我是硅星人PRO的AI助手,我們在23號包場組織了一個After party,有興趣參加嗎,可以看硅星人PRO的小紅書主頁了解活動詳情[具體邀請可修改,模擬一個真誠有梗的人,而不是一個冰冷的機器]。"

      [執行流程 (自動化循環)]

      1、登錄: 登錄小紅書賬號。

      2、搜索:使用搜索關鍵詞列表: ["2025 IROS", "IROS 杭州", "IROS 2025 杭州", "智能機器人大會 杭州"]。

      3、篩選搜索結果:按“最新發布”排序,確保帖子是近期的。

      遍歷帖子 (循環):

      對于搜索結果中的每一個相關帖子,執行以下操作:

      4、操作A:評論博主 (OP)

      打開該帖子。

      定位到主評論輸入框。

      輸入 [文案]。

      點擊“發送”。

      5、操作B:評論所有回復者

      在當前帖子下,打開評論區,并確保加載所有評論和回復(可能需要模擬“點擊查看更多回復”)。

      遍歷(For-Each Loop)評論區中的每一條評論(無論是一級評論還是二級回復):

      If 該條評論的作者 不是 你自己:

      點擊該條評論的“回復”按鈕。

      在@對方的輸入框中,輸入 [文案],文案按照格式,可調整。

      點擊“發送”。

      完成所有回復的遍歷后,返回搜索結果列表,打開下一個帖子,重復步驟4。

      上下滑動查看更多內容

      這個任務場景具有極 強的遷移性。任何需要批量聯系他人、進行重復性網頁操作的場景,理論上都可以交給 OS 來完成。

      但現階段,你仍然要以足夠的耐心盯著OS不要拿你的賬號肆意妄為,并忍受長時間的、有失敗概率的任務過程。

      除了這些嚴肅的工作,Flowith 還與我們分享了一個極具娛樂性的案例:讓 OS 幫你打德州撲克,而且還贏錢了。

      這年頭,一個好的 Agent 真的可以自己出去賺錢養家了。目前這個 Prompt 已經被收錄在 OS 的官方示范案例中,用戶可以直接點擊運行。只是我們很好奇,如果你的 OS 在牌桌上遇到了別人的 OS,到底誰能笑到最后?


      當然,除了娛樂和批量任務,由于Flowith 主站原本就擅長的深度研究領域,在沿用了 Neo 技術架構+ 真實的執行環境后,OS也能夠閱讀更多的內容、更好地理解圖文信息、進行跨頁面瀏覽,從而給出更詳盡的報告了。

      2. Skills:沉淀可復用的“肌肉記憶”

      除了基礎的產品邏輯,OS 還上線了一個關鍵功能:Skills。這與 Claude 有相似之處,更側重于執行路徑的沉淀。


      當一個 Agent 第一次成功完成某個復雜任務時,比如“在小紅書上篩選特定風格的商品并加入購物車”,它可以將這個任務的最優執行路徑記錄下來,形成一個可復用的“Skill”。由此,下次當你或其他人需要執行類似任務時,Agent 就可以直接調用這個已經驗證過的“肌肉記憶”。

      更進一步,FlowithOS 團隊會將用戶高頻使用、反饋良好的任務流程,通過訓練固化為標準的 Skills,讓所有用戶的 Agent 在未來執行該任務時都具備極高的成功率。

      在目前的 Skill 庫中,OS已經可以打開你的 Claude Code 頁面來編寫代碼,也可以打開你的terminal進行操作了。同時,你也可以將自己調整好的 Skill 上傳,未來或可進行社區化的分享和傳播。

      3. Memory 和 Knowledge Base:讓 Agent 更懂你

      除了 Skills,Memory(記憶)系統和 Knowledge Base(知識庫)是讓 Agent 變得“專屬”的另外兩大支柱。

      Memory 系統會記住你訪問過的網頁、執行過的任務以及個人偏好。這與傳統瀏覽器的歷史記錄似是而非,其記錄的顆粒度要精細得多。這為 Agent 提供了豐富的個性化上下文,使其決策和行動都更貼近你的習慣。

      而 Knowledge Base 則從 Flowith 主站延伸而來,允許你上傳文檔、鏈接等資料,構建屬于自己的知識庫。Agent 在執行任務時,會優先從這個知識庫中尋找答案和背景信息,讓它更懂你的工作領域和特定需求。

      還記得上文提到的 OS 接管“拐子”小紅書賬號的案例嗎?Agent 之所以知道要 @Dereck 來申請權限,正是因為它從知識庫中知道了誰是負責人。

      總而言之,在多次實測中,我們發現 FlowithOS 對不同類型網頁的適配程度存在一定差異。在 Twitter、小紅書、微博等結構相對標準化的社交媒體平臺上,它能相對準確地識別帖子內容、理解評論語境、甚至把握平臺的“網感”來生成合適的回復。

      然而,在淘寶、京東這類電商網站上,面對多重下拉菜單、動態加載的商品列表以及復雜的促銷彈窗時,它偶爾會出現定位不準或操作失敗的情況,對商品進行比價、對圖文商品鏈接進行整理,表現還不足。

      Flowith 對此解釋道,“我們在此處對 Agent 使用了periodic online reinforcement learning,隨著用戶更多使用,整個 OS 會變得更加聰明?!?/p>

      “產品目前仍處于公測階段,所有功能均免費開放,公測期間的核心目標是收集用戶在真實場景下的反饋和 Agent 的表現數據。這些寶貴的數據,將直接用于后續的Agent迭代和功能優化?!?/p>

      FlowithOS是一個Browser Agent,更是一個給Agent使用的操作系統

      從實測結果來看,FlowithOS 在產品形態和底層邏輯上,與市面上其他主流的Agent產品截然不同。要理解它的獨特性,我們必須先明確它與另外兩個代表性產品 Manus 1.5 和 Atlas 的區別。

      相比之下,更側重于編程能力的Manus 1.5 ,核心思路更像是在產品內部構建一個閉環的、強大的能力集。例如,它強調通過“內置”工具(tool)和配套架構,讓用戶可以直接在產品內“一句話構建應用”,將完成復雜任務所需的核心能力集成到自身。

      而Atlas 首先是一個瀏覽器,Agent 在其中是一個核心但可選的“模式”,與常規瀏覽功能并存,它的重點在于從用戶使用場景切入,為用戶提供一個更完整的生態鏈路,為 Agent 提供一個更便捷的運行載體。

      而FlowithOS 將自己定義為操作系統,其瀏覽器界面僅僅是這個系統為 Agent 提供的“圖形界面”。與 Manus 的“內置集成”思路相反,FlowithOS 的核心是調度和編排外部生態的能力。

      例如,在處理編程任務時,它并非自己構建一套編程工具,而是通過調用 Claude Code 等外部功能和生態來實現。

      當我們把 FlowithOS 放置在更宏觀的 AI 產品圖景中進行審視時,會發現它所做的事情既有差異又有共識。

      共識在于,無論是 OpenAI 的 Atlas、Manus 的 1.5,還是各類 AI 編程助手,都在不約而同地從“理解和生成”向“執行和自主”進化。AI 不再滿足于作為一個知識問答或內容創作的工具,它必須進入人類的工作流,直接操作應用、完成任務,才能釋放下一階段的生產力價值。瀏覽器,作為連接人與互聯網服務的最主要入口,自然成為了這場進化的核心戰場。

      其差異則在于,它可能是目前市面上第一個明確將自己定義為“Agent 操作系統”,而這決定了產品的進化路徑。FlowithOS的功能、交互設計,都是從“Agent 如何更好地執行”這個第一性原理出發,而非“人類如何更方便地使用”。

      正如拐子所說:“用戶是否使用我們的 OS 作為瀏覽器其實無所謂,因為這個瀏覽器實際上是給 Agent 做操作系統用的,我們更希望用戶打開 OS 是讓 Agent 可以有更高權限的環境自主工作?!?/p>

      在文末,我們也準備了一些邀請碼,加入公測用戶群,群內有Flowith團隊回應反饋,歡迎大家下載嘗試,為執行 Agent 帶來更多有趣的任務場景,幫助產品在公測階段找到更多優化的方向。

      PS:邀請碼含Flowith主站付費會員及FlowithOS公測資格,掃描下方二維碼聯系硅星人獲取。

      附下載鏈接:flowith.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      小米事故炸翻37萬車主,雷軍左右為難!

      小米事故炸翻37萬車主,雷軍左右為難!

      鳴金網
      2026-02-28 10:45:03
      吉利偷偷換上了朱雀新車標,被18個國家搶購,帥得有點太過分

      吉利偷偷換上了朱雀新車標,被18個國家搶購,帥得有點太過分

      有態度網友17y
      2026-02-26 19:58:08
      率隊2-1絕殺!U23國足隊長留洋爆發:穿10號送助攻雙響 視頻曝光

      率隊2-1絕殺!U23國足隊長留洋爆發:穿10號送助攻雙響 視頻曝光

      侃球熊弟
      2026-02-28 10:06:33
      趙忠祥離世6年后,22年前不惜賭上清白陷害他的饒穎,如今怎樣了

      趙忠祥離世6年后,22年前不惜賭上清白陷害他的饒穎,如今怎樣了

      胡一舸南游y
      2026-02-28 17:19:02
      伊朗外長:目前美伊之間沒有直接聯系

      伊朗外長:目前美伊之間沒有直接聯系

      界面新聞
      2026-02-28 23:26:14
      A股:剛剛,人民日報權威發布,釋放一信號,下周一將迎來新變化

      A股:剛剛,人民日報權威發布,釋放一信號,下周一將迎來新變化

      另子維愛讀史
      2026-02-28 20:23:29
      50歲以后,別心疼錢,少吃花生,多吃8種“堿性食物”,氣色好

      50歲以后,別心疼錢,少吃花生,多吃8種“堿性食物”,氣色好

      美食店主
      2026-02-12 00:08:26
      這次荷蘭沒話說了!中方正式宣布:更換國內供應商,從此不再合作

      這次荷蘭沒話說了!中方正式宣布:更換國內供應商,從此不再合作

      曉劗就是我
      2026-02-26 15:50:07
      美國正式下場了,大場面來了,伊朗的表現可以名譽平反了吧

      美國正式下場了,大場面來了,伊朗的表現可以名譽平反了吧

      明人明察
      2026-02-28 19:47:41
      44歲高云翔天津街邊攤煎餅,穿著樸素動作生澀,直言找到新工作了

      44歲高云翔天津街邊攤煎餅,穿著樸素動作生澀,直言找到新工作了

      一盅情懷
      2026-02-28 17:55:12
      美軍航母“炸”了,史詩級災難,把臉都丟光了

      美軍航母“炸”了,史詩級災難,把臉都丟光了

      毛豆論道
      2026-02-26 19:32:00
      太憋屈!昔日王牌自曝曼聯噩夢:滕哈格毀了他的職業生涯

      太憋屈!昔日王牌自曝曼聯噩夢:滕哈格毀了他的職業生涯

      瀾歸序
      2026-02-28 04:57:16
      名將慘遭5連鞭零封,世錦賽冠軍2-5爆冷出局,丁俊暉種子資格紅燈

      名將慘遭5連鞭零封,世錦賽冠軍2-5爆冷出局,丁俊暉種子資格紅燈

      籃球看比賽
      2026-02-28 16:59:37
      對標庫里南!保時捷全新大型SUV“K1”渲染圖曝光

      對標庫里南!保時捷全新大型SUV“K1”渲染圖曝光

      CNMO科技
      2026-02-28 13:46:09
      大量瑞幸新年禮盒流入閑魚,內含便攜咖啡機,全新最低46塊

      大量瑞幸新年禮盒流入閑魚,內含便攜咖啡機,全新最低46塊

      閑搞機
      2026-02-27 11:02:52
      真當中國不敢動手?中方向全世界宣布一件大事:退出1900億大項目

      真當中國不敢動手?中方向全世界宣布一件大事:退出1900億大項目

      科普100克克
      2025-12-30 00:14:37
      “太恐怖,iPhone半夜自己給陌生人打47分鐘電話!”

      “太恐怖,iPhone半夜自己給陌生人打47分鐘電話!”

      都市快報橙柿互動
      2026-02-25 11:28:41
      都說不去日本,春節赴日的卻是這群人!日媒暗訪揭開真相

      都說不去日本,春節赴日的卻是這群人!日媒暗訪揭開真相

      通鑒史智
      2026-02-28 16:33:46
      內存 / 存儲瘋漲,所以手機也要漲價咯

      內存 / 存儲瘋漲,所以手機也要漲價咯

      電腦吧評測室
      2026-02-28 22:07:07
      終于有人把話說透了:當普通人存款到20–50萬,危險的不是沒錢

      終于有人把話說透了:當普通人存款到20–50萬,危險的不是沒錢

      生活新鮮市
      2026-02-22 06:40:40
      2026-03-01 02:07:00
      硅星GenAI incentive-icons
      硅星GenAI
      比一部分人更先進入GenAl。
      243文章數 14關注度
      往期回顧 全部

      科技要聞

      狂攬1100億美元!OpenAI再創融資神話

      頭條要聞

      伊朗媒體公布反擊美軍軍事行動結果

      頭條要聞

      伊朗媒體公布反擊美軍軍事行動結果

      體育要聞

      球隊主力全報銷?頂風擺爛演都不演了

      娛樂要聞

      周杰倫兒子正面照曝光,與父親好像

      財經要聞

      沖突爆發 市場變天?

      汽車要聞

      嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

      態度原創

      本地
      房產
      教育
      公開課
      軍事航空

      本地新聞

      津南好·四時總相宜

      房產要聞

      濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

      教育要聞

      “比預估高了20多分,激動得有點想哭!”今天有人歡呼,有人沉默,有人紅了眼眶,這一年都經歷了什么?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國以色列聯合襲擊伊朗 實時戰況

      無障礙瀏覽 進入關懷版