<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI的價值不是聊天,而是能干活

      0
      分享至


      你有沒有想過,AI助手的終極形態應該是什么樣的?是更聰明的聊天機器人,還是能真正幫你完成復雜工作的數字員工?今天,當我體驗了Kimi剛剛發布的"OK Computer" Agent模式后,我突然意識到:AI行業可能正在經歷一次根本性的范式轉變——從"回答問題"到"完成任務"。

      這不只是功能上的升級,而是整個AI產品思維的重構。我們習慣了與AI對話,問它問題,聽它回答。但Kimi的"OK Computer"告訴我們:AI的價值不應該止步于提供信息,而應該延伸到真正解決問題、完成任務。這種轉變看似微妙,實際上卻可能重新定義我們對AI工具的期待和使用方式。

      "OK Computer":不只是名字這么簡單

      當我看到Kimi將新的Agent模式命名為"OK Computer"時,立刻想到了Radiohead那張同名專輯。1997年,這張專輯預言了數字時代人類與技術的復雜關系。27年后,Kimi用同樣的名字推出AI agent,這種巧合讓我覺得別有深意。

      "OK Computer"模式的核心理念很直接:讓Kimi從一個聊天伙伴變成一個能獨立完成復雜任務的工作團隊。我體驗后發現,這不是簡單的功能疊加,而是對AI助手定位的重新思考。傳統的AI助手像一個知識淵博的顧問,你問它答。而"OK Computer"更像是一個包含產品經理、設計師、數據分析師、前端工程師的虛擬團隊,能夠理解你的需求,制定執行計劃,并真正完成從調研到交付的全流程。

      從技術實現角度來看,這背后是Kimi K2模型強大的Agentic能力在發揮作用,而我還注意到:單個Agent任務的Token消耗量可達常規對話模式的幾十倍。這既反映了是AI從"說話"到"做事"的本質差異,因為說話只需要生成文字,做事卻需要調用工具、執行步驟、處理反饋、迭代優化。此外,OK Computer又有和Genspark等其他通用Agent很不一樣的地方,因為基礎模型就是自家的K2,在處理速度上,一方產品明顯也比其他通用智能體要快很多。

      讓我印象深刻的是"OK Computer"內置的工具集:待辦事項、Python、終端、瀏覽網頁、文字搜索、圖片搜索、圖片生成、音頻生成、專業財經數據源、網站部署等。這不是隨意的功能堆砌,而是經過深思熟慮的工具組合。每個工具都對應著現實工作中的具體需求,組合起來就能處理復雜的多步驟任務。

      通用問答只是序章,真正的賽場在于"讓大模型成為專業工作的標配"。這種定位轉變非常關鍵。它意味著AI不再滿足于做一個萬能的問答機器,而是要深入到具體的工作場景中,成為真正的生產力工具。

      從"回答問題"到"完成任務"的跨越

      我仔細分析了"OK Computer"提供的幾個核心應用場景,發現每一個都代表著從信息提供到任務完成的跨越。

      第一個場景是網站開發。傳統AI助手可能會告訴你如何編寫HTML、CSS或JavaScript,給你一些代碼片段讓你自己組裝。但"OK Computer"會像一個完整的產品團隊那樣工作:理解你的業務需求,規劃網站結構,設計用戶界面,編寫代碼,最后還能幫你部署上線。這是從"教你怎么做"到"幫你做完"的根本區別。


      第二個場景是數據分析報告。以往你可能需要先學習如何使用Excel或Python處理數據,然后學習各種可視化工具,最后還要掌握報告撰寫技巧。現在"OK Computer"可以直接接手這個完整流程:讀取你的數據文件,進行深度分析,生成洞察,創建可視化圖表,撰寫分析報告。你只需要提出需求,它負責執行到底。

      第三個場景是演示文稿制作。這個場景特別能體現AI agent的價值。制作一個專業PPT需要內容規劃、資料搜集、圖片選擇、版面設計、視覺統一等多個環節。"OK Computer"可以處理這個完整鏈條,最終交付的還是可編輯的PPT文件而不是靜態PDF,這說明它真正理解了用戶的后續使用需求。

      這種"端到端"的任務完成能力,讓我想起了一個重要趨勢:AI正在從"增強智能"向"自主智能"進化。增強智能是輔助人類做決策,提供信息和建議。自主智能則是在明確目標后,獨立規劃和執行整個任務流程。"OK Computer"顯然更接近后者。

      我認為這種轉變的意義不只是技術上的進步,更是對AI應用價值的重新定義。過去我們評價一個AI助手好不好,主要看它回答問題的準確性和全面性。未來我們可能更關心它能否高效完成復雜任務,能否真正減輕我們的工作負擔。

      技術實現背后的深層邏輯

      要理解"OK Computer"的技術創新,我們需要回到Kimi K2模型的底層能力。從我了解到的信息來看,K2在agent任務上的表現確實令人印象深刻。

      我注意到X上來自Hugging Face聯創的一條帖子:在最新的agent評測中,"Kimi-K2 from @Kimi_Moonshot is leading open weight"。它表明Kimi K2在開源模型中確實具備了全球領先的agent能力,這為"OK Computer"的推出提供了堅實的技術基礎。


      從技術架構來看,Kimi K2采用了Mixture-of-Experts(MoE)設計,總參數1萬億,激活參數32億。具體來說,模型包含61層(含1個密集層),7168的注意力隱藏維度,384個專家,每個token選擇8個專家,還有1個共享專家。這種設計的巧妙之處在于,雖然模型規模龐大,但推理時只需要激活其中一小部分,既保證了能力又控制了計算成本。更重要的是,它針對agentic任務進行了專門優化,在訓練過程中就考慮了多工具協同、長鏈路任務執行、錯誤恢復等agent特有的需求。

      我特別關注到Moonshot在模型訓練中引入的創新技術。他們開發的MuonClip優化器解決了一個關鍵問題:大規模MoE模型訓練中的attention logits爆炸。傳統的logit soft-capping和query-key歸一化方法都不夠有效,MuonClip通過直接重新縮放query和key投影權重矩陣來控制attention logits的規模。這個看似簡單的技術創新,讓15.5萬億tokens的訓練過程實現了零訓練崩潰,這種穩定性對agent任務至關重要。

      在agent能力的培養方面,Moonshot采用了兩個重要策略。第一是大規模agent數據合成,他們開發了一個綜合管道,可以模擬真實世界的工具使用場景。這個系統能夠系統性地演化數百個包含數千種工具的領域,然后生成數百個具有不同工具集的agent。所有任務都基于評估標準,agent與模擬環境和用戶agent交互,創建現實的多輪工具使用場景。LLM判斷器根據任務標準評估模擬結果,篩選出高質量的訓練數據。

      第二個策略是通用強化學習。這里的挑戰是如何將RL應用到既有可驗證獎勵又有不可驗證獎勵的任務上。對于可驗證任務(如數學、編程競賽),有明確的對錯標準;對于不可驗證任務(如寫研究報告),就需要更復雜的評估機制。Moonshot的解決方案是使用自我判斷機制,讓模型作為自己的評判者,為不可驗證任務提供可擴展的、基于標準的反饋。同時,他們用可驗證獎勵的在線策略推出來持續更新評判器,使評判器在最新策略上不斷改進評估準確性。這實際上是用可驗證獎勵來改進對不可驗證獎勵的估計。

      從工具調用的角度來看,"OK Computer"的設計體現了對agent工作模式的深度理解。它不是簡單地把各種工具拼接在一起,而是讓模型學會如何像人類團隊那樣協作:產品經理負責需求理解和任務分解,數據分析師負責數據處理,設計師負責視覺呈現,工程師負責技術實現。這種角色化的工作模式,讓agent能夠更有序地處理復雜任務。

      我還注意到K2模型在工具調用格式正確性方面的優化。傳統模型經常會生成格式錯誤的工具調用,導致任務執行失敗。K2通過專門的訓練和推理優化,大幅提高了工具調用的成功率。這種可靠性提升看似微不足道,實際上對agent的實用性有決定性影響。

      商業模式的戰略轉向

      "OK Computer"的推出,反映了Kimi在商業策略上的重要調整。我觀察到,Moonshot正在從通用問答市場轉向專業生產力市場,這種轉向背后有著深刻的商業邏輯。


      通用問答市場競爭激烈,產品同質化嚴重。豆包、元寶等產品都在這個領域投入巨大資源,但很難形成明顯的差異化優勢。更關鍵的是,通用問答的商業價值相對有限,用戶付費意愿不強。相比之下,專業生產力市場的用戶對效率提升有明確需求,付費意愿更強,商業價值更高。

      我同時也注意到Sam Altman最近宣布,OpenAI將在未來幾周推出系列算力密集型產品并收取額外費用。這與Kimi的"OK Computer"策略不謀而合。兩家公司都意識到,真正有價值的AI應用需要更多算力投入,而用戶也愿意為真正解決問題的服務買單。

      "OK Computer"采用灰度測試的發布策略也很有意思。優先給曾經打賞過Kimi的用戶提供體驗席位,這不只是技術上的考慮,更是商業模式的探索。它在測試用戶對高價值服務的付費接受度,為后續的訂閱制或按使用計費模式做準備。

      從成本結構來看,agent模式的Token消耗是常規對話的幾十倍,這意味著更高的運營成本。但同時,它提供的價值也是幾十倍的提升。一個完整的網站開發項目,傳統上可能需要幾個人協作幾天完成,現在一個agent可能幾小時就能交付原型。這種效率提升為更高的定價提供了合理性。

      我認為Kimi的這種轉向具有行業示范意義。它告訴我們,AI產品的未來不在于比拼誰的回答更準確更全面,而在于誰能真正解決用戶的實際問題。這種從"信息提供者"到"任務完成者"的轉變,可能會引領整個AI行業的發展方向。

      AI Agent時代的開端

      "OK Computer"的發布讓我相信,我們可能正站在AI Agent時代的門檻上。這個時代的特征不是AI變得更聰明,而是AI開始真正參與到人類的工作流程中。

      我觀察到一個重要趨勢:越來越多的AI公司開始從對話型產品轉向agent型產品。OpenAI在準備推出算力密集型產品,Google在強化Assistant的任務執行能力,Anthropic的Claude也在向工具集成方向發展。這種集體轉向說明,行業已經意識到純粹的對話AI價值有限,真正的機會在于能夠獨立完成任務的AI agent。

      但我也看到了一些挑戰。Agent任務的復雜性意味著更高的失敗風險,一個環節出錯可能影響整個任務。這對模型的可靠性提出了更高要求。同時,agent的自主性也帶來了控制問題:如何確保agent按照用戶意圖工作,如何處理意外情況,如何在效率和安全之間找到平衡。

      從技術發展的角度看,AI agent需要的不只是更大的模型,更需要更好的工具集成、更強的任務規劃能力、更可靠的錯誤處理機制。Kimi在這些方面的探索值得關注。他們不只是簡單地把現有工具連接起來,而是讓模型學會如何像人類專家那樣使用這些工具。

      從用戶習慣培養的角度看,agent模式還需要時間被廣泛接受。我們習慣了自己控制每個步驟,把重要任務委托給AI確實需要很大的信任。但我相信,當人們看到agent能夠可靠地完成復雜任務時,這種信任會逐步建立。

      Kimi的"OK Computer"可能不是最終形態,但它代表了一個重要的開始。它告訴我們,AI的價值不應該只是回答問題,而應該是解決問題。這種理念的轉變,可能比任何技術突破都更重要。

      對未來工作方式的思考

      最后思考一個更深層的問題:當AI能夠獨立完成越來越多的工作任務時,人類的角色應該如何定義?

      我的答案是,人類將從執行者轉向創意者和決策者。在"OK Computer"模式下,人類不需要知道如何編寫代碼、如何制作PPT、如何分析數據,但需要知道要解決什么問題、達到什么目標、滿足哪些標準。換句話說,人類的價值將更多體現在"想要什么"而不是"如何做到"。

      這種轉變對教育和培訓也有深刻影響。傳統教育強調技能掌握,教你如何使用Excel、如何編程、如何寫文案。但在AI agent時代,這些技能的價值會大大降低。相反,問題識別能力、需求表達能力、結果評估能力會變得更加重要。

      我也思考了這種轉變可能帶來的風險。當我們習慣于把復雜任務委托給AI時,是否會逐漸失去獨立解決問題的能力?當AI能夠完成大部分腦力工作時,人類如何保持思維的敏銳性?這些問題沒有標準答案,但值得我們認真考慮。

      從社會分工的角度看,AI agent可能會重新定義很多職業。一些以技能執行為主的工作可能會受到沖擊,但同時也會創造新的機會。比如AI agent訓練師、任務設計師、結果審核員等新職業可能會興起。關鍵是我們要主動適應這種變化,而不是被動等待。

      最終,我認為"OK Computer"這樣的AI agent并不是要取代人類,而是要解放人類。它讓我們從繁瑣的執行工作中解脫出來,把時間和精力投入到更有創造性、更有意義的事情上。這種解放的前提是,我們要學會與AI協作,學會正確地使用這些強大的工具。


      從聊天到干活,從回答問題到完成任務,AI的進化遠未結束。"OK Computer"代表的可能只是這場變革的一個片段,但它足以讓我們窺見未來的模樣:一個人類與AI深度協作、各自發揮優勢的世界正在到來。

      結尾

      也歡迎大家留言討論,分享你的觀點!

      覺得內容不錯的朋友能夠幫忙右下角點個贊,分享一下。您的每次分享,都是在激勵我不斷產出更好的內容。

      歡迎關注深思圈,一起探索更大的世界。

      - END -

      兩個“特別坑”的AI產品創業方向,你知道嗎


      速度將成為AI時代唯一的護城河


      a16z重磅預測:Vibe coding贏者通吃?錯了,垂直專業化才是未來


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      紅星專訪|王菲春晚唱火《你我經歷的一刻》,原創稱歌詞是倒著寫出來的

      紅星專訪|王菲春晚唱火《你我經歷的一刻》,原創稱歌詞是倒著寫出來的

      紅星新聞
      2026-02-16 22:22:42
      日本首相高市早苗發表賀辭祝賀春節

      日本首相高市早苗發表賀辭祝賀春節

      東瀛萬事通
      2026-02-16 18:54:22
      黑龍江一男子撿到蘋果手機,刷機送給外甥女使用,失主堅持不懈尋找2年追回:重要資料已被刪,共賠償8500元

      黑龍江一男子撿到蘋果手機,刷機送給外甥女使用,失主堅持不懈尋找2年追回:重要資料已被刪,共賠償8500元

      大象新聞
      2026-02-16 13:43:04
      2月16日起,微信支付寶銀行轉賬規則全變了!

      2月16日起,微信支付寶銀行轉賬規則全變了!

      我不叫阿哏
      2026-02-16 22:33:20
      2026馬年春晚,食之無味棄之可惜,小品歌舞節目質量一言難盡

      2026馬年春晚,食之無味棄之可惜,小品歌舞節目質量一言難盡

      辣條小劇場
      2026-02-17 00:51:29
      女子拒給弟弟20萬彩禮,父母告上法庭索賠5倍養育費,節前收到傳票

      女子拒給弟弟20萬彩禮,父母告上法庭索賠5倍養育費,節前收到傳票

      觀世記
      2026-02-16 14:14:58
      “中國之光”宇樹機器人的演示視頻,把馬斯克笑哭了!

      “中國之光”宇樹機器人的演示視頻,把馬斯克笑哭了!

      李東陽朋友圈
      2025-12-29 10:00:30
      機器人“霸屏”春晚上演IPO大賽,誰是資本盛宴背后的最大贏家?

      機器人“霸屏”春晚上演IPO大賽,誰是資本盛宴背后的最大贏家?

      野馬財經
      2026-02-16 12:02:12
      外交部:中方決定自2月17日起,對加拿大英國持普通護照人員免簽

      外交部:中方決定自2月17日起,對加拿大英國持普通護照人員免簽

      每日經濟新聞
      2026-02-15 21:41:12
      中國駐日本使館發言人就日方所謂交涉答記者問

      中國駐日本使館發言人就日方所謂交涉答記者問

      環球網資訊
      2026-02-16 21:46:15
      4次挑釁中國!烏克蘭名將:取消我同胞資格 國際奧委會是世界恥辱

      4次挑釁中國!烏克蘭名將:取消我同胞資格 國際奧委會是世界恥辱

      念洲
      2026-02-16 09:10:30
      重慶小伙怕堵車,開飛機從成都回老家:油費花了200元,飛機是120萬買的

      重慶小伙怕堵車,開飛機從成都回老家:油費花了200元,飛機是120萬買的

      大象新聞
      2026-02-16 11:51:03
      37場3球4助攻!身價8500萬歐元,英媒獨家:曼聯將簽麥卡利斯特

      37場3球4助攻!身價8500萬歐元,英媒獨家:曼聯將簽麥卡利斯特

      夏侯看英超
      2026-02-17 01:08:06
      支持項立剛老師,是時候恢復中華法系了

      支持項立剛老師,是時候恢復中華法系了

      朝廷心腹
      2026-02-15 16:33:07
      最擔心的還是來了,原來一切早有預兆,王竹卿:感謝舉報的學生

      最擔心的還是來了,原來一切早有預兆,王竹卿:感謝舉報的學生

      離離言幾許
      2026-02-15 15:50:57
      加拿大超市售賣中國課本,人教版各科目教材被整齊碼放,網友:秒回新華書店

      加拿大超市售賣中國課本,人教版各科目教材被整齊碼放,網友:秒回新華書店

      極目新聞
      2026-02-16 19:38:57
      中建集團,全軍覆沒!

      中建集團,全軍覆沒!

      黯泉
      2026-02-16 21:39:23
      泰國機場凌晨開始“堵人”,游客稱排隊入境需1個多小時,多個旅行社春節泰國游項目售罄

      泰國機場凌晨開始“堵人”,游客稱排隊入境需1個多小時,多個旅行社春節泰國游項目售罄

      極目新聞
      2026-02-16 15:46:39
      迪麗熱巴人魚公主殺瘋了!水下跳舞美到失語,這哪是春晚這是深海幻境

      迪麗熱巴人魚公主殺瘋了!水下跳舞美到失語,這哪是春晚這是深海幻境

      動物奇奇怪怪
      2026-02-16 22:53:28
      重磅!肖華考慮徹底廢除NBA選秀制度,防止球隊擺爛!

      重磅!肖華考慮徹底廢除NBA選秀制度,防止球隊擺爛!

      愛體育
      2026-02-16 23:00:42
      2026-02-17 03:43:00
      深思圈
      深思圈
      挖掘和深度分析海外最新AI產品,分享實用出海戰略
      168文章數 5關注度
      往期回顧 全部

      科技要聞

      阿里除夕發布千問3.5,性能媲美Gemini 3

      頭條要聞

      "王菲接班李谷一"上熱搜 竇靖童發文"挖嘞個親娘"

      頭條要聞

      "王菲接班李谷一"上熱搜 竇靖童發文"挖嘞個親娘"

      體育要聞

      全明星正賽美國星辰隊奪冠 愛德華茲MVP

      娛樂要聞

      王菲六登春晚獻唱 水滴鉆石耳環再出圈

      財經要聞

      2025,中國商業十大意外,黃金只排第九

      汽車要聞

      叫停純屏操作 工信部擬推車內實體操作件強制國標

      態度原創

      房產
      游戲
      數碼
      公開課
      軍事航空

      房產要聞

      三亞新機場,又傳出新消息!

      索尼又背刺PS5Pro用戶?獨占《戰神》新作不支持強化

      數碼要聞

      iPhone17e來了!蘋果官宣春季發布會:3月4日晚上十點

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      慕安會美國角色逆轉 中國議題"打滿全場"

      無障礙瀏覽 進入關懷版