網易首頁 > 網易號 > 正文申請入駐

AI的價值不是聊天，而是能干活

2025-09-26 09:52:27　來源: 深思圈

北京舉報

分享至

你有沒有想過，AI助手的終極形態應該是什么樣的？是更聰明的聊天機器人，還是能真正幫你完成復雜工作的數字員工？今天，當我體驗了Kimi剛剛發布的"OK Computer" Agent模式后，我突然意識到：AI行業可能正在經歷一次根本性的范式轉變——從"回答問題"到"完成任務"。

這不只是功能上的升級，而是整個AI產品思維的重構。我們習慣了與AI對話，問它問題，聽它回答。但Kimi的"OK Computer"告訴我們：AI的價值不應該止步于提供信息，而應該延伸到真正解決問題、完成任務。這種轉變看似微妙，實際上卻可能重新定義我們對AI工具的期待和使用方式。

"OK Computer"：不只是名字這么簡單

當我看到Kimi將新的Agent模式命名為"OK Computer"時，立刻想到了Radiohead那張同名專輯。1997年，這張專輯預言了數字時代人類與技術的復雜關系。27年后，Kimi用同樣的名字推出AI agent，這種巧合讓我覺得別有深意。

"OK Computer"模式的核心理念很直接：讓Kimi從一個聊天伙伴變成一個能獨立完成復雜任務的工作團隊。我體驗后發現，這不是簡單的功能疊加，而是對AI助手定位的重新思考。傳統的AI助手像一個知識淵博的顧問，你問它答。而"OK Computer"更像是一個包含產品經理、設計師、數據分析師、前端工程師的虛擬團隊，能夠理解你的需求，制定執行計劃，并真正完成從調研到交付的全流程。

從技術實現角度來看，這背后是Kimi K2模型強大的Agentic能力在發揮作用，而我還注意到：單個Agent任務的Token消耗量可達常規對話模式的幾十倍。這既反映了是AI從"說話"到"做事"的本質差異，因為說話只需要生成文字，做事卻需要調用工具、執行步驟、處理反饋、迭代優化。此外，OK Computer又有和Genspark等其他通用Agent很不一樣的地方，因為基礎模型就是自家的K2，在處理速度上，一方產品明顯也比其他通用智能體要快很多。

讓我印象深刻的是"OK Computer"內置的工具集：待辦事項、Python、終端、瀏覽網頁、文字搜索、圖片搜索、圖片生成、音頻生成、專業財經數據源、網站部署等。這不是隨意的功能堆砌，而是經過深思熟慮的工具組合。每個工具都對應著現實工作中的具體需求，組合起來就能處理復雜的多步驟任務。

通用問答只是序章，真正的賽場在于"讓大模型成為專業工作的標配"。這種定位轉變非常關鍵。它意味著AI不再滿足于做一個萬能的問答機器，而是要深入到具體的工作場景中，成為真正的生產力工具。

從"回答問題"到"完成任務"的跨越

我仔細分析了"OK Computer"提供的幾個核心應用場景，發現每一個都代表著從信息提供到任務完成的跨越。

第一個場景是網站開發。傳統AI助手可能會告訴你如何編寫HTML、CSS或JavaScript，給你一些代碼片段讓你自己組裝。但"OK Computer"會像一個完整的產品團隊那樣工作：理解你的業務需求，規劃網站結構，設計用戶界面，編寫代碼，最后還能幫你部署上線。這是從"教你怎么做"到"幫你做完"的根本區別。

第二個場景是數據分析報告。以往你可能需要先學習如何使用Excel或Python處理數據，然后學習各種可視化工具，最后還要掌握報告撰寫技巧。現在"OK Computer"可以直接接手這個完整流程：讀取你的數據文件，進行深度分析，生成洞察，創建可視化圖表，撰寫分析報告。你只需要提出需求，它負責執行到底。

第三個場景是演示文稿制作。這個場景特別能體現AI agent的價值。制作一個專業PPT需要內容規劃、資料搜集、圖片選擇、版面設計、視覺統一等多個環節。"OK Computer"可以處理這個完整鏈條，最終交付的還是可編輯的PPT文件而不是靜態PDF，這說明它真正理解了用戶的后續使用需求。

這種"端到端"的任務完成能力，讓我想起了一個重要趨勢：AI正在從"增強智能"向"自主智能"進化。增強智能是輔助人類做決策，提供信息和建議。自主智能則是在明確目標后，獨立規劃和執行整個任務流程。"OK Computer"顯然更接近后者。

我認為這種轉變的意義不只是技術上的進步，更是對AI應用價值的重新定義。過去我們評價一個AI助手好不好，主要看它回答問題的準確性和全面性。未來我們可能更關心它能否高效完成復雜任務，能否真正減輕我們的工作負擔。

技術實現背后的深層邏輯

要理解"OK Computer"的技術創新，我們需要回到Kimi K2模型的底層能力。從我了解到的信息來看，K2在agent任務上的表現確實令人印象深刻。

我注意到X上來自Hugging Face聯創的一條帖子：在最新的agent評測中，"Kimi-K2 from @Kimi_Moonshot is leading open weight"。它表明Kimi K2在開源模型中確實具備了全球領先的agent能力，這為"OK Computer"的推出提供了堅實的技術基礎。

從技術架構來看，Kimi K2采用了Mixture-of-Experts(MoE)設計，總參數1萬億，激活參數32億。具體來說，模型包含61層（含1個密集層），7168的注意力隱藏維度，384個專家，每個token選擇8個專家，還有1個共享專家。這種設計的巧妙之處在于，雖然模型規模龐大，但推理時只需要激活其中一小部分，既保證了能力又控制了計算成本。更重要的是，它針對agentic任務進行了專門優化，在訓練過程中就考慮了多工具協同、長鏈路任務執行、錯誤恢復等agent特有的需求。

我特別關注到Moonshot在模型訓練中引入的創新技術。他們開發的MuonClip優化器解決了一個關鍵問題：大規模MoE模型訓練中的attention logits爆炸。傳統的logit soft-capping和query-key歸一化方法都不夠有效，MuonClip通過直接重新縮放query和key投影權重矩陣來控制attention logits的規模。這個看似簡單的技術創新，讓15.5萬億tokens的訓練過程實現了零訓練崩潰，這種穩定性對agent任務至關重要。

在agent能力的培養方面，Moonshot采用了兩個重要策略。第一是大規模agent數據合成，他們開發了一個綜合管道，可以模擬真實世界的工具使用場景。這個系統能夠系統性地演化數百個包含數千種工具的領域，然后生成數百個具有不同工具集的agent。所有任務都基于評估標準，agent與模擬環境和用戶agent交互，創建現實的多輪工具使用場景。LLM判斷器根據任務標準評估模擬結果，篩選出高質量的訓練數據。

第二個策略是通用強化學習。這里的挑戰是如何將RL應用到既有可驗證獎勵又有不可驗證獎勵的任務上。對于可驗證任務（如數學、編程競賽），有明確的對錯標準；對于不可驗證任務（如寫研究報告），就需要更復雜的評估機制。Moonshot的解決方案是使用自我判斷機制，讓模型作為自己的評判者，為不可驗證任務提供可擴展的、基于標準的反饋。同時，他們用可驗證獎勵的在線策略推出來持續更新評判器，使評判器在最新策略上不斷改進評估準確性。這實際上是用可驗證獎勵來改進對不可驗證獎勵的估計。

從工具調用的角度來看，"OK Computer"的設計體現了對agent工作模式的深度理解。它不是簡單地把各種工具拼接在一起，而是讓模型學會如何像人類團隊那樣協作：產品經理負責需求理解和任務分解，數據分析師負責數據處理，設計師負責視覺呈現，工程師負責技術實現。這種角色化的工作模式，讓agent能夠更有序地處理復雜任務。

我還注意到K2模型在工具調用格式正確性方面的優化。傳統模型經常會生成格式錯誤的工具調用，導致任務執行失敗。K2通過專門的訓練和推理優化，大幅提高了工具調用的成功率。這種可靠性提升看似微不足道，實際上對agent的實用性有決定性影響。

商業模式的戰略轉向

"OK Computer"的推出，反映了Kimi在商業策略上的重要調整。我觀察到，Moonshot正在從通用問答市場轉向專業生產力市場，這種轉向背后有著深刻的商業邏輯。

通用問答市場競爭激烈，產品同質化嚴重。豆包、元寶等產品都在這個領域投入巨大資源，但很難形成明顯的差異化優勢。更關鍵的是，通用問答的商業價值相對有限，用戶付費意愿不強。相比之下，專業生產力市場的用戶對效率提升有明確需求，付費意愿更強，商業價值更高。

我同時也注意到Sam Altman最近宣布，OpenAI將在未來幾周推出系列算力密集型產品并收取額外費用。這與Kimi的"OK Computer"策略不謀而合。兩家公司都意識到，真正有價值的AI應用需要更多算力投入，而用戶也愿意為真正解決問題的服務買單。

"OK Computer"采用灰度測試的發布策略也很有意思。優先給曾經打賞過Kimi的用戶提供體驗席位，這不只是技術上的考慮，更是商業模式的探索。它在測試用戶對高價值服務的付費接受度，為后續的訂閱制或按使用計費模式做準備。

從成本結構來看，agent模式的Token消耗是常規對話的幾十倍，這意味著更高的運營成本。但同時，它提供的價值也是幾十倍的提升。一個完整的網站開發項目，傳統上可能需要幾個人協作幾天完成，現在一個agent可能幾小時就能交付原型。這種效率提升為更高的定價提供了合理性。

我認為Kimi的這種轉向具有行業示范意義。它告訴我們，AI產品的未來不在于比拼誰的回答更準確更全面，而在于誰能真正解決用戶的實際問題。這種從"信息提供者"到"任務完成者"的轉變，可能會引領整個AI行業的發展方向。

AI Agent時代的開端

"OK Computer"的發布讓我相信，我們可能正站在AI Agent時代的門檻上。這個時代的特征不是AI變得更聰明，而是AI開始真正參與到人類的工作流程中。

我觀察到一個重要趨勢：越來越多的AI公司開始從對話型產品轉向agent型產品。OpenAI在準備推出算力密集型產品，Google在強化Assistant的任務執行能力，Anthropic的Claude也在向工具集成方向發展。這種集體轉向說明，行業已經意識到純粹的對話AI價值有限，真正的機會在于能夠獨立完成任務的AI agent。

但我也看到了一些挑戰。Agent任務的復雜性意味著更高的失敗風險，一個環節出錯可能影響整個任務。這對模型的可靠性提出了更高要求。同時，agent的自主性也帶來了控制問題：如何確保agent按照用戶意圖工作，如何處理意外情況，如何在效率和安全之間找到平衡。

從技術發展的角度看，AI agent需要的不只是更大的模型，更需要更好的工具集成、更強的任務規劃能力、更可靠的錯誤處理機制。Kimi在這些方面的探索值得關注。他們不只是簡單地把現有工具連接起來，而是讓模型學會如何像人類專家那樣使用這些工具。

從用戶習慣培養的角度看，agent模式還需要時間被廣泛接受。我們習慣了自己控制每個步驟，把重要任務委托給AI確實需要很大的信任。但我相信，當人們看到agent能夠可靠地完成復雜任務時，這種信任會逐步建立。

Kimi的"OK Computer"可能不是最終形態，但它代表了一個重要的開始。它告訴我們，AI的價值不應該只是回答問題，而應該是解決問題。這種理念的轉變，可能比任何技術突破都更重要。

對未來工作方式的思考

最后思考一個更深層的問題：當AI能夠獨立完成越來越多的工作任務時，人類的角色應該如何定義？

我的答案是，人類將從執行者轉向創意者和決策者。在"OK Computer"模式下，人類不需要知道如何編寫代碼、如何制作PPT、如何分析數據，但需要知道要解決什么問題、達到什么目標、滿足哪些標準。換句話說，人類的價值將更多體現在"想要什么"而不是"如何做到"。

這種轉變對教育和培訓也有深刻影響。傳統教育強調技能掌握，教你如何使用Excel、如何編程、如何寫文案。但在AI agent時代，這些技能的價值會大大降低。相反，問題識別能力、需求表達能力、結果評估能力會變得更加重要。

我也思考了這種轉變可能帶來的風險。當我們習慣于把復雜任務委托給AI時，是否會逐漸失去獨立解決問題的能力？當AI能夠完成大部分腦力工作時，人類如何保持思維的敏銳性？這些問題沒有標準答案，但值得我們認真考慮。

從社會分工的角度看，AI agent可能會重新定義很多職業。一些以技能執行為主的工作可能會受到沖擊，但同時也會創造新的機會。比如AI agent訓練師、任務設計師、結果審核員等新職業可能會興起。關鍵是我們要主動適應這種變化，而不是被動等待。

最終，我認為"OK Computer"這樣的AI agent并不是要取代人類，而是要解放人類。它讓我們從繁瑣的執行工作中解脫出來，把時間和精力投入到更有創造性、更有意義的事情上。這種解放的前提是，我們要學會與AI協作，學會正確地使用這些強大的工具。

從聊天到干活，從回答問題到完成任務，AI的進化遠未結束。"OK Computer"代表的可能只是這場變革的一個片段，但它足以讓我們窺見未來的模樣：一個人類與AI深度協作、各自發揮優勢的世界正在到來。

結尾

也歡迎大家留言討論，分享你的觀點！

覺得內容不錯的朋友能夠幫忙右下角點個贊，分享一下。您的每次分享，都是在激勵我不斷產出更好的內容。

歡迎關注深思圈，一起探索更大的世界。

- END -

兩個“特別坑”的AI產品創業方向，你知道嗎

速度將成為AI時代唯一的護城河

a16z重磅預測：Vibe coding贏者通吃？錯了，垂直專業化才是未來

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.