![]()
你有沒有想過,我們正在見證的可能不僅僅是 AI 工具的改進,而是整個軟件構建方式的根本轉變?當應用程序開始進行成百上千次 AI 調用來完成單一任務時,我們需要重新思考什么是"AI 密集型應用",以及如何構建它們。最近,我觀看了知名 AI 工程師 Shawn Wang(swyx)在 AI Engineers 大會上的一場分享,他提出了一個讓我深思的觀點:我們正處在尋找 AI 工程"標準模型"的關鍵時刻。這不是什么漸進式的優化,而是可能影響整個行業未來十年發展方向的基礎性變革。
![]()
在這場分享中,Shawn 提到了一個非常有趣的現象:從用戶輸入到 AI 輸出的比例正在發生巨大變化。傳統的 ChatGPT 是 1:1 的比例,用戶問一個問題,AI 給一個回答。但現在我們看到的深度研究工具、代碼生成器已經變成了 1:100,甚至更高。而在一些環境感知的主動型 Agent 中,這個比例變成了 0:n,也就是說,不需要任何人類輸入,AI 就能持續產生有價值的輸出。這種變化不僅僅是數量上的,更是質的飛躍,它意味著我們正在從"AI 輔助"走向"AI 驅動"的應用時代。我認為理解這種轉變的本質,對于任何想要構建下一代智能應用的人來說都至關重要。
![]()
重新審視 AI 工程的本質
Shawn 在分享中提到,AI 工程這個概念從 2023 年開始就在不斷演進。最初,人們認為 AI 工程師就是"GPT 包裝器"的開發者,地位很低,經常被嘲笑。但現在看來,那些早期的"GPT 包裝器"開發者很多都已經獲得了巨大的商業成功。這個轉變讓我意識到,技術的價值不在于它的復雜程度,而在于它能解決什么實際問題。
我特別認同 Shawn 提出的一個觀點:不要過度復雜化。他引用了多個成功案例,比如 Anthropic 在 SweetBench 上的突破,以及 Greg Brockman 的深度研究工具,這些成功的 AI 應用都有一個共同特點——它們使用了相對簡單的架構,但能夠產生強大的效果。這與我在實際項目中的經驗完全吻合。很多時候,我們容易陷入技術炫技的陷阱,追求最新最復雜的架構,卻忽略了用戶真正需要什么。
![]()
從工程角度看,AI 工程正在變得越來越多學科化。這不再只是機器學習工程師或者軟件工程師的專屬領域,它需要產品思維、用戶體驗設計、系統架構、數據工程等多個領域的知識融合。我觀察到,最成功的 AI 產品往往來自那些能夠跨學科思考的團隊,他們不是從技術出發,而是從用戶需求出發,然后用 AI 技術來解決具體問題。
![]()
Shawn 把當前的 AI 工程時代比作 1927 年的索爾維會議,當時愛因斯坦、居里夫人等物理學界的頂尖人物聚集在一起,為現代物理學奠定了基礎。他認為我們現在正處在類似的歷史時刻,AI 工程師們正在為這個新興領域建立基礎性的概念和標準。這個比喻讓我想到,真正的突破往往發生在新領域形成的早期階段,當基本概念和標準被確立后,后續的發展往往是在這些基礎上的漸進式改進。
尋找 AI 工程的"標準模型"
在傳統軟件工程中,我們有很多成熟的標準模型:ETL(提取、轉換、加載)、MVC(模型-視圖-控制器)、CRUD(創建、讀取、更新、刪除)、MapReduce 等等。這些模型為軟件工程師提供了思考框架和最佳實踐,讓復雜的系統設計變得更加有序和可預測。但在 AI 工程領域,我們還缺乏這樣的標準模型。
Shawn 提到了幾個候選的標準模型。首先是 LM OS(Language Model Operating System,語言模型操作系統),這是由 Andrej Karpathy 在 2023 年提出的概念。這個模型將大語言模型視為一種新的計算平臺,就像操作系統一樣,為上層應用提供基礎服務。Shawn 對這個概念進行了 2025 年的更新,加入了多模態能力和標準工具集,以及 MCP(Model Context Protocol,模型上下文協議),這已經成為連接外部世界的默認協議。
![]()
第二個是 LLM SDLC(Software Development Life Cycle,軟件開發生命周期),這是一個專門針對 AI 應用的開發流程模型。我發現這個模型特別有趣的地方在于,它揭示了 AI 應用開發的成本結構。正如 Shawn 提到的,早期階段的工具——LLM 調用、監控、RAG(檢索增強生成)——基本上都是免費或者成本很低的。真正開始花錢的是當你需要做評估(evals)、安全編排和其他真正的硬核工程工作時。這個洞察對于 AI 創業公司的商業規劃非常重要。
![]()
第三個是構建有效 Agent 的模型,這來自 Anthropic 的研究。雖然不同公司對 Agent 的定義不同,OpenAI 和 Anthropic 都有各自的版本,但基本的構建原則是相似的:意圖理解、控制流、記憶、規劃和工具使用。我認為這個模型的價值在于它提供了一個系統性的思考框架,讓我們可以更清楚地分析和設計 Agent 系統。
![]()
我特別欣賞 Shawn 對 Agent 定義爭論的態度。他說,與其爭論什么是工作流、什么是 Agent,不如專注于交付價值。這種實用主義的方法讓我想起了早期互聯網時代的精神——重要的不是技術的純粹性,而是它能為用戶創造什么價值。
從用戶輸入到 AI 輸出的比例變化
Shawn 提出了一個我認為非常有洞察力的分析框架:用戶輸入與 AI 輸出的比例。這個框架讓我們可以清楚地看到不同類型 AI 應用的本質差異,以及它們所處的發展階段。
在 Copilot 時代,這個比例大約是每輸入幾個字符就會觸發一次自動補全。在 ChatGPT 中,大致是每個查詢對應一個回應,基本上是 1:1 的關系。但到了推理模型階段,比如 OpenAI 的 o1,這個比例變成了 1:10,用戶提出一個問題,AI 會進行多輪內部推理才給出答案。
![]()
更有意思的是深度研究工具,比如 Google 的 NotebookLM,比例可能達到 1:100 甚至更高。用戶給出一個研究主題,AI 會進行大量的信息收集、分析、綜合工作,最終產生一個深度的研究報告。我自己使用 NotebookLM 的體驗確實證實了這一點,輸入幾個關鍵詞或者上傳幾個文檔,它能夠生成詳細的分析報告、播客對話等多種形式的輸出。
最極端的情況是環境感知的主動型 Agent,比例是 0:n。這些系統不需要任何人類輸入就能持續產生有價值的輸出。想象一下一個監控系統異常的 AI Agent,它可以 24/7 監控系統狀態,發現問題時自動生成報告、發送警報、甚至采取修復措施。這種"無輸入但有輸出"的模式代表了 AI 應用的一個全新范式。
![]()
我認為這個分析框架的價值在于,它為我們提供了一個清晰的進化路徑。如果你正在開發一個 AI 應用,你可以問自己:我現在處在哪個階段?我如何向更高比例的方向發展?這種發展不僅意味著技術上的進步,更重要的是用戶價值的提升。用戶愿意為更少的輸入獲得更多的有價值輸出而付費。
AI News 案例:實踐中的 AI 密集型應用
Shawn 以他自己開發的 AI News 作為案例,深入剖析了一個真實的 AI 密集型應用是如何工作的。AI News 是一個自動化的新聞聚合和分析工具,目前有超過 7 萬名讀者。雖然很多人稱它為 Agent,但 Shawn 承認它實際上更像是一個工作流系統。
有趣的是,PyTorch 的負責人 Soumith 曾經告訴 Shawn,雖然他很喜歡 AI News,但這并不是一個 Agent。這個評論讓 Shawn 開始反思:為什么一個不是 Agent 的系統仍然能夠產生如此大的價值?這個思考過程讓我意識到,我們往往過于糾結于定義和標簽,而忽略了實際的價值創造。
![]()
AI News 的核心是一個相對簡單的流程:抓取、規劃、遞歸總結、格式化和評估。Shawn 說他為不同的數據源(Discord、Reddit、Twitter)寫了三次相同的代碼,每次都是這個流程。這種"三個小孩穿風衣"式的架構看起來很簡單,但它每天都在運行,為用戶提供價值。
更重要的是,這個系統展現了 AI 密集型應用的特征:為了服務一個特定目的,它進行了成千上萬次的 AI 調用。每次運行,它都會抓取大量信息,用 AI 進行多輪分析和總結,最終產生一個精煉的新聞匯總。這種大量 AI 調用的模式,正是 AI 密集型應用區別于傳統應用的關鍵特征。
![]()
從商業角度看,AI News 的成功證明了一個重要觀點:用戶關心的不是技術的純粹性,而是最終的價值交付。無論你稱它為工作流、Agent 還是其他什么,只要它能夠穩定地為用戶提供有價值的輸出,就是成功的產品。這個案例讓我重新思考了技術創新的本質:不是為了炫技,而是為了解決實際問題。
SPADE 模型:AI 密集型應用的通用框架
基于 AI News 的經驗,Shawn 提出了一個通用的 AI 密集型應用框架,他稱之為 SPADE 模型。這個模型包含五個步驟:Sync(同步)、Plan(規劃)、Analyze(分析)、Deliver(交付)和 Evaluate(評估)。我認為這個模型的價值在于它為構建 AI 密集型應用提供了一個清晰的思考框架。
![]()
Sync 階段是數據收集和同步。這個階段需要從各種來源收集相關信息,可能包括 API 調用、網頁抓取、數據庫查詢等。在 AI News 的案例中,這就是從 Discord、Reddit、Twitter 等平臺抓取相關信息的過程。我發現這個階段的質量往往決定了整個應用的效果,垃圾進垃圾出的原理在 AI 應用中同樣適用。
Plan 階段是規劃處理策略。AI 需要決定如何處理收集到的信息,制定分析計劃。這可能包括確定分析的優先級、選擇合適的處理方法、分配計算資源等。在復雜的 AI 密集型應用中,這個階段可能需要多輪規劃和調整。
![]()
Analyze 階段是并行處理和分析。這是 AI 密集型應用的核心,大量的 AI 調用在這個階段發生。系統會對收集到的信息進行深度分析,提取關鍵信息,識別模式和趨勢。Shawn 特別提到了并行處理的重要性,這是提高效率的關鍵。
Deliver 階段是將分析結果整合并交付給用戶。這個階段需要將大量的分析結果匯總成用戶可以理解和使用的形式。可能是文本報告、可視化圖表、代碼、音頻等不同形式。Shawn 提到了 ChatGPT 的 Canvas 和 Claude 的 Artifacts,它們可以將輸出交付為可執行的代碼,這是一種很有趣的交付方式。
![]()
Evaluate 階段是評估結果質量和效果。這個階段對于持續改進非常重要,需要收集用戶反饋、分析系統性能、識別改進機會。我認為這個階段往往被忽視,但它對于構建可持續的 AI 產品至關重要。
SPADE 模型的一個重要特點是它強調了從"多到一"的聚合過程。AI 密集型應用通常需要處理大量信息,然后將其整合成精煉的輸出。這種聚合能力正是 AI 技術的強項,也是這類應用能夠為用戶創造價值的關鍵。
![]()
我對 AI 密集型應用發展趨勢的思考
聽完 Shawn 的分享,結合我自己在 AI 領域的觀察和實踐,我對 AI 密集型應用的發展趨勢有一些深度思考。我認為我們正處在一個關鍵的轉折點,傳統的軟件開發范式正在被徹底重塑。
首先,我注意到計算成本結構的根本性變化。在傳統應用中,計算成本主要來自服務器資源、數據庫查詢、網絡傳輸等。但在 AI 密集型應用中,大部分成本轉移到了 AI 推理上。這種變化不僅影響了成本結構,也改變了優化策略。我們需要重新思考如何設計高效的 AI 密集型系統,如何平衡推理質量和成本,如何通過緩存、批處理等技術降低成本。
其次,用戶期望的變化比技術發展更快。用戶已經開始期待 AI 應用能夠理解復雜的意圖,處理模糊的輸入,提供個性化的輸出。這種期望的變化迫使我們重新審視產品設計。我們不能再簡單地將 AI 作為一個功能模塊嵌入傳統應用中,而需要將 AI 能力作為產品的核心競爭力來設計整個用戶體驗。
![]()
我特別關注的是多模態能力的發展。Shawn 在更新 LM OS 模型時提到了多模態,這確實是一個重要趨勢。未來的 AI 密集型應用不僅要處理文本,還要處理圖像、音頻、視頻等多種形式的輸入和輸出。這種多模態能力將開啟全新的應用場景,比如基于視覺理解的自動化、音頻生成的創意工具、多媒體內容的智能編輯等。
從商業模式角度看,AI 密集型應用正在創造新的價值主張。傳統軟件通常按照功能或用戶數量定價,但 AI 密集型應用可能更適合按照價值結果定價。比如,一個 AI 研究助手的價值不在于它有多少功能,而在于它能為用戶節省多少研究時間,或者產生多少有價值的洞察。這種定價模式的轉變將深刻影響 AI 產品的設計和商業策略。
我也看到了一些潛在的挑戰。隨著 AI 密集型應用的普及,我們面臨著新的技術債務問題。大量的 AI 調用使得應用的行為變得更難預測和調試。如何確保 AI 密集型應用的可靠性、可維護性和可擴展性,將成為工程師面臨的新挑戰。我們需要新的工具和方法來監控、調試和優化這些系統。
另一個我思考較多的問題是 AI 密集型應用對開發者技能的要求。傳統的軟件開發技能仍然重要,但開發者還需要理解 AI 模型的特性、掌握提示工程技巧、具備數據處理能力、了解 AI 倫理等。這種技能要求的變化可能會重塑整個軟件工程教育和培訓體系。
![]()
從用戶體驗角度看,AI 密集型應用帶來了新的設計挑戰。如何向用戶傳達 AI 的處理過程?如何處理 AI 的不確定性?如何設計有效的反饋機制?這些問題沒有標準答案,需要我們在實踐中不斷探索和創新。
標準模型的演進與未來展望
Shawn 在分享中強調了尋找 AI 工程標準模型的重要性,我對此深有同感。標準模型不僅僅是技術框架,更是整個行業的共同語言和思維模式。回顧軟件工程的歷史,每一次重大的標準模型確立都推動了行業的快速發展和成熟。
我認為當前我們正處在多個候選標準模型并存的階段,這是一個正常且必要的過程。LM OS、LLM SDLC、Agent 構建模型、SPADE 等,每個模型都從不同角度捕捉了 AI 工程的某些本質特征。最終,可能會有一個或幾個模型脫穎而出,成為行業的事實標準。
但我也意識到,AI 技術發展的速度可能比傳統軟件技術更快,這意味著標準模型可能需要更頻繁的更新和演進。我們不能期待一個標準模型能夠適用很多年,而需要建立一種持續演進的機制。這要求我們在追求標準化的同時,保持足夠的靈活性和開放性。
![]()
我特別欣賞 Shawn 提出的實用主義方法。與其爭論定義,不如專注于解決實際問題。這種方法論對于一個快速發展的領域來說非常重要。我們需要在理論建構和實踐應用之間找到平衡,既要有清晰的概念框架,又不能被框架束縛住創新的思維。
從全球視角看,不同地區的 AI 工程社區可能會形成不同的標準模型和最佳實踐。這種多樣性是有益的,它能促進創新和知識交流。但同時,我們也需要某種程度的標準化來促進協作和互操作性。如何在多樣性和標準化之間找到平衡,將是一個長期的挑戰。
我預測未來幾年將是 AI 工程標準模型快速演進的時期。隨著更多成功案例的涌現,隨著技術的進一步成熟,隨著行業實踐的積累,我們將逐漸形成更加成熟和穩定的標準模型。這些標準模型將不僅指導技術實現,還將影響產品設計、商業策略、組織架構等多個層面。
實踐建議:如何構建下一代 AI 密集型應用
基于 Shawn 的分享和我自己的思考,我想為正在構建或考慮構建 AI 密集型應用的開發者提供一些實用建議。這些建議基于我對當前技術趨勢的理解和對未來發展的預測。
首先,從小處開始,但要有大局觀。不要試圖一開始就構建一個完美的 AI 密集型應用,而是選擇一個具體的用例,用最簡單的方法驗證核心價值。AI News 的成功很大程度上來自于它專注解決一個明確的問題:幫助 AI 從業者快速了解行業動態。確定了核心價值后,再逐步增加復雜性和 AI 密集度。
其次,重視數據質量和處理流程。在 SPADE 模型中,Sync 階段的質量往往決定了最終結果。投入時間設計好數據收集、清洗和預處理流程,建立數據質量監控機制。我發現很多 AI 密集型應用的問題不是出在 AI 模型上,而是出在數據處理上。
第三,設計可觀測和可調試的系統。隨著 AI 調用次數的增加,系統行為變得更加復雜和難以預測。從一開始就建立完善的日志記錄、監控和調試機制。記錄每次 AI 調用的輸入、輸出、耗時、成本等信息,建立性能基線,設置異常檢測。
第四,采用漸進式的用戶體驗設計。不要試圖一次性向用戶展示所有的 AI 能力,而是設計一個漸進式的體驗流程。讓用戶先體驗基礎功能,逐步了解和信任 AI 能力,然后再引導他們使用更高級的功能。這種方法不僅能降低用戶的學習成本,還能收集有價值的用戶反饋。
第五,建立有效的成本控制機制。AI 密集型應用的運營成本可能很高,特別是在用戶規模擴大后。設計靈活的 AI 調用策略,比如根據用戶等級、使用場景、時間等因素動態調整 AI 使用強度。考慮使用緩存、批處理、模型優化等技術降低成本。
第六,重視用戶反饋和持續改進。AI 密集型應用的價值很大程度上取決于它們能否準確理解用戶需求并提供有價值的輸出。建立有效的用戶反饋收集機制,定期分析用戶行為數據,快速迭代和改進。不要害怕暴露 AI 的局限性,透明度往往能增加用戶信任。
最后,保持學習和適應的心態。AI 技術發展很快,新的模型、工具和最佳實踐不斷涌現。建立一個學習型的團隊文化,定期評估和更新技術棧,關注行業動態和最佳實踐。同時,不要被技術潮流綁架,始終以解決用戶問題為導向做技術選擇。
我相信,隨著 AI 技術的進一步發展和標準模型的逐漸成熟,構建 AI 密集型應用將變得更加容易和可預測。但在當前這個階段,我們仍然需要大量的實驗和探索。每個成功的案例都在為整個行業貢獻寶貴的經驗和洞察。
最終,我認為 AI 密集型應用的成功不僅取決于技術實現,更取決于對用戶需求的深刻理解和對價值創造的持續專注。技術是手段,價值是目的。只有那些能夠為用戶創造真正價值的 AI 密集型應用,才能在激烈的競爭中勝出,并推動整個行業向前發展。
結尾
也歡迎大家留言討論,分享你的觀點!
覺得內容不錯的朋友能夠幫忙右下角點個贊,分享一下。您的每次分享,都是在激勵我不斷產出更好的內容。
歡迎關注深思圈,一起探索更大的世界。
- END -
兩個“特別坑”的AI產品創業方向,你知道嗎
![]()
速度將成為AI時代唯一的護城河
![]()
這個神秘指標,決定了你的AI產品是下一個獨角獸還是炮灰
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.