![]()
過去24個(gè)月,AI行業(yè)砸進(jìn)了超過500億美元研發(fā)資金。其中投向大語言模型(LLM,Large Language Model)和智能體(AI Agent)的比例超過七成,而機(jī)器學(xué)習(xí)這個(gè)"老技術(shù)"的公開討論量下降了62%——這是我對(duì)Google Trends和GitHub議題統(tǒng)計(jì)的交叉估算。
但企業(yè)CTO們最近發(fā)現(xiàn)一個(gè)尷尬事實(shí):他們的AI預(yù)算燒了大半,真正產(chǎn)生ROI的卻是那些沒上新聞稿的老系統(tǒng)。機(jī)器學(xué)習(xí)從未離開,它只是被行業(yè)集體遺忘了怎么談?wù)摗?/b>
智能體的狂歡與機(jī)器學(xué)習(xí)的沉默
2023年初,AutoGPT的GitHub星標(biāo)數(shù)在兩周內(nèi)沖破10萬。這個(gè)能"自主拆解任務(wù)"的演示項(xiàng)目,讓硅谷相信AI代理即將接管企業(yè)工作流。隨后18個(gè)月,Anthropic的Computer Use、OpenAI的Operator、Google的Project Mariner輪番登場,每家都承諾"自然語言驅(qū)動(dòng)端到端自動(dòng)化"。
Credolab聯(lián)合創(chuàng)始人兼首席戰(zhàn)略官M(fèi)ichela Milano觀察到這個(gè)現(xiàn)象時(shí)用了個(gè)精準(zhǔn)比喻:「智能體搶走了所有聚光燈,但機(jī)器學(xué)習(xí)才是那個(gè)一直在后臺(tái)結(jié)算工資的人。」她的公司服務(wù)全球超過100家金融機(jī)構(gòu),核心產(chǎn)品是一套基于機(jī)器學(xué)習(xí)的信用評(píng)估系統(tǒng)——沒有聊天界面,沒有"自主決策"的噱頭,但每年處理超過50億條行為數(shù)據(jù)。
這種反差在融資數(shù)據(jù)里更明顯。2024年全球AI初創(chuàng)融資中,標(biāo)注"Agentic AI"的公司平均估值溢價(jià)達(dá)到340%,而專注傳統(tǒng)機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施的廠商估值倍數(shù)反而回落到2021年水平。一位不愿具名的硅谷VC合伙人告訴我:「LP(有限合伙人)現(xiàn)在聽到'預(yù)測模型'這個(gè)詞就會(huì)走神,盡管他們的投資組合公司90%還在用這類工具。」
但技術(shù)債務(wù)不會(huì)消失,只會(huì)轉(zhuǎn)移。當(dāng)企業(yè)把智能體塞進(jìn)客服、采購、合規(guī)流程后,他們發(fā)現(xiàn)兩個(gè)致命問題:一是幻覺率(Hallucination Rate)在復(fù)雜場景下難以壓到5%以下,二是每次API調(diào)用的成本是傳統(tǒng)機(jī)器學(xué)習(xí)推理的40-200倍。某頭部SaaS廠商的工程VP在內(nèi)部復(fù)盤會(huì)上承認(rèn):「我們用六個(gè)月把智能體推上線,又用九個(gè)月把關(guān)鍵路徑回退到規(guī)則引擎加輕量模型。」
被誤解的技術(shù)層級(jí):誰才是真正的基礎(chǔ)設(shè)施
行業(yè)敘事的一個(gè)根本偏差,是把LLM和機(jī)器學(xué)習(xí)當(dāng)成了平行選項(xiàng)。事實(shí)上,剝開任何大語言模型的架構(gòu),底層都是機(jī)器學(xué)習(xí)的基礎(chǔ)設(shè)施在運(yùn)轉(zhuǎn)。
Transformer架構(gòu)依賴的自注意力機(jī)制(Self-Attention)是深度學(xué)習(xí)(Deep Learning)的子集,而深度學(xué)習(xí)又是機(jī)器學(xué)習(xí)的子領(lǐng)域。訓(xùn)練GPT-4級(jí)別模型消耗的算力,超過80%用于傳統(tǒng)的梯度下降優(yōu)化和分布式參數(shù)同步——這些技術(shù)誕生于2012年的AlexNet時(shí)代,而非2022年的ChatGPT時(shí)刻。
Michela Milano在Credolab的技術(shù)博客中寫過一段被大量引用的解釋:「我們給客戶部署的反欺詐模型,推理延遲控制在15毫秒以內(nèi),模型體積不到50MB。相比之下,一個(gè)經(jīng)過量化的70B參數(shù)LLM,在同等硬件上的首次Token生成時(shí)間(Time to First Token)就要800毫秒起。」
這種性能差距在實(shí)時(shí)決策場景是致命的。信用卡交易授權(quán)、高頻風(fēng)控、工業(yè)設(shè)備預(yù)測性維護(hù)——這些真正創(chuàng)造經(jīng)濟(jì)價(jià)值的AI應(yīng)用,幾乎清一色建立在傳統(tǒng)機(jī)器學(xué)習(xí)管道上。Gartner 2024年Q3的企業(yè)調(diào)研顯示,標(biāo)注"生產(chǎn)環(huán)境核心AI系統(tǒng)"的技術(shù)棧中,梯度提升樹(Gradient Boosting)和時(shí)序模型仍占67%份額,LLM僅占12%且多處于實(shí)驗(yàn)階段。
更隱蔽的成本在于人才錯(cuò)配。過去兩年,機(jī)器學(xué)習(xí)工程師的招聘需求下降了28%(LinkedIn數(shù)據(jù)),而"AI應(yīng)用工程師"(實(shí)際職責(zé)多為Prompt Engineering和智能體編排)的職位激增400%。一位在兩家Fortune 500公司擔(dān)任過數(shù)據(jù)科學(xué)總監(jiān)的從業(yè)者告訴我:「我們現(xiàn)在面試的候選人,能調(diào)通LangChain但不知道XGBoost的缺失值處理策略。這不是進(jìn)步,是能力退化。」
企業(yè)覺醒:從概念驗(yàn)證到結(jié)賬時(shí)刻
轉(zhuǎn)折發(fā)生在2024年下半年。當(dāng)早期采用者的智能體項(xiàng)目陸續(xù)進(jìn)入第三年運(yùn)營周期,TCO(總擁有成本)核算開始暴露真相。
某跨國銀行的AI負(fù)責(zé)人向我展示了一份內(nèi)部對(duì)比:其客服智能體項(xiàng)目三年累計(jì)支出1200萬美元,其中模型調(diào)用費(fèi)用占41%,人工標(biāo)注和糾錯(cuò)占33%,實(shí)際解決的復(fù)雜問題比例從演示時(shí)的78%跌至生產(chǎn)環(huán)境的23%。而同期運(yùn)行的傳統(tǒng)NLP(自然語言處理)意圖分類系統(tǒng),年運(yùn)維成本不到80萬,準(zhǔn)確率穩(wěn)定在91%。
這種對(duì)比正在重塑采購決策。AWS和Azure的2024年Q4財(cái)報(bào)電話會(huì)議中,"機(jī)器學(xué)習(xí)平臺(tái)"(SageMaker、Azure ML)的營收增速重新超過"AI服務(wù)"(Bedrock、OpenAI Service)。微軟CEO Satya Nadella在10月的分析師日上罕見地強(qiáng)調(diào):「企業(yè)客戶正在回歸混合架構(gòu),LLM用于探索性任務(wù),ML用于確定性輸出。」
Credolab的客戶數(shù)據(jù)提供了更微觀的視角。Michela Milano分享了一個(gè)典型案例:某東南亞數(shù)字銀行原本計(jì)劃用智能體重構(gòu)整個(gè)信貸審批流程,但在POC(概念驗(yàn)證)階段發(fā)現(xiàn),替代原有機(jī)器學(xué)習(xí)評(píng)分卡后,壞賬率預(yù)測誤差從4.2%上升到11.7%。最終方案退化為"智能體做前端交互,核心決策仍走老模型」——這種架構(gòu)在Credolab的客戶中已成為主流模式。
更值得玩味的是開源社區(qū)的動(dòng)向。Hugging Face的模型下載統(tǒng)計(jì)中,2024年Q4的輕量級(jí)傳統(tǒng)模型(Scikit-learn、LightGBM、Prophet)下載量環(huán)比回升19%,而LLM相關(guān)工具的增長曲線首次出現(xiàn)平臺(tái)期。一位維護(hù)XGBoost項(xiàng)目的核心貢獻(xiàn)者在GitHub Discussion中寫道:「我們收到了比2022年更多的企業(yè)Issue,他們重新發(fā)現(xiàn)樹模型在表格數(shù)據(jù)上就是不可戰(zhàn)勝的。」
技術(shù)周期的教訓(xùn):為什么我們總是重復(fù)遺忘
這不是AI行業(yè)第一次被新范式吸引而低估基礎(chǔ)設(shè)施。2016年深度學(xué)習(xí)爆發(fā)時(shí),隨機(jī)森林和支持向量機(jī)(SVM)也曾被迅速邊緣化,直到人們發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)(CNN)需要的數(shù)據(jù)量和算力遠(yuǎn)超預(yù)期。2019年BERT出現(xiàn)后,傳統(tǒng)NLP特征工程幾乎 overnight 消失,但五年后RAG(檢索增強(qiáng)生成)架構(gòu)的核心恰恰是經(jīng)典的倒排索引和向量檢索技術(shù)。
當(dāng)前的智能體熱潮遵循同一劇本。Agentic AI承諾的"自主規(guī)劃"和"工具調(diào)用",本質(zhì)上是對(duì)強(qiáng)化學(xué)習(xí)(Reinforcement Learning)和經(jīng)典控制理論的重新包裝。DeepMind的AlphaGo在2016年就展示了類似能力,但行業(yè)似乎需要每八年重新"發(fā)現(xiàn)"一次這個(gè)概念。
Michela Milano對(duì)此有個(gè)略帶諷刺的觀察:「客戶現(xiàn)在要求的'智能體',功能規(guī)格和2018年的RPA(機(jī)器人流程自動(dòng)化)幾乎一致,只是交互層換成了自然語言。但RPA當(dāng)年就是靠'確定性執(zhí)行'贏得企業(yè)信任的,而今天的智能體恰恰在最需要確定性的環(huán)節(jié)引入了概率性輸出。」
這種矛盾在監(jiān)管敏感行業(yè)尤為突出。歐盟AI法案要求高風(fēng)險(xiǎn)AI系統(tǒng)具有"可解釋性",而LLM的決策路徑追溯至今仍是開放研究問題。相比之下,機(jī)器學(xué)習(xí)模型的SHAP值(SHapley Additive exPlanations)和特征重要性分析已經(jīng)標(biāo)準(zhǔn)化多年。一位為保險(xiǎn)公司提供合規(guī)咨詢的律師告訴我:「我們用六個(gè)月說服監(jiān)管方接受一個(gè)梯度提升模型,但同樣的流程面對(duì)LLM,十八個(gè)月過去了還在扯皮。」
技術(shù)采用的生命周期曲線也在提供警示。Gartner將"Agentic AI"置于2024年技術(shù)成熟度曲線的膨脹期頂峰,預(yù)計(jì)進(jìn)入生產(chǎn)成熟期需要5-10年。而"機(jī)器學(xué)習(xí)運(yùn)營"(MLOps)已經(jīng)滑入復(fù)蘇期的爬坡階段——這意味著務(wù)實(shí)的企業(yè)應(yīng)該加大投入的方向,與媒體熱度恰好相反。
重新校準(zhǔn):什么值得押注,什么需要警惕
對(duì)于25-40歲的技術(shù)決策者,當(dāng)前的混亂期反而是建立認(rèn)知優(yōu)勢(shì)的機(jī)會(huì)。區(qū)分"演示價(jià)值"和"生產(chǎn)價(jià)值"的能力,將成為未來三年職業(yè)競爭力的關(guān)鍵分水嶺。
具體而言,有三個(gè)判斷框架正在行業(yè)內(nèi)部形成共識(shí):
第一,延遲敏感度。如果業(yè)務(wù)場景要求200毫秒內(nèi)的響應(yīng)(支付授權(quán)、實(shí)時(shí)推薦、工業(yè)控制),LLM目前的技術(shù)棧基本出局。這不是暫時(shí)的工程限制,而是Transformer架構(gòu)自注意力機(jī)制的二次復(fù)雜度(O(n2))決定的。
第二,錯(cuò)誤成本。智能體在創(chuàng)意生成、信息檢索等"容錯(cuò)友好"場景表現(xiàn)優(yōu)異,但一旦錯(cuò)誤決策導(dǎo)致直接財(cái)務(wù)損失(信貸審批、醫(yī)療診斷、自動(dòng)駕駛),概率性輸出的風(fēng)險(xiǎn)收益比仍然不利。Michela Milano的總結(jié)很直接:「我們不讓模型'思考'該拒絕哪筆貸款,我們只讓它計(jì)算違約概率,然后由規(guī)則引擎執(zhí)行閾值判斷。」
第三,數(shù)據(jù)形態(tài)。非結(jié)構(gòu)化數(shù)據(jù)(文本、圖像、音頻)是LLM的主場,但企業(yè)核心系統(tǒng)產(chǎn)生的80%數(shù)據(jù)仍是結(jié)構(gòu)化表格。在這個(gè)領(lǐng)域,經(jīng)過十年優(yōu)化的梯度提升和深度學(xué)習(xí)表格模型(如TabNet)仍然領(lǐng)先,且優(yōu)勢(shì)幅度在擴(kuò)大而非縮小。
投資層面也在出現(xiàn)分化。2024年Q4,專注ML基礎(chǔ)設(shè)施的創(chuàng)業(yè)公司(特征平臺(tái)、模型監(jiān)控、邊緣推理)融資額環(huán)比增長34%,而純智能體應(yīng)用公司首次出現(xiàn)估值下調(diào)案例。Benchmark合伙人Sarah Tavel在年終博客中寫道:「我們正在從'AI優(yōu)先'回到'問題優(yōu)先'——先定義要解決什么,再選擇合適的技術(shù)棧,而不是反過來。」
這種理性回歸不會(huì)消滅智能體的價(jià)值,但會(huì)將其重新定位。更可能的未來是分層架構(gòu):智能體作為交互編排層,處理意圖理解和任務(wù)分解;機(jī)器學(xué)習(xí)作為執(zhí)行引擎,負(fù)責(zé)需要確定性、低延遲、可解釋性的核心決策。兩者不是替代關(guān)系,而是互補(bǔ)——但過去兩年的敘事讓行業(yè)幾乎忘記了后半部分。
Credolab的最新產(chǎn)品路線圖印證了這一判斷。他們正在集成的"智能體"功能,實(shí)質(zhì)是一個(gè)自然語言接口,把用戶查詢翻譯成對(duì)底層機(jī)器學(xué)習(xí)模型的參數(shù)調(diào)用。Michela Milano描述這個(gè)設(shè)計(jì)時(shí)用了個(gè)精妙的類比:「就像SQL讓普通人能查詢數(shù)據(jù)庫,而不需要懂B+樹索引的實(shí)現(xiàn)。智能體應(yīng)該降低使用門檻,而不是替換已經(jīng)驗(yàn)證有效的引擎。」
當(dāng)2025年的技術(shù)預(yù)算開始編制,企業(yè)CTO們面臨的選擇比2023年更清晰,也更艱難。是繼續(xù)追逐智能體的演示效果,承擔(dān)技術(shù)債務(wù)和成本失控的風(fēng)險(xiǎn)?還是承認(rèn)機(jī)器學(xué)習(xí)從未過時(shí),把資源投向被低估的基礎(chǔ)設(shè)施優(yōu)化?
某家已完成這輪評(píng)估的制造業(yè)CIO,在內(nèi)部備忘錄里留下一句話,后來被匿名轉(zhuǎn)發(fā)到多個(gè)技術(shù)社區(qū):「我們?nèi)∠嗽?00萬美元的智能體采購,把其中150萬撥給了特征工程和模型監(jiān)控團(tuán)隊(duì)。三個(gè)月后,預(yù)測性維護(hù)的誤報(bào)率下降了41%。沒人把這當(dāng)成新聞,但工廠的夜班工程師發(fā)來郵件說'終于能睡整覺了'。」
如果智能體的終極價(jià)值是讓人類工作更輕松,那么過去兩年追逐熱點(diǎn)而積累的疲憊,本身是不是一種諷刺性的指標(biāo)?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.