撰文| 吳先之
編輯| 王 潘
站在2026年,回望剛剛過去的2025年,幾乎所有人都認同這是AI在B端落地的大年。
“ToB的生意跟ToC完全不一樣,C端會有波動和起伏,而B端只要增長會一直增長,既不可能說用就用,也不可能用了之后立馬棄用,有很高的粘性。”阿里云一位從事B端業務多年的老兵表示。
一位飛書客戶成功經理提到,2023年到2024年上半年,飛書跟客戶共創了大概1500個場景,實際有用的不超過20個。可到了2025年,光是飛書AI效率先鋒大賽,便涌現了230個真實業務場景案例。
AI不僅在生產資料上重構著企業業務,還改變著企業更深層次的組織肌理。上述阿里云人士表示,“企業上云時代,我們主要對接企業IT部門,而在AI大規模落地時,目前有約三成不再是IT部門。”
AI與IT部門的交融,大約有三種形態,較為激進的企業,會單獨成立一級AI部門;第二種是循序漸進,將AI團隊融入到既有的IT部門中;第三種較為特殊,成立由企業一把手直管的辦公室,扮演著中臺角色,雖然建制不大,但優先級很高。
當企業客戶從內到外開始變化,云與AI大廠的策略也在逐漸發生變化。
![]()
前述阿里云人士表示,“IT和云的目標是走進運維,現在AI需要走進業務。”
這一觀點與飛書不謀而合。“過去IT或是云采購大部分是自上而下的,而AI的落地則是自下而上,業務一線的工作人員在自己的工作流程中把AI工具用好,實踐做出來。”
可以看到,無論是擁有全棧AI技術體系的阿里云,還是完成了從SaaS轉型為PaaS的飛書,都意識到了AI正在改變toB生意的邏輯。
我們試圖從極兔這家物流企業的角度,窺探企業AI落地背后的選擇與考量。
AI云廠商做元器件,企業做集成
與廠商期待AI加速落地不同,企業在實際運作中,更傾向于漸進式。“我們不是一次性地全量投入,而是漸進式,在一個階段內找最重點、最急迫的問題,然后試點、打磨、升級、推廣。”極兔AI團隊表示。
極兔同許多大公司一樣,內部系統無外乎外采與自研兩種,而判斷外采與自研,主要取決于投入成本、實際場景,以及是否關系到企業核心競爭力。作為全球化企業,極兔對于核心系統和應用都會傾向于自主研發,而在底層通用大模型服務上會更多依賴于外采。
在企業實際運作中,外采與自研的邊界并不是那么涇渭分明,更多時候是以集成的形態出現。例如自動化設備的集成程度便很高。“物流行業發展很多年,自動化設備比較成熟,如條碼、分揀、存取、GPS跟蹤等系統,不同企業都會做一定程度的集成”。一位極兔人士表示。快遞企業在成熟解決方案面前,沒有必要“重復造輪子”。
而另一部分涉及到企業核心競爭力,或是市面上沒有的系統,企業只能自研。一位極兔人士提到,“只是底層很多原子化能力會采用外部成熟方案。”這也是不少toB廠商強調“被集成”的根本動因。
例如影響快遞公司效率的異常件識別系統,極兔通過自研或外采成熟的圖像識別、OCR(光學字符識別)、人臉識別等方案,集成到自己的物流系統之中。再比如,涉及到核心關鍵的物流相關模型,尤其是垂域大模型,進行場景化的微調,亦是如此。
![]()
值得一提的是,企業對于一些高度集成后的PaaS產品,表現出了很高的興趣。
過去幾年,生成式AI吸引了不少企業關注,其中就包括市場營銷部門。不論廠商將故事講得多么美好,生成式AI在企業級市場中,仍然算不上盡善盡美。
一位極兔速遞中國市場營銷部編導表示,“在企業流程中我們要的是確定性,不管是生產場景,還是輸出一個企業級宣傳片,確定性對于企業來說是最重要的。”即便模型再好用,使用者Prompt能力再強,最后輸出的片子仍有很大概率不可用。
視頻生成大模型存在一個悖論,既要保持生成物料的審美一致性,同時得根據腳本節奏呈現出差異化特點,即便如此,到最后的商標環節,還是得靠“手搓”,或引入原片。“對于企業來說,商標的色號、形制都不能有絲毫問題。”
團隊用拆解工作流的手段,解決了問題。他們將內容生產切割為N個節點,腳本生成、分鏡生成、校驗故事等環節都有對應的Agent,且調用的模型各不相同。在此基礎上,又引入了一套由自己和第三方產品混合的Agent,對生成的物料進行整合。
在整個流程中,團隊會根據實際生成效果,調用不同模型,通義、豆包、Deepseek、即夢等,海外市場因合規原因也會使用其他大模型。極兔方面表示,“我們會根據業務場景靈活使用自研AI平臺或飛書平臺,搭建智能體或工作流應用,引入AI后能讓確定性更高。”
在企業上云的時代,不少廠商都使用混合云策略,存在一個體量不小的云下市場。而在AI時代,不少廠商也走向了混合模型,從而讓一部分需求可以被Token計算,另一部分則完全無法計算。
一位阿里云資深市場人士測算,占比更高的中小企業主要是在云上訓練,這部分能夠參考Token消耗。而另一部分企業要么處于合規和安全,要么是企業IT能力強,這部分占比很高的需求情況無法計算,例如私有化部署和云下訓練部分,“我們只知道他投入了多少在IaaS,卻不知道調用了多少Token”。
無法被預計的部分確實在極兔的案例中頻頻出現。一位極兔人士告訴光子星球,公司在AI應用上采用混合技術策略。最終服務端的高頻Token消耗,主要來自行業主流的模型調用,以滿足大量通用需求。然而,在追求核心業務場景的定制化效果時,極兔的研發中心放在了基于可微調基座模型,進行自主的模型精調與后訓練。
通過這種方式,極兔得以構建私有化的專屬模型,而非僅僅依賴商業API調用。
AI落地的KPI:性能、效果、成本
去年年中,世界人工智能大會公布了一組數據,截至去年7月,全球已發布大模型3755個,其中1509個來自國內公司。
以生成式AI為代表的大模型,處于超供給的情況下,在需求側卻出現了以決策式AI為代表的中小模型短缺。根據極兔方面的實踐來看,當前階段,企業對于中小模型的需求高于大模型。一部分原因是通用模型無法解決垂直場景中的問題,企業需要在垂直場景中能用的AI。
“一些核心場景的延遲要求很苛刻,可能要20毫秒以內,且調用非常大,現階段只能用小模型來解決。”極兔方面提到,在下單時生成電子面單必須依賴小模型,而使用大模型的場景主要集中在對延遲要求沒有那么高,涉及到語義理解的場景,像AI助手、智能客服、經營分析等。
實踐不僅讓極兔很早就意識到了大模型與中小模型的差異化,甚至在不斷積累之下,已在使用AI改造自己的核心能力。
據悉,集團正在構建物流AI決策大腦,該系統的目的是整合攬收、中心操作、運輸、末端、客服等原本獨立性相對較強的環節,提升環節間的協作能力,從而為集團整體提效。而在這個過程中,極兔自然而然地很清楚,到底在如此多的模型中,自己應該用什么模型。
評估模型,企業不會關注模型廠商的參數,而是看業務反饋。具體流程是業務部門提出需求,然后極兔技術團隊會基于業務場景和需求做調研與測算,評估ROI。評估通過之后,需求部門和產研部門會對齊。
整個過程中,有三個核心評估指標,分別是效果(準確性)、性能(響應時間)、成本(價格)。
以知識問答為例。極兔會首先測試不同模型的性能,關鍵信息抽取準確性,例如全球各地的地理實體、人名、郵編。這是一個剛性指標,通常要求高于95%以上才能入候選池。
由于調用量往往會非常大,因而還會增加響應時間。極兔AI團隊表示,“DeepSeek的準確性非常好,但因為太慢了,所以在這個環節上可用性較低。”
![]()
效果與性能在整個評估環節中起決定作用,能覆蓋兩個核心需求,且領先其他模型,便會最終應用。照理來說,微利的快遞物流行業會非常關注成本,但因為2024年以來,Token價格持續下跌,成本在決策天平上的權重已讓位于性能與效果,企業對于成本的首要顧慮得以緩解,從而更傾向于應用領先的技術模型。
從該案例可以看到,企業對于模型的選用帶有典型的“可插拔”特點,隨著業務變化而隨時更換。
盡管極兔對于AI落地持漸進式思維,但集團對于AI的投入力度很大,面對業務與技術同時處于頻繁迭代的現狀,企業預算隨之變得較為彈性。
以2025年預算為例,集團按照物流AI決策大腦的藍圖,為十余個業務制定了對應的預算規劃。與此同時,還設置了一個或季度,或半年度的滾動機制。當突然發現新需求,或是新技術后,集團內便會立即調研、測試,將前述流程跑一遍,只要符合流程便會立即上報。
廠商包不圓的異構
去年年底,海外谷歌Gemini 3、GPT 5.2陸續發布,國內如火山引擎發布了豆包大模型1.8,阿里通義大模型體系持續迭代,企業在實際應用中其實比模型廠商有更多有效反饋。
“年底這一輪迭代后,模型的數學推理能力急劇增強,但是存在過擬合的問題。”極兔AI團隊表示,過分追求測試集的評測,導致企業在落地過程中發現了比較嚴重的幻覺和不準確的問題。因此,企業不得不將更多精力放在基于文檔的知識問答、通過工程化手段提升準確性,以及基于上下文的任務規劃能力上。
某云廠商人士承認,雖然模型廠商都號稱百萬級,但各種原因使得實際上給企業的文本上限不過3萬,限制了AI在廠商業務中的落地情況。
![]()
Manus在2025年嶄露頭角,只因做了任務規劃這一件核心事情,借助大模型的任務規劃能力去精準調用各個工具。但是再好的解決方案,在3萬的Token上限面前,仍是“巧婦難為無米之炊”。
上下文的限制,不僅是企業當下最頭疼的問題,也是導致以決策式AI為代表的小模型盛行,而以生成式AI為代表的大模型產品在B端遇冷的一個重要原因。從這個角度來講,飛書這類協同工具在去年吃到的紅利,或多或少便是給了企業一個大模型難以垂直應用的解決方案。
技術路線再是美好,真正落到現實情況中總會走樣。
“我們用的云服務和模型比較多,各個廠商都會有銷售代表或解決方案代表常駐企業,而且不光是大模型,還有云基礎設施的存儲計算廠商。”一位極兔人士在閑聊中透露出的信息,揭示了混合云與混合模型業態下的眾生相。
從極兔這個案例可以肯定的是,單一的云服務和AI廠商不可能將一家企業包圓。這既有技術、服務能力的考量,也有安全與合規的因素,現實之所以與理想有差異,原因便在于理想的動因只有技術,而現實的動因千萬個。
大廠們真正需要思考的問題是,企業級應用的混合模型趨勢,導致IaaS、PaaS、MaaS層將長期處于異構情況下,如何為企業創造真實價值。
異構的不止是技術,商業世界中從來如此。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關注我們!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.