![]()
撰文:董指導
前段時間,我作為嘉賓和主持人,參加了一場線下閉門會,主題是Agent如何突破大模型的想象力。其他四位嘉賓分別是:
侯宏,北大國發院管理學助理教授,劍橋大學戰略學博士;
姬閣閣,Chat2API創始人,“產品二姐”主理人
梁宇,創世伙伴創投合伙人;
楊勁松,未來式智能創始人。
現場持續了兩個多小時,有許多精彩的觀點碰撞。我整理了可披露的精華信息,分享給大家,希望可以幫助大家對當前Agent發展有一些更清晰的認知。
Q:大家什么時候感覺到Agent在加速了?有沒有感受,或者今年有沒有什么主題詞是比較明確的?
姬閣閣:一個非常深刻的體會就是,模型的能力其實是有階段式上升的。
Agent的需求在這一代里面跟上一代互聯網有一個巨大的不同,在互聯網時代2C其實是走在2B前面的。而這一波企業級的需求,跟2C是齊頭并進的,但是在這個過程當中,因為2B對確定性的要求更高,所以在前期走的很困難。
但大模型,不管是性能上,還是準確性上的,或是對于成本的壓縮上,都有非常明顯的提升,這就是我最大的感受,新的商業模式快要生成。
梁宇:我可能有稍微保守一點的觀點,就Agent這個問題現在還沒有大規模的到來,只是有加速的趨勢。
我覺得有一個比較認同的其實是DeepSeek帶來的,很大程度上改變了B端的預期。
C端這一塊,真正要完成的是:從工具,到邏輯,到分解,到真正幫用戶完成一個閉環。細分領域正在發生,但泛化方面,還有很遠的路要走,
楊勁松:從今年DeepSeek出來之后,一些Agent場景就已經在落地了。從客戶的問詢量有非常明顯的增長。今年可能第一個季度完成了去年80%的收入。客戶對于場景的明確性,也比去年有一些提高。
侯宏:2B需要認知啊,B端客戶容易實施卡殼,因為數據不ready。B端仍處于摸索過程。要想清楚布局Agent有什么競爭力、跟以前投IT有什么樣的區別。
C端我覺得沒有什么驚喜。國內的話,目前還是賠錢賺吆喝,背后的商業模式是什么樣的,從創業者的角度看,這方面還沒有想清楚。
在2B和2C 之間還有一種中間類型,小B大C。已經有一些悶聲開始賺錢的。核心是把行業經驗模式化,模式化能夠實現生產的邊際效益覆蓋邊際成本。
Q:前一段時間看了一篇文章,講到說,現在的大模型的能力其實已經OK了,即使現在大模型的能力不再提高,也有很多應用的路要走。
大家覺得現在大廠也都在去做Agent,大模型原來這套訓練、推理,包括算力這套方式還不是最優級的?
侯宏:模型跟Agent 之間的關系,我覺得,模型即產品這條路有局限或者說有邊界。
把 Agent 的能力內化到模型里面去,這個趨勢是客觀存在的。但是其實從廣大創業者的角度與之對應的思路,應該考慮加入智能體系生態。
模型的能力已經具備,但模型怎么樣和本地的私有數據、以及它內部的工具,甚至內部的IT系統,怎么樣去整合?模型本身永遠只是一個中樞,利用模型去整合更多的工具的時候,一定要知道模型訓練特性什么什么、怎么把工具訓練進去,模型的邊界在哪?那這個邊界有可能出現哪里?
第一是否有一些私有數據;第二在場景里面找到邊界,如果說創業的場景沒有邊界,那就應該止損。如果能用其他的方式建立自己的壁壘,比如有產業資源。要跳出技術思維,從一個整個產業的大格局看自己能卡位什么樣的點好。
姬閣閣:作為一個開發者來講,我覺得我不會去探索增強模型的能力。在Agent開發中,只有能夠給大模型提供完整的、準確的上下文,才能駕馭好這個大模型。
另外一方面,假設沒有產業壁壘是不是就沒有什么優勢呢?我覺得可能也還有一些機會,比如把一些工程性的事情做的足夠精細化。也就是其實臟活累活,但如果積累的足夠深,也能夠成為一些壁壘。
另外,我會私有化部署一個模型,當數據積累到足夠豐富時,通過在線的及時迭代反饋得到的模型,也可能成為壁壘。
侯宏:我提出了一個詞叫“智能飛輪”,三個角是:模型、數據和智能。對于任何一個企業,不管是 ToC 的還是 ToB 的,不管你是甲方還是乙方,其實都要考慮怎么樣把它轉起來,轉的最快,這是唯一可以依賴的競爭優勢。
只做臟活累活是不行的,一定要把這個臟活累活你的經驗能夠沉淀下來。并且不斷成長,這種需要動態的這種競爭優勢。
梁宇:我們在討論大模型、蒸餾小模型以及 Agent 之間的關系時,在焦慮些什么事?無非是擔心自己做的Agent 被巨頭給碾壓了。
但實際上會發現,大模型在不同垂直行業里面去用的時候,玩不轉,原因也包括數據不健全等。所謂的行業 know-how、行業數據、是真正決定能否形成好的商業閉環。所以絕對不是很薄的一層。
對于Agent 從業者而言,可以回看上個時代做無人駕駛那一波。其實有兩撥人,一撥就是搞論文、研究的,另外一撥人是搞傳統產業落地的,最終傳統產業的并沒有被吞亡。
AI也類似。技術是一個好的開始,但絕對不是決定一切的。能決定生死的,依然是客戶、產品、需求、尋找的速度。
楊勁松:一個人類專家去完成特定領域工作時,其實需要兩部分知識。一部分叫顯性知識,就是能夠收集到這些文檔文字沉淀下來的,這類的話其實相對還是容易收集到的。
第二類是隱隱性知識。就像解題思路,在做特定任務的時候,第一步做什么、第二步做什么;第一步找什么工具、第二步怎么樣去加工。這些之前都沒有被很好的文檔記錄下來的。
如果想讓 Agent 能夠在特定領域里面工作,實際上需要這兩份數據的組合。
我們有一個思路就是如何切入行業。如果說行業有一定壁壘,比如牌照、數據壟斷之類,這種情況,可能還是傳統公司自己來做Agent,或者他們會投資一些公司來合作。
另一種情況是有專業性但沒上述壁壘的話,那可以引入行業專家一起開發,完成冷啟動,然后再通過實際使用過程來優化能力。
Q:大家普遍感受到 Agent 在增長,但是還沒有到一個爆發。那是不是因為如果大模型的能力只是在文本,那可能這個Agent 就沒有什么特別實際的用處。也只有當多模態能力發展到比較強的時候,我們的 Agent 的應用可能性才會更多一點,或者說落地的可能性會更多一些?
姬閣閣:我自己有兩個孩子,現在也經常拍照識別昆蟲或者是自然界的一些物體,就在用夸克、豆包這樣的智能體了。
我覺得多模態有兩種,一種就是 midjourney 這種藝術型的。還有一種是對邏輯推理非常清楚的。在一年之前邏輯推理是一個難題,但現在我初中的幾何題奧賽題的范圍內,模型都能給出正確的思路,這就非常了不得。
所以我覺得如果說超級智能體,比如有1億日活的話,那么多模態的生圖能力,必須要到一定的強度。現在也正在慢慢發生中。
梁宇:每一次技術變革,大量的C端是怎么發展起來的呢?其實就是來自于交互方式的改變,從DOS到Windows 再到手機、再然后語音、多模態照片,每一次的輸入都在越來越簡單。只有這樣,才能讓更多人能參與進來。
人的感知、視覺、聽覺、味覺、觸覺,仍有許多觸覺都還沒進來。,虛擬和現實之間能夠真正結合也需要多模態能力。
侯宏:Agent需要感受環境,當用戶可以用圖片形式自定義問題,甚至不需要用語言描繪很清楚,但大模型依然可以理解意圖時,帶來的能力擴張非常顯著。
包括在B端,以前中國中小企業信息化、數字化難。一個原因是沒有專業的軟件人才,小企業主不會用這種復雜的軟件。現在可以用智能體,通過MCP去調用各類軟件,不用人學,生產力會迅速提升。而多模態能力也非常關鍵。
楊勁松:許多做大模型的團隊,有一個假設,就是人類的知識最終都可以通過文字和符號來表達的。如果為了追求終極超級智力的話,可能文字做到極致就可以了。
那為什么還有多模態,其實是外界需要有這樣一個互動,增加對外部世界的理解。未必是模型最佳的方式,但是是人類最適用的方式,價值最大。
Q:Agent應該垂直?還是通用?
另外,瞄準年輕人,是一個非常好的方式,因為從創新產品理論來講的話,年輕人對新鮮事物接受度最高的,生命周期更長。大家怎么看夸克這個產品?
侯宏:對于夸克的建議,最核心的問題是在阿里整個集團的定位,要弄清楚。到底是走平臺化流量這一條線,還是走智能化改造這一條線,邏輯是不一樣的。
通用還是垂直,取決于創業者的基因。如果能夠專注要做的事,并且能夠長期坐冷板凳,還有資金支持,那可以做通用。
而要做垂直,需要有產業資源,要思考能夠以 AI 為核心去整合的資源是什么?壁壘一定是來自于一個系統,而不可能來自于模型,因為模型是公用的。不是說通用和垂直怎么賺錢,而是說在垂直這個賽道下,我能夠怎么做才能夠更賺錢。
楊勁松:首先我覺得討論技術對社會或者對行業影響的時候,大概有三個維度:
第一個層面,由于這種新技術,會不會出現一種新的業態,把目前商業模式顛覆掉?
第二個層面,基于原有業態,整合大模型或者 agent ,有沒有一些新的商業模式或者新玩法。
第三個層,也就是降本增效。對創業者的啟發,有沒有可能一種商業模式誕生,或者在一個特定的場景里,比傳統玩家有十倍提升的效率。并能在價值鏈條里,分最核心的那一塊。
有時候也會用田忌賽馬的方式,跟傳統產業比,發揮技術優勢;跟大廠比,要發揮深入行業的優勢。
姬閣閣:我剛才在思考一個問題,就是一款Agent,什么功能才有用戶愿意付錢享受。
像論文學習這種有一些創造性的活,我自己不太愿意付費,因為我覺得我有創造力。但重復性的勞動,不能給我帶來潛在的價值,就更愿意付費、節省精力來做創造性工作。所以,C端可能就是在用戶不愿意干的活上面,激發用戶的付費意愿。
關于垂直和通用,我自己的經歷是,先從當個功能開始、慢慢增加功能、調用更多工具、解決更多問題。總結就是,慢慢的從垂直走向,二者并不矛盾。
當你的用戶群足夠通用的時候,你給模型什么樣的數據,就會形成什么樣的產品。最后長成通用型的。
粱宇:這里最核心的矛盾是訓練、推理分離的。如果能夠將二者結合,并實現實時改變,那能力就會非常恐怖,會是非常值得期待的技術趨勢之一。
Q:搜索應該算是大部分人比較公認使用習慣。從傳統搜索變成深度搜索。從技術角度,或者產品力角度,怎么看?
楊勁松:其實用戶本身對這個產品的認知,遠不如我們想給他傳遞的那么清晰。不管科技產品還是快銷產品,各種宣傳,其實只是為了讓用戶記住一點點關鍵信息。這就是顯示,也應該成為定位。
傳統搜索出來的結果,頭三條的黃金點擊位置,占到了所有的點擊量的90%~95%之間。第二頁的信息,可能都沒機會展示了。用戶的預期,就在前面幾行。
所以Google 拼了老命要保證信息排序是好的,因為好的排序意味著提供的結果滿足用戶的預期,用戶覺得好用,就還會回來繼續使用。第一要快,第二要準。
用戶其實是焦慮的,不會提問題,不停地更換檢索詞來找到自己想要的答案。從這個角度上來說,基于大模型的理解能力、推理能力、總結能力,能夠給用戶更有價值的信息是非常好的。
而且,用戶搜索的目的,是為了做決策。因此,AI搜索也要能替用戶去高效的、有質量地解決一個決策問題。
商業模式怎么構建可能是問題。畢竟不能再采用傳統廣告植入的模式。但我有信心,但凡有價值,就有機會。
姬閣閣:Deep search 一定是價值的,傳統模式只能看三四個鏈接,但AI可以直接幫我看30個鏈接,擴大了搜索面,也給出更準確的信息,提高效率。
Deep search更像是一個分析師。Deep think更像一個科學家或者哲學家幫助用戶反復去思考。
侯宏:未來的 AI 搜索有兩個價值主張,一是便利,省時間;二是精確信息,并信任它。但目前還是形式邏輯準確,專業性仍不夠。所以未來可能會有垂直搜索。
而且不只是搜索,搜索并不是為了獲取信息,而是為了做決策。沿著這個路徑,AI搜索會有很多有趣的功能和發展。
Q:Agent有先發優勢嗎?應該是在什么因素上積累,才有可能形成一個比較好的優勢?
梁宇:我們講 agent 的時候,不可避免的有個隱含意思,就是很大程度把它當工具。而工具要在C端占據用戶心智,其實并不容易。只要有好的工具,用戶就會切換,粘性不一定足夠。
B端的話,是有先發優勢的。因為B端資源是有限的。客戶不愿意重復建設、重復體驗一些工具。如果能把數據、know-how、場景結合起來,那一定是比較強的壁壘。
楊勁松:有用戶體量能幫助提升產品、然后繼續獲取用戶,這才能形成先發優勢。在通用Agent場景下,先發優勢并不明顯。因為沒辦法用規模用戶,去持續創造更佳的效果。而且,Agent的開發技術門檻相對也不高。
除非能盡早成為新入口,才有先發優勢。普通創業的話,有機會被并購,也是非常不錯的。但形成牢固的先發優勢,而且要能守得住優勢,其實是比較挑戰。
姬閣閣:我想聊下如何構建先發優勢。我自己的體驗就是,如果不是天才,可能就是先從臟活累活做起。然后從第一個客戶開始,形成積累和信任。
侯宏:企業之所以要有戰略,是因為要有競爭優勢,從而獲得超額利潤。如果只做臟活累活,就很難實現超額利潤。
我覺得除了積累信任之外,卡位也很重要。在生態位里找到不容易被替換的位置。另外,也別擔心被大廠競爭淘汰掉。因為這些項目,也培養了團隊能力,可以尋找其他新的機會。
創業者很難找到一個可以做20年的事情,要保持創業思維,也很重要。
Q:在 Agent全面落地的過程中有哪些瓶頸,未來兩年可能會有哪些事件或者是標志性的東西,能夠讓我們確信說Agent在加速了。
姬閣閣:我覺得Agent 在C端領域,最難克服的是原有用戶使用的慣性。這必須要尊重時間規律。雖然我發現很多AI產品已經超越了現有產品的使用體驗,但切換還是有時間的。靜靜等待,時間會證明一切。
在B端,數據的完備是一個重要瓶頸。另一個就是準確性。有多領域只有90%準確率是不夠的。不過這方面應該也會持續提升。在今年10月或者年底,應該會看到更強的推理模型,并且成本會很低。從而加速大模型的落地。
梁宇:最先爆發的,一定是在數據完備性比較強的行業,比如金融。這里的數據完備性是指大量的、已經經過處理好的結構化數據。
C端的話,就是觀察一些對新技術、新科技最敏感的人,在這些小圈子里,會有主流沒有注意到的流行。如果和AI相關,那就會是一個好的爆發點。
楊勁松:在上一代互聯網關于新技術、新產品有個典型描述,要考慮:新體驗-舊體驗-遷移成本。
現在用戶有個困擾,就是不知道AI的結果是否可信。這要靠技術提升來改善。另外,AI如果在企業端大規模使用的話,還要考慮組織結構、文化方面的適應與改變。甚至一些職能要重新設計、組合,這都需要時間、也需要方法論來實施。如果還是傳統模式,那AI價值量可能會打折扣。
侯宏:除了技術、產品之外,還有個維度就是資本入局驅動,加速用戶教育。我現在關注的領域叫智能體互聯網,而不是單個的智能體。這是一個對生態、網絡層面,相互促進的事情。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.