|未經許可不得轉載星標本號獲取最新頂級認知|
![]()
Web3天空之城|城主
最近火熱的達沃斯2026年會中,各路大佬紛紛登場, 而其中很有意思的一場, 是Anthropic領頭方光速的創始合伙人拉維·馬特雷,月之暗面KIMI總裁張予彤以及Reflection AI 聯合創始人等的一場圓桌論壇.
核心嘉賓:
? 拉維·馬特雷 (Ravi Mhatre, Lightspeed 創始合伙人)
? 張予彤 (Moonshot AI 總裁)
? 皮普爾·辛哈 (Bipul Sinha, Rubrik CEO)
? 理查德·索克 (Richard Socher, You.com CEO)
? 雅尼斯·安特諾格魯 (Ioannis Antonoglou, Reflection AI 聯合創始人)
這是一場關于企業生存法則的深入辯論。 傳統的“老牌巨頭”正面臨著前所未有的挑戰:如何不被那些誕生于人工智能時代的初創公司所取代?如何界定什么是真正的“人工智能優先”企業,并揭示軟件、管理范式以及信任機制在未來數年內將經歷的顛覆性重構。
這一場對話的核心不僅在于定義什么是“AI優先”,更在于揭示了衡量商業價值的標尺已經徹底改變。 AI不再是輔助工具,而是對軟件形態、組織架構和信任機制的徹底重構。
![]()
![]()
![]()
![]()
![]()
![]()
核心觀點
? AI優先的實質 :并非簡單的搜索或聊天,而是實現端到端的業務工作流程自動化。
? 軟件的無形化 :人工智能正在“吞噬”軟件,未來用戶將通過自然語言而非復雜的圖形界面(GUI)與工具交互。
? 信任與合規 :這是傳統企業采納AI的最大障礙,需通過可追溯性、基準測試和“LLM監控LLM”的技術手段解決。
? 管理范式轉移 :員工需要從“獨立執行者”轉變為“智能代理管理者”,具備授權與監督的能力。
![]()
1. 重新定義標準:端到端自動化
紅帽CEO 皮普爾·辛哈 在會上嚴厲指出了當前企業的誤區:將AI等同于“高級搜索”或“聊天界面”。他提出了硬性標準:
? 真·AI公司的定義: 必須擁有完全由AI完成的 端到端業務工作流程 ,而不僅僅是人機對話。
? 行動建議: 企業應逐條審查業務線,找出3-5個原本由人工或SaaS完成的流程,并要求實現結果的直接交付。
![]()
2. 第一性原理:無限智能假設
光速創投合伙人 拉維·馬特雷 提出了一個思維實驗: “如果智能是無限獲取且成本趨近于零的,你會如何構建業務?”
他指出,AI原生公司(如Anthropic)的優勢在于不受舊組織束縛。隨著推理成本(Cost per Token)下降100-1000倍,企業不應思考“如何用AI改進軟件”,而應思考“如何用智能直接達成結果”。
在過去的認知中,企業引入一個聊天機器人或搜索增強工具往往被視為數字化轉型的成功。然而,專家們在對話中達成了一項共識:這遠遠不夠。紅帽公司的聯合創始人皮普爾·辛哈指出,判斷一家公司是否真正具備人工智能基因,關鍵在于業務鏈條的完整性。“如果你說你是一家人工智能公司,你必須明確是否擁有完全由人工智能完成的端到端業務工作流程,而不僅僅是使用一個對話界面。”
這意味著,人工智能不再是員工手中的“記事本”,而是能夠獨立交付成果的執行單元。光速創投的拉維·馬特雷則從更激進的角度提出了衡量標準。他認為,真正的“人工智能優先”企業應該從第一性原理出發,思考一個根本性命題:“如果我們能獲得無限的智能,我們會構建什么?這種思維不應受到現有組織結構和陳舊工作流程的束縛。”
這種轉型不僅是技術性的,更是運營杠桿的巨大釋放。月之暗面總裁張予彤分享了一個引人深思的觀察:在當下的初創生態中,出現了一批人數極少、估值極高的公司。“有些公司的人員不到十個,但在運營層面卻有數百個智能體在協助處理事務。人工智能為所有企業提供了極高的運營杠桿。”
主持人引用的A.T. Kearney定義(50%任務提升20%效率)僅是入門標準。結合皮普爾和拉維的觀點,企業正經歷以下階段:
? 工具化階段: 局部插件集成(效率提升)。
? 原生化階段: 業務邏輯重構(模式變革)。
行業數據顯示,只有當AI不再是“副駕駛(Copilot)”而是“自動駕駛(Autopilot)”時,邊際成本的指數級下降才會體現在財報上。
![]()
1. 智能的規模化效應
拉維·馬特雷 強調,資本正在流向那些能利用“無限智能”產生質變的公司。他舉例提到了一款“四元代碼(Quad code)/氛圍編碼”類產品(編者注:此處可能指代具體的AI編程工具),在推出僅8個月內就實現了15億美元的年收入,擁有1500萬開發者用戶。這證明了智能本身即產品。
2. 開源與閉源的博弈
雅尼斯·安特諾格魯 代表開源力量發聲。他認為,AI優先不僅是技術問題,更是信任問題。開源模型提供了企業急需的“白盒化”能力,使企業能結合自身數據進行深度定制,這是建立長期信任的關鍵。
盡管嘉賓在現場未列舉具體估值表,但市場數據顯示,資本對AI基礎設施的定價已脫離傳統SaaS邏輯:
? Anthropic (Lightspeed領投): 估值區間躍升至183億-350億美元,其增長動力來自模型能力的“縮放定律”(Scaling Laws)。
? Reflection AI: 作為開源挑戰者,其80億美元的估值反映了市場對“技術主權”的渴求——企業希望擁有自己的模型,而非僅僅租賃API。
? 結論: 投資人不再為“應用腳手架”(套殼APP)買單,而是重注那些能將智能轉化為直接生產力的底層架構。
![]()
1. 極高的人機杠桿
張予彤 (Moonshot AI) 分享了一個極具洞察力的觀察:
? 現狀: 許多AI原生初創公司全職員工不足10人。
? 變革: 這些小團隊在運營層面卻有數百個智能體(Agents)在協助處理事務。
? 結論: AI為企業提供了前所未有的運營杠桿,改變了傳統的“規模=人頭數”的公式。
![]()
2. 全員管理者化
理查德·索克 (You.com) 指出了轉型的痛點:
? 智能體數量 > 員工數量: 這在他的公司已成現實。
? 人的瓶頸: 大多數員工習慣做“執行者”,缺乏“授權”心態。未來的挑戰在于培訓員工成為“智能體管理者”,學會定義輸入和驗收輸出,而非親自干活。
傳統的“數字化轉型”往往被簡化為引入聊天機器人,但這在專家眼中已過時。真正的變革在于運營杠桿(Operational Leverage)的極限釋放。
? 重新定義“AI優先”: 紅帽公司(Rubrik)聯合創始人皮普爾·辛哈(Bipul Sinha)提出了硬性標準: “如果你說你是一家人工智能公司,你必須明確是否擁有完全由人工智能完成的端到端業務工作流程,而不僅僅是使用一個對話界面。”
? 極致的人機比率: 張予彤揭示了一個震撼的行業現狀: “有些公司的人員不到十個,但在運營層面卻有數百個智能體(Agents)在協助處理事務。”
這解釋了為何像Reflection AI(由同臺嘉賓Ioannis聯合創立)這樣的公司能獲得高達80億美元的估值。資本市場不再為傳統的SaaS收入倍數買單,而是為極高的人均產出買單。企業的核心競爭力從“擴招團隊的能力”轉變為人機比——即用最少的人,編排最龐大的智能體網絡。
? 光速創投的“第一性原理”: 拉維·馬特雷(Ravi Mhatre)激進地指出,真正的AI優先企業必須思考: “如果我們能獲得無限的智能(Unlimited Intelligence),我們會構建什么?” 這種思維要求企業徹底拋棄現有的組織結構束縛,假設智能成本趨近于零,從而重構商業模式。
當智能體(Agents)的數量超過員工人數時,企業的管理邏輯將發生翻天覆地的變化。優網聯合創始人理查德·索克指出,目前大多數基層員工尚未做好心理準備,因為他們習慣于做一名“獨立貢獻者”。“未來的挑戰在于人的方面。我們中的每個人都將不得不成為管理者,無論你是管理人類,還是管理你的人工智能代理。”
這種“管理與授權”的心態并非與生俱來,需要企業進行系統的培訓和認證。在這種新型的組織架構中,“人在回路中”將成為核心準則。 雅尼斯·安特諾格魯強調,人工智能的存在是為了最大限度地利用人力資源,將人類勞動投入到最具創造性和必要的地方。
未來的企業管理將進入一個“多智能體編排”的階段。在這個階段,管理者的職責是定義“好”的標準,并編排這些智能體去協同工作。正如張予彤所預測的,未來的人工智能將擁有長達一周甚至更久的獨立執行期。“我們設定目標并討論任務,然后團隊和智能體會自主工作,一周后再見面查看結果。” 這種長效代理能力,將徹底改變職場的時間維度和協作效率。
基于張予彤的觀察,可以有一個人機配比(HAR)公式:
行業案例佐證了這一趨勢:麥肯錫(McKinsey)等咨詢巨頭已部署數萬個智能體。未來的組織將呈現“倒金字塔”結構——極少數人類核心決策者,指揮龐大的智能體軍團。這要求HR部門重新定義崗位描述:核心技能不再是“熟練使用Excel”,而是“熟練編排Agent工作流”。
軟件的“無形化”與交互革命
![]()
1. 關于GUI的消亡
拉維·馬特雷 和張予彤達成了高度共識:軟件正在變得“無形”。
? 張予彤觀點: 用戶不再需要點擊按鈕或記憶公式。未來的交互是基于 自然語言的意圖表達 。AI將作為中介,直接調用軟件功能或編寫個性化工具來交付結果。
? 拉維觀點: 智能本身將成為軟件。隨著能力提升,人們通過“氛圍/直覺”來表達需求,AI生成代碼并執行,傳統軟件界面將成為多余的中間層。
如果說過去幾十年是圖形用戶界面(GUI)的時代,那么未來將是軟件“隱身”的時代。對話揭示了一個大膽的預言:軟件正在被人工智能吞噬。張予彤認為,人類未來將不再需要記住復雜的公式或點擊數百個按鈕來操作辦公軟件。“軟件將變得無形。只要人們能夠描述他們的意圖,人工智能就能幫助他們獲取現有軟件的所有功能,甚至直接編寫出個性化的工具。”
? “無形化”預言: 張予彤認為,人類未來將不再需要記住復雜的公式或點擊數百個按鈕。 “軟件將變得無形。只要人們能夠描述他們的意圖,人工智能就能幫助他們獲取現有軟件的所有功能,甚至直接編寫出個性化的工具。”
現有的SaaS巨頭(如Salesforce, Workday)如果不能轉型為被AI調用的后端API,其復雜的界面價值將歸零。
? 拉維·馬特雷的“氛圍編碼”(Vibe Coding): 隨著推理成本下降100-1000倍,智能成為一種持續流動的力量。拉維指出,即使不懂代碼的人,憑直覺(Vibe)就能讓AI生成生產級代碼。 “智能將成為人們表達自動化任務意圖的新型‘語言’,傳統意義上的軟件應用場景將大面積消失。”
在這種范式下,用戶體驗的重心將從“如何使用工具”轉移到“如何表達意圖”。雖然像一些社交媒體平臺這樣高度依賴網絡效應和美學設計的應用短期內難以被完全取代,但在企業環境中,“氛圍編碼”和自動化執行將成為主流,手動處理復雜權限和報表的時代即將終結。
中國視角:用戶驅動的“自下而上”變革
![]()
1. “自帶AI上班” (BYO-AI)
在采用AI的態度上,對話展現了中美兩種截然不同的路徑,同時也指出了共同的瓶頸。
? “BYO-AI” (Bring Your Own AI): 與美國企業受困于自上而下的合規審查不同,張予彤觀察到中國市場呈現出 自下而上 的野蠻生長——員工甚至愿意 自掏腰包 將高效的AI工具帶入職場。這是一種更務實、更具侵略性的采用方式。 這揭示了中國市場與美國截然不同的擦用路徑
? 關于 信任機制: 建立信任的關鍵在于 可追溯性(Traceability) 。AI不能是黑盒,必須展示引用來源和推理步驟,讓用戶看到“思考過程”,這是Moonshot產品的核心設計哲學。
? 美國企業的合規恐懼: 皮普爾·辛哈指出,美國企業的首席風險官(CRO)往往因為擔心“幻覺”和安全漏洞叫停項目。
? 資本視角的解法: 拉維·馬特雷(作為Anthropic的投資人)強調, 信任是傳統企業(Incumbents)唯一的入場券 。如果沒有內嵌的安全性,大企業無法與無包袱的初創公司競爭。
? 技術治理技術: 專家們達成共識,解法在于用 大模型監督大模型 。
? 皮普爾建議: 訓練專門的判斷模型,讓神經驅動規則,而非依賴僵硬的合規文檔。
![]()
作為行業背景,中國AI的競爭力還植根于其工程化土壤:
? 工程效率: 業界數據顯示,像Kimi這樣的中國模型團隊,擅長以更低的算力成本實現極高的長文本處理性能。這種“為應用而優化”的工程思維,是中國企業在算力受限背景下的突圍之道。
? 基礎設施優勢: 中國龐大的電力基礎設施(2025年新增發電容量巨大,且可再生能源占比高)為未來大規模AI推理中心提供了能源保障。
? 場景練兵: 相比美國,中國在C端應用(如電商、社交)和物理世界自動化(如Robotaxi)上的激進嘗試,為AI提供了更豐富的反饋閉環。
![]()
1. 以AI治理AI
針對合規難題,皮普爾·辛哈 提出了技術解法:
? 神經驅動規則: 不要試圖用僵硬的文檔去約束AI。企業應訓練一個 判斷模型 ,將業務規則內化為模型的判斷力,用一個模型去審計另一個模型的輸出。
![]()
2. 遞歸自我改進
理查德·索克 描繪了終極愿景:
? 自動化研究員: 過去需要數百人調整的知識系統,現在是神經網絡。未來,構建模型的過程本身也將自動化。
? 長效代理: 張予彤 補充道,AI將具備像人類一樣的“長代理期”。管理者周一布置任務,AI獨立工作一周,周五交付。
對于擁有龐大資產的老牌企業而言,擁抱人工智能的最大阻礙并非技術實力,而是對安全和合規的深層恐懼。皮普爾·辛哈觀察到,許多企業在試點階段非常順利,但一旦進入生產環節,首席風險官和首席安全官就會因為擔心“幻覺”和安全漏洞而叫停。
為了解決這一痛點,技術專家們提出了一套“以技術治理技術”的方案。皮普爾建議,企業不應依賴固定的規則集,而應訓練專門的判斷模型。“你可以用一個大語言模型來判斷另一個大語言模型的工作表現,讓神經驅動規則,從而在不犧牲靈活性的前提下提高合規信心。”
圓桌嘉賓的預測指向了AI發展的奇點——遞歸式自我改進(RSI)。
? 當“大模型監控大模型”解決了信任問題,且“AI構建AI”解決了能力迭代問題時,企業的迭代速度將不再受限于人類的學習曲線。2026年的企業競爭,本質上是 誰能更快建立起這套自我進化系統 的競爭。
在對話的尾聲,專家們做出了前瞻。其中最具震撼力的觀點是:人工智能將從“人類手動構建”轉向“自我遞歸改進”。理查德·索克回顧了歷史,指出曾經需要八百人手動構建的系統,現在已被單一的神經網絡取代。
“目前構建模型的系統依然是手動完成的,需要專家耗費數月去調試直覺。但這部分工作本身也將實現自動化,產生遞歸式的自我改進。” 這意味著,未來的模型將不再依賴于人類工程師的緩慢迭代,而是通過持續學習和環境交互,實現核心知識的自主更新。
![]()
從長效智能體的普及到強化學習在企業流程中的深度融合,這場對話描繪了一個即將到來的未來:在這個未來里,人工智能不再是一個選項,而是一切業務的操作系統。 對于所有企業而言,轉型的窗口期正在迅速關閉,唯有那些敢于從第一性原理出發、重塑信任機制并擁抱“智能體編排”的組織,才能在人工智能吞噬軟件的浪潮中幸存。
AI發展的下一個躍遷點將是決定企業生死的關鍵。
? “長效代理期”(Long Agency): 張予彤分享了工作流時間維度的質變。目前的Agent只能執行幾秒鐘的任務,但未來將是: “周一設定目標,團隊和智能體自主工作,周五驗收結果。” 這種長達一周的獨立執行能力,將徹底改變企業的運轉節奏。
? 理查德·索克的“遞歸自我改進”: 歷史上需要800人團隊維護的系統(如IBM Watson),現在已被神經網絡取代。未來, 構建AI的過程本身也將自動化 。
? 核心觀點: “目前構建模型的系統依然是手動完成的,但這部分工作將實現自動化。” 這意味著AI將能夠自我迭代,創造出比人類工程師設計得更優秀的版本。
這場圓桌會議劃定了一條清晰的分野:
? 老牌企業 正在努力建立 AI審計AI 的機制,試圖在合規的籠子里養大AI這只猛獸,以避免被淘汰。
? AI原生企業 則在追求極致的 人機比 和 長效代理 ,利用無限智能的杠桿,在軟件無形化的浪潮中重塑商業世界。
結合嘉賓們的發言, 以下行動路線呼之欲出:
1. 重構指標: 停止關注AI工具的使用率,開始關注 端到端流程的自動化率 和 人機配比(HAR) 。
2. 重塑員工: 將員工從“操作員”培訓為 智能體審計員 。
3. 技術治理: 建立 模型監督模型 的合規閉環,而非依賴人工審核。
4. 思維轉換: 采納 無限智能 假設,重新設計那些因為“人太貴”而從未存在過的業務模式。
正如拉維·馬特雷所言,那些敢于在沒有既有軟件概念下重新想象業務的公司,將是這場范式轉移的最終贏家。
附:天空之城全文整理 什么是真正的“人工智能優先”企業?
主持人: 大家好,無論是來到達沃斯的現場嘉賓,還是在線上加入我們的朋友們。我是阿克西斯(Axios)的首席技術記者伊娜弗里德(Inafried),今天我們來談論一個我們這些天都在討論的話題,那就是人工智能(AI)。尤其是在達沃斯,關于企業如何最好地利用人工智能、企業在哪里遇到瓶頸,一直是舞臺上以及穿梭巴士上大家交談的焦點。
我們都在努力弄清楚這一點,所以我非常高興能和一群非常尊貴的專家一起討論。在本次會議中,我們將深入探討另一種緊張關系,即大型企業、力求適應人工智能的現有企業,與應運而生、從一開始就以人工智能為先導的新公司之間的區別。那么,老牌企業能否轉變為人工智能優先型企業呢?
因此,我很高興能與這個精彩的專家小組會面。我先拋出一些數據:2024年,私營部門在人工智能方面的投資超過了2500億美元。我們仍然需要——這些人一直在開出更多的支票、兌現更多的支票——但只有百分之一的大型企業認為自己在人工智能方面真正成熟了。為了讓大家達成共識,我將拋出一個別人給我的定義:如果一個企業超過一半的勞動力任務實現了至少20%的性能提升,我們就可以認為該企業是人工智能優先型企業。
我認為在我們的討論中,我們可能需要使用一些不同的指標,但我先提出這個定義。我想指出,世界經濟論壇的人工智能全球聯盟與科爾尼公司(A.T. Kearney)啟動了一個新的工作流程,專門研究這一問題,涵蓋了50多家創新領導者。我確信你們可以在網上找到更多關于這方面的信息。
所以我我要介紹一下小組成員,但這不一定就是他們的座位順序。 我們有Moonshot AI的總裁張予彤。我們有Reflection AI的聯合創始人兼總裁雅尼斯·安特諾格魯(Ioannis Antonoglou)。拉維·馬特雷(Ravi Mhatre),他是光速創投(Lightspeed Venture Partners)的創始人和合伙人,皮普爾·辛哈(Bipul Sinha)是紅帽(Rubrik)的聯合創始人和首席執行官,以及理查德·索克(Richard Socher),優網(You.com)的聯合創始人和首席執行官。所以我們有一個很棒的團隊,我再次感謝我們擁有如此多不同的觀點。
我想問在座的各位,我提出了一個關于什么是“人工智能優先”型公司的定義,但你們都在現實世界中看到了這一點。你們能否談談那些你們認為屬于“人工智能優先”但并非在ChatGPT出現之后誕生的公司?有哪些公司,因為它們實現轉型的方式,仍然符合“人工智能優先”的定義?
皮普爾·辛哈: 我可以先說。在我們看來,如果你說你是一家人工智能公司,你必須真正明確,你是否擁有完全由人工智能完成的端到端業務工作流程,而不是僅僅進行信息搜索或使用ChatGPT界面?
因此,我們在細則中正在做的是逐條業務線進行,要求每個人確定三到五個通過人工或SaaS應用與人工相結合的方式完成的工作流程,并詢問我們是否可以定義端到端的AI驅動成果。所以我的定義是,如果你在所有業務線中都實現了三到五個由人工智能驅動的工作流程,那么你就是一個名副其實的AI驅動型公司。
主持人: 還有其他人想提出一個不同的定義或觀點嗎?理查德?
理查德·索克: 我認為你必須考慮兩方面。技術方面,你有多少智能體等等,但也要考慮人的方面。你的員工中有多少人真正獲得了認證并了解相關知識?
比如我們在U.com發現的一件事是,當我們只是說,給你,用它來創建你自己的智能體時,你可以委托你所有的工作。人們會說,但我真的不知道如何委托工作。大多數獨立貢獻者都不是管理者。然后采用率會非常低,直到我們說,好了,我們有一個培訓計劃和一個認證計劃,然后當人們真的必須去做的時候,你才會看到這些老牌組織真的開始采納并擁抱它,因為我們中的每個人都將不得不成為管理者,無論他們是管理人員還是管理他們的人工智能代理,但這種管理和授權的心態對大多數人來說并不是自然而然形成的。
想象力與組織束縛
主持人: 還有拉維,你看到了大量的公司。你是否看到任何不是在過去一兩年內成立的公司,你會說它們真正抓住了人工智能,以至于你可以稱它們為人工智能優先的公司?
拉維·馬特雷: 我會說,有趣的是,世界經濟論壇的定義是對整個組織能力集中的某種百分比改進的平均效應,我認為現實情況是,這可能沒有釋放人工智能的全部潛力。
而且我認為,我們再次在原生于人工智能的公司中看到了這一點,比如我們密切合作的Anthropic公司,如果你看看他們利用人工智能做一些變革性事情的能力,我認為那些奉行“人工智能優先”的公司的想象力思維是,他們從“如果我們能獲得無限的智能,我們會構建什么”開始思考,而且他們顯然沒有受到組織結構和現有工作流程的束縛。
我會說,對于那些必須努力真正實現“人工智能優先”的傳統公司來說,挑戰在于他們大多關注的是“我們如何利用現有的技術做什么?”而且他們也在平衡一個事實,那就是他們的組織有其自身的工作方式。我認為真正能取得突破的只是少數幾家。
今天,我們并沒有完全不受限制地獲取智能,但人工智能仍在不斷改進。有些人確實期望人工智能的能力將繼續呈指數級改進。因此,傳統公司也需要以同樣的方式思考,更具變革性。如果我能無限地獲取智能,我會如何以一種我今天沒有既有概念的方式來經營我的業務呢?
訣竅在于,如果你應用了那個框架,它的表面區域會非常不均勻。在編碼方面,你真的,使用僅在八個月前推出的四元代碼(quad code),它已經是年收入15億美元的產品,而且擁有近1500萬開發人員。但你會遇到一些問題,在這些問題中,人工智能確實可以完成絕大部分工作,并準備好交付生產級別的代碼,這在24個月前是聞所未聞的。
所以你可能會在那里取得真正的成功,但你可能不會讓人工智能去做你業務中其他高度管制的方面的工作,比如嘗試創建財務報表。但關鍵是,那些真正培養出這種思維模式的公司——我認為這來自于那些有遠見的管理層、首席執行官或創始人驅動業務的公司——對一個組織來說,進行這種改變是非常困難的,你會得到參差不齊的結果。但我認為現在正在進行這種思維轉變的公司,將是在人工智能原生世界中真正有機會生存和發展的公司。
中國視角與高運營杠桿
主持人: 聽起來不錯。而且予彤,要求你代表一個國家,特別是像中國這樣一個大國,這是非常不公平的。但請幫助我們理解,在中國,這些自人工智能模型問世以來誕生的初創公司,與一些老牌公司、一些科技巨頭之間,相互作用是如何發展的。你看到了什么?
張予彤: 我認為對于組織而言,一種方法就像拉維所說的那樣,是自上而下的,管理層需要具備人工智能原生思維。但我們看到的另一個有趣的視角是“攜帶你自己的AI去工作”。
所以我們實際上有一個面向消費者的應用程序,在全球擁有數以千萬計的用戶。我們實際上觀察到,我們對用戶進行了研究和訪談。很多人在工作中使用人工智能,并且他們愿意自掏腰包付費。所以我想意味著人工智能可以真正提高我們今天所做的許多工作的生產力。我認為那將非常有趣。
但從組織層面來看,我認為有幾件事情可能很有趣。我想其中之一是人與智能體(Agent)的比例。現在的公司,所有的初創公司都非常非常小。我們有大約300人,但我們正在構建模型,構建應用程序。我們看到有些公司,如果他們純粹只是構建人工智能應用程序,他們的人員不到10個,但他們在運營層面有數百個智能體(agents)幫助他們處理很多事情。所以我認為現在人工智能為所有公司提供了非常高的運營杠桿。
競爭的新維度:從資產到合規
主持人: 我的確認為,這是我在達沃斯開始聽到并將貫穿全年的討論之一,那就是競爭不再是你和你的現有競爭對手——如果你是一個現有的初創公司或現有公司——而是你對抗一個從零開始、沒有任何工作流程、沒有任何遺留流程的公司,后者會說“我能做到這一點”。
當然,既得利益者(現有公司)也不是帶著毫無資產的狀態來應對的,我不認為是這樣,但是……你能談談嗎?無論誰想先說都可以,但我很好奇……顯然,任何超過一個人的公司都有人與人之間的工作流程。你如何將此轉化為一種資產?你如何在組織內部使用人工智能,同時仍然認識到必須由人類來吸收這種變化?我很好奇,是否有人能舉出自己公司的例子,說明你們是如何利用人工智能的,同時認識到這一事實的。我不認為這里任何一家公司的智能體數量多于員工,或者至少不是員工數量少于智能體。
皮普爾·辛哈: 類似人工智能采用的難點在于,我們聽說了“將你自己的AI帶到工作場所”的做法,但尤其是在美國公司,合規性和治理實際上限制了你可以向你想帶到工作中的AI輸入多少數據。因此,我們所做的就是創建了一個合規性基礎設施,說明這是一組允許引入的數據集和一組經過認證的模型進行交互。
然后在此基礎上,我們實際上正在應用于編碼、法律、營銷、客戶支持。因此,每個職能都在該類別內運行。我們在客戶群中看到的總體最大困難是,他們進行了大量的試點項目并且喜歡這些試點項目的結果,但要從試點轉向生產,他們最大的擔憂是合規風險。然后首席風險官、首席安全官會介入并詢問:我如何確保這些代理在它們的護欄之內?它們是否在產生幻覺?它們是否被國家行為者威脅所侵入?
主持人: 而且我認為,這正是那些可能因遺留系統而步伐放緩但已經了解這些情況的老牌公司,與那些通過快速編碼做出了驚人演示 but 突然想進入一個必須滿足合規性的行業的單人初創公司之間產生張力的地方。那么反面就是,對于那些由人工智能原生驅動的公司來說,它們可能只有八個人,但卻有800個代理,卻必須遵守一套規則和法律,這些公司面臨著哪些挑戰。
理查德·索克: 我們的代理數量絕對比你公司(you.com)內部的人還要多。我認為,對于那些希望擁抱人工智能的公司來說,最大的挑戰之一是他們通常還沒有形成基準測試或評估集的思維定勢。我認為這是一個巨大的鴻溝。
如果你的公司能夠確定什么是輸入,以及你將什么歸類為正確的輸出,并創建了一個集合,而不僅僅是,“我試過了,我試了這三件事它奏效了,或者我試了這四件事它沒奏效,所以我不想要用那個工具”。你必須把它變成一個有原則的、更具科學性的流程。如果你有那個基準測試,我們喜歡與那些公司合作,因為那時我們就能贏,因為我們擁有最好的模型、答案、準確性,還有引用等等。但是,那里絕大多數的公司還沒有考慮過如何對他們的人工智能模型和代理進行基準測試和創建科學的評估方法。
重塑工作流:第一性原理與信任
主持人: 珍妮絲,就你而言,你顯然是一家人工智能原生公司,因為你是為了這項使命而誕生、為這項使命而存在的,但同時也存在了足夠長的時間,我猜想也有一些人在其中參與其中。談談您如何看待您自己公司以及您的客戶群,即這將是擁有大量員工的傳統公司與那些白手起家的初創公司相結合的局面。
雅尼斯·安特諾格魯: 也許我先從頭開始說起,回到我們之前關于在我看來什么是“人工智能優先”的對話。而“人工智能優先”的理念就是審視你現有的工作流程以及你已經完成的事情,然后從第一性原理出發重新思考它們,要知道人工智能是存在的,并且會變得越來越好。
當然,新的工作流程中會有“人在回路中”(human in the loop),不會僅僅是人工智能。你需要非常謹慎地設計和構建系統,這樣你就能最大限度地利用你的員工,并確保人力勞動實際上被用在了必要和最高效的地方。所以,至少在接下來的幾年內,在可預見的未來,我沒有看到人類完全退出這個領域的世界。我認為這將是人類和人工智能緊密合作的結合,以提高生產力并確保一切就位。
所以,不,現在從傳統行業的角度來看,我認為他們對他們需要解決的問題以及他們需要解決的挑戰,尤其是在合規性、客戶和行業方面,擁有大量的專業知識,但他們并不完全理解人工智能。這就是為什么與擁有深度人工智能理解以及人工智能能力的像人工智能公司這樣的其他公司合作非常重要。以便能夠產生這種協同效應,也就是將行業經驗和人工智能經驗結合起來,共同合作,以重新思考和重新設計工作流程,使其適應人工智能時代。
主持人: 拉維(Ravi),你顯然在投資公司。我很好奇,從一個初創公司首席執行官那里,你會如何看待他們對人工智能的依賴程度與對人員的依賴程度之間的比例?你希望聽到什么?
拉維·馬特雷: 如果我能回到一件事,我真的很想知道雅努斯(Janus)的看法,但人們提到了這一點,那就是今天,大型企業的商業領袖,他們并不是人工智能優先的公司。他們確實如此,即使他們試圖想象獲取無限智能可以為他們的業務帶來怎樣的變革,但這種對信任和安全的需要,已經演變成一種合規性思維模式,這實際上減緩了人工智能在他們業務中的采用和使用。
我們需要的實際上,我相信,是一套技術和一個允許人工智能安全可信的思維模式。因為信任,如果人工智能中嵌入了基于信任的技術,那么我認為這些更傳統的企業和商業領袖就可以采取積極參與的態度,他們會說,當我的規模擴大時,我知道安全性會內在其中。因此,我就可以快速行動,而不是考慮當我引入這項新技術時,我該如何放慢速度或我為什么應該更保守?
我只是好奇,我認為,你暗示了目前是評估以及傳統企業的商業領袖,他們在公司內部沒有能力或專業知識來制定復雜的評估。因此,我們認為,至少在以民主為基礎的人工智能社會中,采用的關鍵加速器之一,必須是將基于信任的技術在模型內部或與模型并行的位置進行產品化。我只是,約尼斯實際上正在構建前沿級別的開源推理模型。這些公司總部位于美國,但您如何看待基于信任的技術,當這些系統擴散到世界和商業中時,這將允許它們以一種良性的方式被使用?
雅尼斯·安特諾格魯: 這確實是一個很好的問題,因為我認為這是人工智能采用中的一個主要障礙,比如,你如何建立信任,以及你如何確保你所認為的人工智能正在做的事情,就是它實際正在做的事情。實際上,這歸結為擁有更好的技術。
就像2022年ChatGPT剛出現時,我認為當時所有的錯誤信息泛濫,每個人都對他們在ChatGPT上看到的任何內容持非常懷疑的態度,他們會去核實一下,而且在大多數情況下,它實際上是錯誤的。但是,現在,在大多數情況下,當你只是在ChatGPT上閱讀一些內容時,你會相信它。你會覺得,它可能是對的,因為你實際上已經核實了好幾次了。
隨著時間的推移,它實際上贏得了你的信任。你一次又一次地看到了它的正確性。隨著時間的推移,你實際上與人工智能建立起了這種信任。我認為人工智能不是一個短期內就能解決的問題,而是我們在不久的將來會在不同方面吸引大量關注的東西。然后我們會像這樣,開始與像人工智能系統這樣的事物發展信任關系。我們就會像這樣,開始信任它們。或者即使在計算機剛出現的時候,人們也不信任它們,但現在每個人都相信計算機就像會做你告訴它們要做的事情一樣。
技術基礎設施與可追溯性
主持人: 所以我只是想問你,在中國,情況是否有所不同?或者對于企業使用人工智能而言,這是一種相當相似的信任觀念和對信任的需求嗎?
張予彤: 我認為信任實際上可以通過技術來促成,而信任也是用戶的感知。當我們第一次推出這個應用程序時,我們連接了搜索工具,而且,我們展示了所有的引文、所有的參考資料,就是人工智能從網絡、從文件獲取信息的具體句子。這種互動層面實際上有助于人們對技術產生更多的信任感。
而且,我認為,某種程度上的可追溯性是另一個因素。以前人工智能就像一個黑匣子,它們給你一個復雜計算得出的數字,你不知道這個數字是從哪里來的。但現在通過所有的推理步驟,我們可以看到人工智能如何使用工具、收集信息,最終綜合出答案的整個軌跡。
所以我覺得這絕對非常重要。人工智能不能只是提供直接的答案,它必須把所有的思考過程、所有的工具、所有的數據來源都拆解開來。所以我想在那方面需要構建大量的基礎設施,讓人們覺得,好的,他們可以信任這項技術,不僅是執行,還包括很多關于如何運營業務的決策。或者,他們真的可以讓大型語言模型(LRM)來決定很多事情。如果人們能夠定義“好”的標準是什么,匯集所有專家的意見,作為評估標準,然后我們就可以真正構建一個由大型語言模型(LOM)驅動的可擴展決策系統。
主持人: 人們,我很好奇,像你,以及其他人可能對此有何想法,在其他人發言后請隨時加入,但是,你正在建立一家企業,以幫助其他公司,為這個人工智能世界進行構建。我今天很好奇,而且我預想這會發生變化,你們在多大程度上考慮幫助大型成熟企業,以及你們有多少想法轉向,我如何確保我能成為那一代幾家初創公司的好伙伴?今天的精力集中在哪里,你對后者考慮了多少?
皮普爾·辛哈: 對于更大的公司而言,我們正在討論的問題是信任,這也是我們關注的重點。我們正在幫助他們采用一種生成式工作流程。我們理解的是,許多這些組織都有文檔,其中說明了哪些是允許做的,哪些是不允許做的。但他們很難將這些轉化為一套能讓您的智能體和模型執行的規則,因為它們是概率系統,而這些規則是固定的。
因此,我們正在與客戶合作的是,我們能否采用這套規則,訓練一個模型,使其成為您智能體工作的判斷模型?這樣您就可以用另一個基于您自己規則集的LLM來判斷一個LLM,這與您剛才描述的類似。因此,您不必創建規則。讓神經驅動規則。這樣LLM就可以判斷LLM,然后您對這些結果的準確性更有信心。
所以,這些是我們的客戶希望發展的方向。他們不想從事將他們的業務規則轉化為阻止代理的業務。他們希望賦能代理,但他們希望以一種讓他們擁有更高信心的方式來賦能代理。在幻覺率、第三方網絡攻擊和攻擊面方面更大。所以這些就是我們正在解決的問題。
人工智能吞噬軟件:未來的無形化趨勢
主持人: 所以聽起來你仍然將你的業務視為幫助大公司采用人工智能。我很好奇,也許理查德,你對這需要如何隨著時間的推移而轉變,以便初創公司也在思考,我如何幫助這些新一代公司?因為我猜想,當我們一兩年后坐在這里時,這個小組中的某個人將運營一家估值達到十億美元或更高的公司,盡管如今這似乎不算什么。那是一家種子前初創公司。但是,只有少數幾個人擁有的、具有相當可觀估值的公司,他們將是你們的一些客戶。理查德,你對此有何看法?
理查德·索克: 總的來說,當然,每個人都喜歡規模,大客戶可以帶來規模,但大客戶的采購流程也長得多,而對于一家小型初創公司來說,處理這些事情很困難。所以這是一種權衡。你擁有的初創公司越小,你的發展速度就越快。然后你可以希望其中一些初創公司能夠真正實現規模化并持續增長。
然后說到信任,這對我們來說確實非常重要。事實上,在 2022 年,我們申請了專利,并交付了搜索引擎與大型語言模型(LM)的首次連接,這樣你實際上就有了引用。我認為引用現在顯然已經無處不在了,它們是隨著時間的推移建立信任的一種方式。這又回到了授權能力,做好授權的一部分是知道何時信任,何時需要“信任但要驗證”,然后隨著時間的推移來建立這種能力。
主持人: 但總的來說,我的直覺是,20 年后最大的公司將是那些現在起步并且是人工智能原生的公司。Yutong,你一開始提到,你們的一些客戶實際上是個人,他們引入你的聊天機器人來幫助他們更好地完成工作,無論他們的雇主是否是人工智能優先型。你如何看待當今聊天機器人的客戶是誰,以及未來客戶的構成?
張予彤: 是的。所以我認為一個非常重要的變化是,我沒有看到軟件會消失,但我認為軟件將變得無形。所以我想現在的情況是,如果我們想創建一個Word文檔,或者我們需要記住所有用于Excel的公式,或者,創建一個非常漂亮、易于展示的PowerPoint幻燈片,人們直接使用圖形用戶界面(GUI),點擊數百個按鈕,記住所有的公式。
但我認為在未來,人類肯定將只使用自然語言,通過智能代理來獲取所有工具和所有軟件的所有能力。我認為人工智能可以幫助我們使用、訪問所有軟件。我認為這就是它將如何改變許多公司的工作方式。人們可以利用人工智能作為一種超能力來幫助他們的工作。
主持人: 有人本周說,我很抱歉,我在盜用別人的智慧,但最近有一個著名的說法,即軟件正在吞噬世界,而人工智能正在吞噬軟件。這是你的看法嗎?
張予彤: 我只是認為這更像是用戶界面和用戶體驗的轉變,因為我們依賴于大量的點擊和按鍵對于先前的交互,但我認為未來的交互將更加自然,只要人們能夠描述他們的意圖,他們就知道如何使用人工智能,然后人工智能可以幫助他們獲取現有軟件提供的所有功能,如果沒有現有的軟件,人工智能可以利用其編碼能力來編寫個性化的工具或軟件來幫助交付最終結果。我認為這絕對是不同之處所在。
拉維·馬特雷: 我百分之百同意你的看法,湯。這部分與一個事實相關,即人們沒有意識到人工智能或智能能力的提升確實是呈指數級曲線的。在去年,平均而言,推理的每令牌成本平均下降了100倍。在許多用例中,下降了1000倍。因此,當這種情況發生時,僅僅是智能就能夠基本上使軟件變得可消耗。
即它可以像在四海岸案例中那樣,以魯棒性的方式進行“氛圍編碼”(vibe-coded),并且它大部分時間都是生產就緒的。僅僅是,有人可以想象任何你想通過軟件自動化的任務,并利用智能來實現它。如果我們正處于這樣一個指數曲線上,即智能在給定成本和參數下可以展現出多大的能力,我認為你將看到軟件變得無形,而智能將成為人們表達他們希望后臺自動化完成任務的新型“語言”,它將是一種持續的流動。
主持人: 如果我們把這作為假設,有人想挑戰我們正朝著這個方向發展的假設嗎?
理查德·索克: 我的直覺是,將會有一些軟件,你真的希望它做得非常好,而且它是一個非常常見的用例,比如Instagram或類似的東西,你可以自己搭建一個Instagram,但你沒有其背后的網絡支持,你沒有用戶貢獻他們的內容和相關東西。但我同意,比如,尤其是在企業環境中,如果你巧妙地做到這一點,并且擁有所有復雜的權限設置和報告等等,如果你能實現自動化,然后在其上進行創新,那將會非常強大。
拉維·馬特雷: 我認為這將擴展應用場景,擴展到那些原本軟件不會被構建、并且存在更多手動流程和工作流的地方。那很可能會消失。而且,再說一次,由于這種變化的速度是……我認為智能能力的指數級提升,將令人們感到驚訝。但我同意你的看法,在用戶數量非常多、因此設計的美觀度和完成度以及某些魯棒性方面需要仔細考量的應用場景中,這在更長一段時間內,或許最終在極限情況下,也可以被自動化。這將是利用人工智能來增強工作流程的工程人員,但也需要進行一些設計工作。
智能體編排與遞歸自我改進
主持人: 如果我們把這視為我們前進的方向,那么從實現方式上我們遺漏了什么?例如,我認為我們低估了人工智能的一點是,人類適應它的速度會有多快。如果我們假設起點是我們將處于一個企業將創建這些只需完成必要工作而無需創建另一款軟件的層級的世界,我們可能遺漏了什么?在我們全速前進之前,我們還必須關注什么?我們要做什么,還有哪些工作需要完成?
皮普爾·辛哈: 在我看來,智能體編排是一個將非常重要的領域。因為如果你想想我們在過去15到20年里為實現數字化轉型而構建的所有企業自動化軟件,這個新的智能體編排層將利用這些軟件。只是人類將不會參與這個過程。隨著時間的推移,它會越來越深入,使工作流引擎徹底變得毫無用處。
所以最終你將擁有數據結構,然后你將擁有智能體編排。因此,尚未被充分理解或尚未受到關注的是這個智能體編排層,它接收你的輸入,即你想要完成什么,然后如何創建和編排這些智能體?在我看來,如果你快進10年、15年,你將擁有數據、一個智能體編排器,它可以為你創建你需要的任何類型的工作流,無論你是想接受客戶的業務訂單,還是想為你的客戶或潛在客戶運行營銷活動,或者你想支持你的客戶。它將為你動態生成該工作流,運行該工作流,創建結果,給你最終結果,并告訴你發生了什么。但這一個過程是一個編排過程。
理查德·索克: 我會說可能有兩件事。一是,現在,人工智能正在越來越多地從最初為人類構建的基礎設施中轉移出來,而現在人工智能開始越來越多地使用它。我們已經看到了這一點,比如圖形處理器(GPU),最初是供人們玩游戲使用的,而我們正在訓練它們。現在我們正在構建專為人工智能設計的全新硬件。我們認為這是您向上堆棧移動的過程。就像以前許多人工智能模型使用谷歌作為其搜索引擎或搜索結果頁面(SERP)API等一樣。現在它們實際上正在轉型,我們正在構建一個實際的搜索引擎,專門用于大型語言模型(LM),供它們進行搜索并總結所有內容。
我認為我們大大忽略和沒有考慮的另一件事是下一層次可能是什么。我從歷史上可以想象的方式是,想象一下IBM的“沃森”團隊剛剛贏得《危險邊緣》(Jeopardy)時的情景。每個人都在互相擊掌慶祝,你會說,辛苦了負責地理問題的團隊,辛苦了負責音樂問題和名人問題等的團隊。但順便說一句,你們800人將成為一個單一的神經網絡,因為我們現在可以學習所有這些知識,并用一個學習到的系統取代一個手動系統。
目前,構建模型的系統實際上是手動完成的。那些非常聰明的人,有時你需要花5000萬美元請他們,他們正在手動構建關于如何在新模型創建時奏效的直覺,然后合并一個新模型需要數月時間,接著你就得到了GPD 5.3或類似的東西。這部分本身也可以實現自動化,那將是一種遞歸的自我改進。這些模型會自行變得更好。
主持人: 完全正確。珍妮絲,你認為哪些事情因為我們目前不是AI原生而尚不是問題,但當我們成為AI原生時,會成為問題或挑戰?
雅尼斯·安特諾格魯: 實際上,我只是想回到智能體注冊(agent-registration)這個問題上。我認為這不只是一個智能體注冊的問題,而更多是多智能體(multi-agent)的問題。當你有一個系統,其中既有人類也有許多智能體彼此互動時,以及這些系統的動態特性是什么。這不是一個被充分理解的系統。我們對此幾乎沒有任何科學依據。我們不知道如何優化這些模型,使其在多智能體系統中運行得更好。這方面有一些初步的研究,但還不夠成熟。我認為,隨著像代理(agent)和擁有許多代理相互作用的系統的激增,這將成為一個更緊迫的問題。
明年的常識:長效代理與強化學習
主持人: 那么最后一個問題,對你們每個人來說,有什么是今天聽起來有點激進,但你們認為到今年年底就會顯而易見的?到明年達沃斯會議時,這聽起來像是今天很棒的預測,但你認為到我們明年再次會面時,它將成為常識性的智慧。
張予彤: 人工智能將創造出最好的人工智能,而不是人類。我認為這是一個非常長的代理期。我認為在擁有一個可用、可擴展的人工智能系統之前,人工智能需要擁有像人類一樣非常長的代理期。比如,我正和我的團隊一起工作。我們每周都有一次會議,我們設定目標,討論大概的任務,然后他們就自己獨立去自主工作,然后我們可以下周再見面看看結果。所以我認為非常長的代理期可能會實現。
拉維·馬特雷: 還有其他想法嗎?我想我們將首先看到的是關于,智能能力的前沿,即某種更持續學習的能力。它可能不完美,但模型能夠根據它們與環境的交互方式進行調整,然后對其核心知識進行某種更新。
皮普爾·辛哈: 對于企業而言,強化學習目前沒有被正確理解。許多企業的挑戰在于沒有通用的員工。每個人都為企業執行特定的任務,這就是為該企業定義的業務流程。尚未被充分理解的是,強化學習將如何獲取企業的特定工作流程并進行強化學習,以使通用模型適用于企業,而我們將在明年看到這是重大進展。今天有點理論化,但這將加速人工智能在企業中的采用。
雅尼斯·安特諾格魯: 我想我同意你的觀點,真正的長效代理(或長期能動性)將成為常態。
主持人: 我希望明年我們有機會討論所有這些內容。我相信那將是變革巨大的一年。非常感謝亞尼斯、比波爾、理查德、予彤和拉維,進行了一次精彩的討論。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.