下面這個,來自《》的最后一個章節,寫于一年前
發布于一年前,2024年12月3日
大致就是:AI 的輸出,不應該止步于“文本”
《人類的認知協議》創作的時間背景:
Claude 已經出了 Artifacts,支持在 ChatBot 中渲染網頁;Bolt.new 火的正當時,可以快速的構建各種應用
這也不是正兒八經的“協議”或“哲學”,純粹就是信息帶寬有限
所謂的 Prompt,是是我們把意圖壓縮成 .txt 傳給機器,但當機器把結果傳回給我們時,如果還是吐出一堆 .txt,那其實是在浪費人類的解碼帶寬
算賬的時候,計算器比文字快
看趨勢的時候,圖表比描述快
做決策的時候,交互組件比對話框快
算效率的賬:.txt 不如 .exe
別給我 .txt
過去兩年,我們習慣了 Chatbot 的模式
但這種模式有個天然的局限:它是線性的
信息像水流一樣逐字流出,是一個字符接著一個字符的 .txt。但我們遇到的問題,往往是結構化的、多維的
你讓模型對比兩款房貸
它給你寫幾百字的分析,你得耐著性子看完,自己在腦子里畫表
![]()
這就是現在的體驗,讀完這一大段話,我的腦子已經過載了
這種交互并沒有解決問題,它只是把“計算過程”翻譯成了“文字描述”。在很多場景下,這反而是把簡單問題復雜化了
大家想要的其實很簡單:別跟我廢話,給我個工具,讓我自己動手
從給答案(Answer),變成給制品(Artifact)
從生成文本(Generation),變成渲染界面(Rendering)
這才是該有的樣子
兩份樣本
昨天發布的兩個產品,剛好提供了兩份比較典型的樣本
上午螞蟻發的“靈光”,夜里 Google 發的 Gemini 3
先說靈光
靈光是螞蟻的新產品,是業內首個能夠生成全模態內容的 AI 助手(官方說法)
這么說看著有點玄乎,放幾個官方的 case 吧


還有這種,可以直接做成應用

大致就是,AI 能夠生成包括 3D 模型、音頻、圖標、動畫、地圖在內的多種模態,讓信息傳遞更高效。就挺有意思的,可以看下他們官方的信息發布:
然后這東西...1天20萬用戶...
![]()
再說谷歌
昨天晚上,Google 發布 Gemini 3,具體可以看這里:
其中,谷歌也把類似的能力加進了搜索,演示的案例是“三體問題”。當你搜這玩意兒的時候,Gemini 3 不再是給你推一堆 .html 的鏈接,而是利用 coding capabilities,現場編寫并渲染一個模擬器
你可以拖動星球,看引力變化

Google 也是拼了,搜個物理題還得現場給你寫個游戲引擎
Google 把它叫做“Generative UI”
也包括這個,當詢問房貸利率的時候,不是給你示例文字,而是給你拖出來一個可視化計算器,自己摁著看

這是一種很新的搜索
這兩家,前后一天,發布了差不多的思路:用戶需求,被AI封裝成了交互實體
![]()
App Store 的護城河,被 AI 被撕開了一個口子
在這里,我相信還有一個更深層的邏輯在發生變化:
長尾理論,正在被重寫
長尾理論 這一理論由美國《連線》雜志主編克里斯·安德森提出,是一個描述網絡時代商業模式的理論。 在《長尾理論》中,當商品存儲、流通和展示的成本顯著降低時,大量銷量不高但種類繁多的“長尾”小眾產品所匯聚的市場份額,可以與少數主流熱門產品的市場份額相當甚至更大。
以前我們說長尾,是因為數字貨架的存儲成本為零。但我們忽略了一點:人類的檢索成本,同樣是高的
比如,你要去找一個“適合左撇子的番茄鐘”
得在 App Store 里翻找、下載、試用。這種由于檢索摩擦帶來的損耗,其實扼殺了絕大多數微小的需求
而現在的這種模式,把邏輯徹底反過來了:
沒有貨架,沒有庫存,只有需求
當你說出需求的那一刻,方案才被構造出來。這構建了下一代的長尾:原子化的、無限的、即時編譯的長尾
它不再是一個通用的 App 試圖去滿足 1000 個人,而是一個一次性軟件,只為了滿足你此時此刻的這一分鐘
微信當年喊了很久的“用完即走”,最終被 AI 以一種更決絕的方式實現了:
只解決需求,用完即焚
奇怪的番外
純粹說點八卦,可以跳過
阿里系的兩個兄弟,在深秋的同一周,不約而同地把槍口抬高了一寸,去嘗試卡位未來的AI入口:
? 通義突然改名,去掉了“通義”這個 B 端的抬頭,直接叫“千問”
? 螞蟻反手掏出“靈光”,劍走偏鋒,死磕 Agent 和工具生成
對了...這里我用的是阿里系,而不是阿里,劃重點
具體原因是啥,咱也不合適討論,你可以說“大棋局”或者“賽馬機制”,也可以說就是單純時間上的“撞車”,大概率就是各自的產品迭代節奏趕到這兒了
想看就看這里:
注意...靈光屬于螞蟻,螞蟻是阿里系,但不在阿里集團
巨頭的產品矩陣總是擁擠的,多一張牌,多一種可能性
身體與腦子
最后,聊個發布會之外的閑話,發布那天,我正好在中關村創業大街,在給攢一個具身智能的 after party(中關村具身智能機器人應用大賽),就很抽象、很開心
但看著它們,其實總還是少了點什么,邏輯大體還是“查庫”。遇到任務,去數據庫里匹配現成的技能。匹配不到,就尬住了
如果把昨天 Google 和螞蟻展示的這種“現場生成工具”的能力,給到機器人呢?
除了后空翻,也讓機器人學著去敬酒,也學點商務技能
![]()
機器人,也得有業務能力
接個任務,不用查庫,直接通過視覺分析環境,現場寫一個專用的執行腳本,現場生成一套視覺反饋邏輯
![]()
比如...直接來個剪刀石頭布
這才是軟件和硬件該有的結合
現在的 AI 已經能自己寫 .exe 了,硬件也快能翻跟頭,但這一眼看過去,總覺得中間還隔著層窗戶紙
說句雙關的玩笑話:
現在的機器人,也就是腦子,還欠點“靈光”
(os:靈光記得打錢)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.