這件事重度依賴基底模型的智商
![]()
文 / 書航 2025.11.29
2025 年,AI 領域發(fā)生了很多標志性事件,它們共同指向了一個特性:一句話生成。
文字方面,年初 DeepSeek 讓我們見識了什么是普惠級的“One-Shot”(少樣本甚至零樣本)文字生成,ChatGPT 領銜的 Canvas 模式可以指哪打哪做局部文字編輯;
圖像方面,Nano Banana 和 SeeDream 等模型讓少提示詞出圖,以及動嘴 P 圖成為標配,而且量大管飽,四舍五入都是免費;
視頻方面,Sora 2 讓一句話生成的視頻具備了起承轉合的劇情;
音頻方面,Suno 4 更是進化到了可以精準修改音軌的專業(yè)級工具。
行業(yè)對于 AI 編寫 Web 前端和后端需求比較多,但直到 Gemini 3 ,“一句話生成(基本能跑的) Web App”這個時代終于普惠地來到了所有人的面前。
這里我說個暴論:需要編程能力的,有錢用 Claude,沒錢用 Gemini 就行了。白嫖或者拼車 Google One 的路徑滿坑滿谷,而大部分你對 Gemini 的需求,特別是“一句話”類的需求,都可以在聊天框而不是 API 就能解決。
提示詞工程正在消亡,自然語言統(tǒng)治一切。當模型能力強到一定程度,那些曾經必須特別注重的提示詞技巧、復雜的工程外殼,都可以不用管了。正如 Manus 所言:“Less structure, more intelligence”。
為什么強調“一句話”
永遠不要小看“一句話”帶來的心理暗示。
正如,之前網上給出的案例基本是調用模型原本的世界知識,以 one-shot 生成信息圖,如“生成圖片說明咖啡機的工作原理”。
![]()
![]()
![]()
看到很多“只需一句話”就能搞定的案例被瘋傳,它降低的不是技術門檻,而是心理門檻。在很多垂直行業(yè),缺乏 AI 體驗的專家們往往掌握著極深的專精知識。過去他們被代碼攔在門外,即使實際上真的很簡單,要想突破自己也不容易。
現在“只需一句話”給了他們向前一步的勇氣。他們使用 AI 時,用法可能和主流不盡相同,自己摸索才能有自己專屬的用法,哪怕別人培訓也達不到這個效果。而他們所需要的往往只是一種勇氣。
這件事重度依賴基底模型的智商
一句話手搓應用這一點,給我本人帶來的就是一種高中數學考 30 分的文科生也可以編程的勇氣。
在 Gemini 3 之前,Claude 的一些模型號稱編程能力很強,但我一直用不了直連 Claude Code,通過 Manus 使用。。
![]()
當時我最直觀的感受是:多次修改訴求極度耗費 Token,而且模型只要降智就不能用,所以就得忍受高級推理模型一點點耗著。
Gemini 3 的一些 WebApp 單頁案例我已經看到,確實讓人眼前一亮,目測其可用性比 Claude 持平或者更強,這讓我更有信心讓出品更可控,即使我還沒有專門測試 Gemini 3 的用例。我相信當初我讓 Manus 做的事情,它也可以做。
但是我真去體驗了螞蟻的新產品“靈光”,因為它們在辦一句話生成 AI 應用的大賽。靈光將這種 WebApp 稱為“閃應用”。
![]()
螞蟻的前端和工程能力毋庸置疑,我看到推理過程被優(yōu)雅地包裹在一個框里面,思維鏈既不冗長又可以提示關鍵進度。遺憾的是,決定成品質量的似乎依然是模型本身的智商。
我嘗試制作的閃應用是一個“可以生成閃應用提示詞的閃應用”,也就是“元應用”(meta-app)。我希望用一個游戲化的方式將它包裹起來,一開始規(guī)劃的是賭場搖骰子,生成一張閃卡,上面寫著提示詞,點一下一鍵復制可以貼到靈光里面生成新的閃應用。
![]()
為了確保穩(wěn)妥,我讓文本能力本身就很強的 Gemini 3 讀取我的訴求并優(yōu)化了提示詞,對方方面面都做了規(guī)定。
![]()
![]()
![]()
初始版本,點擊骰子本身無反應,下面六個按鈕才有反應。
彈窗第一次點擊不會出現,奇葩的是需要點擊一下“問號”彈出操作說明,關閉后等待一秒鐘才出現原本要有的彈窗。
另外,這個版本的創(chuàng)意名稱都跟我框定的按鈕標簽一樣,比如點“養(yǎng)生局”就出“養(yǎng)生輪盤”,這并不是我想要的結果。
第一次測試確實大差不差的出了個樣子,然而致命的是修改環(huán)節(jié)。我發(fā)現只要對話超過 3 輪,模型就開始“老年癡呆”丟失上下文,忘記我最初制作這個“閃應用”的核心初衷。比如,我一開始讓它解決生成的骰子和籌碼不太擬真的問題,最后它給改成了一個純粹猜點數的游戲。
為了解決這個問題,我嘗試一次性把所有需求寫進提示詞,結果又因為信息過載導致生成失敗,最終輸出的結果也體現了模型不太聽得懂人話。我甚至忘記之后要寫稿了,在憤怒之下刪除了之前的聊天記錄
因為牌桌可能太復雜了,我又改讓它做 Gemini 3 順手拈來的咕咕機,結果也一樣磕磕絆絆。
這個聊天記錄保留下來了,大家可以鑒賞:
![]()
![]()
![]()
![]()
下面開始崩了:
![]()
![]()
我返回上一次的指令直接修改,結果完全崩壞了:
![]()
最后我讓它只實現核心功能——優(yōu)化提示詞,并且改為輸入框輸入訴求來優(yōu)化提示詞,總算達到了目的,但是這東西也過于簡單了。
![]()
![]()
![]()
實際上我們在“閃應用”大賽里面看到的也是如此,卡路里計算器,飛機大戰(zhàn)這些,都是已經非常成熟,但是未免是“為了做(參賽)而做”的東西,受能力所限,距離實用會有點遠。
螞蟻做的前端是比較到位的,遺憾的是模型能力不足。還是回到了“Less structure, more intelligence”。
說了這么多,如果讓 Gemini 3 自己做自己寫的提示詞,最后會做成什么樣子呢?
如下:
![]()
![]()
![]()
![]()
![]()
截圖過程中發(fā)現一些Bug,但根據它的表現,完全能修。
![]()
![]()
稍后我將會把它部署在我的個人網站,方便上不去 Gemini 的同學體驗。(可等待評論區(qū)置頂評論或在官網 https://lishuhang.me 查看本文)
應用商店的“Youtube 時刻”?
盡管技術還有瑕疵,但這并不妨礙資本講故事。一句話驅動 AI 生成應用的 C 端領域早已是一片紅海。
第一類,像 Manus、MiniMax、字節(jié)的扣子空間、Replit這些,它們不僅生成代碼,還可以托管生成的網頁應用,并且執(zhí)行一些簡單的非靜態(tài)功能。
第二類,Claude Artifacts 或者 ChatGPT Canvas,這是純聊天機器人“順手一做”,增加一個功能也不費事。最近阿里的千問 App 也在大力宣傳“一句話生成應用”。而同室操戈的螞蟻靈光則推出了“閃應用”。這幾家都在辦大賽,跟當初火爆一時的 AI 生圖大賽一樣,只能用自家的模型和產品,開發(fā)者目的是收集樣本,并且探索模型的能力邊界和局限。
第三類,是 Wabi、Pico、Websim 以及百度的“秒噠”等,是專門錨定 C 端的、專業(yè)性進一步降低的類型。比如 Wabi,作為陪伴應用 Replika 聯合創(chuàng)始人的新項目,目標是做“App 界的 YouTube”。Websim 則把網頁生成變得游戲化。這些平臺有的像 Manus 一樣允許隨意切換第三方模型,有的則鎖死自家模型。
在我看來,無論平臺怎么花哨,基底模型的能力是決定性因素。如果模型聽不懂人話,所謂的“無代碼平臺”不過是堆砌了一堆漂亮的垃圾而已。
做給自己用,而不是賣出去
AI 一句話手搓應用,不太應該考慮上架賺錢,但是它對個人的生產力提升是實打實的。
以前我想做一個真·應用,甚至哪怕是一年前就基本已經沒難度的 Chrome 瀏覽器擴展,往往卡在“發(fā)布”環(huán)節(jié):Edge 的應用商店我都搞不定。APK 需要簽名,iOS 更是要交保護費上架,歐盟以外沒法側載。但如果做的人和用的人都明確這是 WebApp,那就簡單多了,只要是個瀏覽器就能跑,GitHub Pages、Vercel、Cloudflare 這些“賽博菩薩”提供了白嫖的托管服務。
下面這句話是我在制作 WebApp 時候唯一需要吟唱的固定咒語:
您需要假設WebApp環(huán)境是可以在GitHub Pages(全靜態(tài))或者聯網的本機瀏覽器(注意跨域問題)都可以使用現代瀏覽器正常打開運行的,同時也支持手機和平板訪問。
這句話也說明了一切。對 AI 浪潮越熟悉的人,就越是會增加瀏覽器的使用率,減少在原生 App 里的停留時間。
但是對于小白用戶來說,他們好像跟瀏覽器有仇一樣,連解壓文件都不會,而且因為 XX 網盤解壓要錢,還要咒罵給資源的人……這種事情都做得出來,你怎么指望他們用除了系統(tǒng)自帶應用商店和小程序之外的其它任何東西?
這又跟上面說的對上了——只要門檻降低到一個閾值以下(比如提示詞從無數次微調,到一段話,最后縮減到一句話),這個功能就會一下子涌進來很多人用。
至于所謂“AI 應用商店”或者“應用界的 YouTube”之類,我認為這里面有些門道,最終會影響整體生態(tài)的付費意愿。
首先我用 AI 手搓應用的本來目的,很多是為了替代在成熟應用商店里,在 AI 出現之前已經用人工做出來的高端收費應用,比如用 AI 做一個剪映這種需求。
如果我能用 AI 做得比較好,我的第一個念頭不是“這能賣多少錢”,而是——既然我能做,別人問一下模型是不是也能復刻一個?護城河在哪里?
反過來,哪怕我知道你這個 App 是上架前微調了好幾天的,但我自己做也就是重新微調一次的事。相比于花幾塊錢買你的現成產品,我寧愿花點 Token、花點時間自己“抽卡”。因為在心理上,我覺得這類簡單的工具“不值錢”。
當然,從 ComfyUI 到 n8n 再到扣子空間,總有人能把工作流封裝得很好,把“展示頁”變成“新的應用商店”,確實有人用工作流賺到了錢。只是我評估后覺得我自己做不了這個生意。這本質是賣“信息差”和服務,而不是賣什么真正的稀缺性,是閑魚代下單這種事情的進階版本而已。
所以,“一句話做應用”的終局,大概率是“自給自足”,而不是一個新的 App Store 淘金熱。
最后說一句,對你自己來說,有時候還是需要一個“應用”層面的東西,將一個工作流固定下來的。盡管理論上講,以后你還可以快進到用提示詞直接指揮模型干,但固定為“應用”可以少燒 Token,在保護環(huán)境的同時,也可以確保結果是穩(wěn)定可預期的。
當你需要一把錘子時,你不再需要去五金店買,而是對著空氣喊一聲:“給我來把錘子”,它就出現在了你手里。你也可以選擇對著空氣喊一聲:“給我把眼前這些釘子砸進去!”,它不是不能干。
但有時候我就是喜歡錘子,不行嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.