金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
不用“噫吁嚱”——前端沒被AI殺死,終端且得狂飆。
在許多人高呼“AI正在顛覆一切”的當下,這樣的一句判斷,竟顯得如此反直覺。
但別急,看完下面的一張圖,或許就能讓眾多迷茫的前端程序員瞬間醍醐灌頂:
![]()
在這張圖中,我們看到的是三個跨時代的手機:2000年的諾基亞3310、2007年的初代iPhone,以及今年的iPhone 17 Pro。
三者并排放在一起,一個非常直觀的感受就是,電路板變得越來越復雜;3310的主板,可能只是iPhone 17 Pro的一個小傳感器。
很多人以為AI是對傳統開發的降維打擊、是一場徹底的革命,但當你拆開技術的“后蓋”,盯著那些密密麻麻的線路時,你會發現,復雜度從未消失,它只是換了一種形式存在——
從電路板的物理堆疊,遷移到了模型、接口、網絡、算力共同構成的數字堆疊。
這就是螞蟻集團終端技術委員會負責人翁欣旦在SEE Conf大會中拋出的觀點。
更進一步的,他還給出了一個非常發人深省的結論:
- 前端程序員的宿命從未改變,永遠在對抗熵增(復雜系統)。
- 但在AI時代,是時候要清算一下技術債了。
![]()
△螞蟻集團終端技術委員會負責人,翁欣旦
一言蔽之,技術的浪潮更像是一個巨大的輪回,只是規模在放大,節奏在加快,體驗在被不斷刷新。
AI APP,其實在返祖
我們不妨先從最為直觀的終端前端的效果開始講起。
例如打開現在最火的AI應用,無論是OpenAI的ChatGPT,還是螞蟻發布的AQ、靈光,你都會產生一種強烈的既視感:
它們太簡單了。
![]()
一個輸入框,一個對話流,一行行簡潔排布的回答;沒有復雜的導航、沒有豐富的層級,也沒有堆滿屏幕的信息分發。
這個簡潔的界面讓人不禁回想起20年前的WAP網頁,或者是那個功能單一、界面樸素的支付寶1.0時代。
這看似是一種倒退,畢竟移動互聯網在經歷了十幾年雕花般的UI進化,把APP做得像精裝修的豪宅之后,AI APP突然一夜回到毛坯房。
這背后是極簡美學的回歸嗎?
在翁欣旦看來,我們正在經歷兩個技術上的輪回式的返祖。
![]()
首先是交互的輪回。
計算機的發展史,可以說是一部從DOS(命令行界面)走向GUI(圖形用戶界面)的歷史。
DOS時代的黑底白字,被Windows和Mac的窗口圖標取代,因為點擊比輸入指令更符合直覺。
而現在的AI,似乎正試圖把我們拉回CUI時代——用自然語言對話來解決一切。
但這真的高效嗎?
翁欣旦在現場提出了一個非常務實的質疑:
- 如果小手輕輕一點就能辦妥的事,用戶為什么要打開一個Agent,跟它絮絮叨叨講上一分鐘?
Rabbit R1和AI Pin等純AI硬件的翻車,已經給出了市場反饋。當用戶必須對著一個沒有屏幕或屏幕極小的設備說話,且無法通過視覺反饋確認操作狀態時,溝通成本反而大幅上升。
單純依賴CUI,在處理復雜任務時效率極低;交互的未來,注定不是CUI殺死GUI,而是兩者的共生。
更明確一些來說,是讓GUI負責高頻、確定性的操作,CUI則是負責長尾、復雜的意圖理解。
現在的AI APP界面之所以如此簡陋,恰恰是因為這種“GUI+CUI”的深度融合范式尚未成熟,行業還在摸著石頭過河。
其次是架構的輪回。
在移動互聯網爆發初期,API網關是一個里程碑式的存在,為了應對海量的APP請求,為了業務的靈活性,開發者們曾熱衷于把接口做得很寬。
就像翁欣旦提到的那個血淋淋的例子:為了省事,很多核心業務邏輯被塞進了一個名為“extend_info”的字段里。
![]()
這種做法在當年是為了管好接口,給業務留足后路;但到了AI時代,這筆技術債開始爆雷了。
當我們試圖讓大模型去理解、去調用這些接口時,模型懵了:它讀不懂那個黑盒一樣的“extend_info”里到底藏了什么。
即便把幾百行相關代碼喂給模型,缺乏上下文的它依然無法理解其中的業務含義。
以前做API網關,是為了讓以前的程序能跑通;現在做架構,是為了讓大模型能看懂。
為了實現這一點,我們不得不重新定義接口,重新去把那些為了靈活性而犧牲的語義補回來。
這哪里是AI殺死了前端?這分明是AI逼著前端工程師把以前偷懶沒做好的作業,重新做一遍。
AI原生應用看似全新,實則仍在解決老問題:
如何在復雜性與可用性之間取得平衡,如何在開放與管控之間找到邊界,如何在創新與工程之間保持節奏。
終端是不可被替代的
除了軟件形態的返祖,另一種流行的焦慮是云端萬能論。
因為有不少人會認為,既然大模型都在云端運行,終端是不是只需要做一個顯示器就好了?
這種想法忽略了兩個最硬核的物理限制:網絡和算力。
想象這樣一個場景:你正興致勃勃地跟AI聊得火熱,突然走進電梯,或者經過一個信號盲區,屏幕上的文字戛然而止,那個原本流暢吐字的Token流斷了。
這一刻的體驗是災難性的。無論云端的模型有多智能,無論流式傳輸技術吹得有多神,在物理網絡缺失的那一秒,一切歸零。
這就是終端存在的意義。
![]()
對此,翁欣旦將網絡和算力放到了一個更大的三維坐標系來分析。
在X軸的網絡維度看,通信技術的進步確實解放了交互模態:從GSM時代的純文本WAP,到3G時代的圖片,4G時代的視頻,再到5G時代的3D和XR。
但物理世界的網絡覆蓋永遠存在盲區,5G再快,也沒法消滅信號死角。
從Y軸的算力維度看,終端設備正在經歷一場悄無聲息的服務器化。
回看2007年的初代iPhone,412MHz的CPU,128MB的內存。
那時的開發者如果聽說只有這點資源,恐怕連個像樣的Demo都跑不起來。
而今天的iPhone 17 Pro,擁有4.29GHz的多核CPU和12GB內存,堪比一個隨身攜帶的小型服務器了。
隨著端側算力的暴漲,未來的手機將成為一個邊緣計算(Edge Computing)的強力節點。
翁欣旦做了一個極具畫面感的假設:
- 如果我們在會場搞一個彩蛋,讓現場幾百人同時拿出手機,用AI功能生成一個特效。如果完全依賴云端推理,這一瞬間的并發請求,足以把后端的推理算力打爆。
- 如果連一個彩蛋特效都能把幾百人的推理算力打爆,那云端永遠無法承載億級用戶的實時AI互動。
未來的AI體驗,一定是“云側訓練 + 端側推理”的混合模式。
云端負責這一代模型的智力上限,而終端負責讓這份智力隨時隨地、無延遲地服務于人。
在這個架構下,終端開發者的價值非但沒有被稀釋,反而因為要承載模型推理、保障隱私安全、處理極端場景而變得更加核心。
AI時代,更能體現程序員的價值
最后,我們還需要討論一個問題:
既然前端沒死,終端依然重要,那程序員的焦慮到底來自哪里?
很多時候,焦慮或許源于對新技術的誤解,我們往往高估了技術的短期爆發力,而低估了它的長期滲透力。
翁欣旦講了一個關于多點觸控的故事。
![]()
當喬布斯在2007年的發布會上,用兩根手指放大一張照片,全場驚呼“Apple invented Multi-touch”時,事實并非如此。
早在1970年代,多點觸控的原型就已經在實驗室里誕生;1999年,Fingerworks公司就開始將這項技術商業化。
蘋果在2005年收購了這家公司,經過兩年的打磨,才把它變成了iPhone上那個改變世界的交互。
從技術原型到產品爆發,中間隔了整整37年。
AI亦是如此。
Transformer架構雖然是2017年才提出,但神經網絡的理論基礎早在1980年就已經成熟。
為什么當年沒火?因為那是局域網時代,沒有海量的數據去喂養它。是互聯網這30年積累的浩如煙海的文本、圖片、視頻數據,才讓Transformer在今天有了用武之地。
![]()
技術本身可能早已就位,缺的是應用體驗的臨門一腳,這正是前端和終端程序員的機會所在。
現在的AI技術,就像是一把剛剛鑄好且性能強悍的錘子。但到底要釘什么釘子?釘多深?釘完之后是不是歪的?這需要人來把控。
用翁欣旦的話來說就是,應用是新技術的量尺,體驗是C端應用的靈魂。
![]()
大模型給出了概率性的預測,但用戶需要的是確定性的服務:
大模型能生成一段代碼,但它無法理解這段代碼在復雜業務場景下的副作用;大模型能畫出一張圖,但它不知道這張圖在弱網環境下該如何優雅地加載。
“不要因為AI來了,就急著丟掉手里的螺絲刀。”
那些看似枯燥的工程能力——
如何優化首屏加載時間,如何處理內存泄漏,如何在高并發下保證穩定性,如何在復雜的手機碎片化環境中保證UI一致性,這些對抗熵增的經驗,才是AI無法替代的護城河。
一言蔽之,機器學不會的對體驗的極致敏感度,正是優秀的前端工程師的價值所在。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.