總的來說,2025年對于AI來說是相當精彩的一年。哪些方面進展順利,哪些方面進展不順,以及哪些方面最讓我感到驚喜——放心,絕對不煽情!
作者:NATE 2025年12月25日
2025年并沒有出現(xiàn)科幻小說里那種吸引眼球的AI版本——沒有機器人管家,沒有通用人工智能(AGI)突破性進展的新聞發(fā)布會,也沒有什么驚天動地的轉(zhuǎn)折點。相關(guān)的討論常常令人疲憊不堪。GPT-5讓很多人失望。“智能體”成了避不開的熱詞,可那些演示只要你追問一句就會露餡。
然而,當我回顧今年我親眼所見人們創(chuàng)造出的東西——不是那些公告,、不是那些炒作,而是那些已經(jīng)交付并在實際使用中經(jīng)受住考驗的作品——我發(fā)現(xiàn)自己比預(yù)期的更加樂觀。
我想聊聊四件真正改變我認知的事——不是對AI未來的預(yù)測,而是我關(guān)注的重點及背后原因的轉(zhuǎn)變。
“技術(shù)型” 與 “非技術(shù)型” 的界限,徹底模糊了
多年來,我一直抱有這樣一種思維定式:世界上分為技術(shù)型人才和非技術(shù)型人才,他們身處不同的領(lǐng)域,使用不同的工具。技術(shù)人員負責(zé)構(gòu)建產(chǎn)品,非技術(shù)人員負責(zé)使用產(chǎn)品。這種差異似乎很自然,幾乎是必然的,仿佛是知識工作組織方式的必然特征。
2025年打破了我對這種模式的認知。
打破它的不是某個瞬間——而是我們一次又一次地看到,那些原本不會自詡為技術(shù)人員的人,竟然遠遠超越了工程師團隊。這并非因為他們突然掌握了某種傳統(tǒng)意義上的編程技能,而是因為在我們忙于爭論哪種模式最佳的時候,“技術(shù)”的定義在我們所有人的潛移默化中發(fā)生了轉(zhuǎn)變。
我認為現(xiàn)在真正的事實是:每個人都會掌握解決自己感興趣的問題所需的技術(shù)技能。從某種意義上說,這一直都是如此,但“技術(shù)技能”的門檻已經(jīng)大幅降低。當大語言模型(LLM)能夠?qū)⒋a作為工具——當簡單的英語能夠控制計算機——障礙就不再是語法了。不再是不知道正確的函數(shù)名或不記得循環(huán)的工作原理。真正的障礙完全在于其他方面:對問題的好奇心、迭代的意愿以及對模糊性的適應(yīng)能力。
我現(xiàn)在每天早上六點都會進行代碼審查,找出我遺漏的地方,并在一個文件里留下記錄,然后一邊喝咖啡一邊查看。一年前,要做到這一點,要么需要我自己編寫腳本,要么需要請別人幫我寫。現(xiàn)在,我只需要描述一下我的需求,如果不太合適就進行調(diào)整,直到它正常工作為止。這并非傳統(tǒng)意義上的“技術(shù)化”——而是 “技術(shù)型” 這個分類本身正在瓦解。
今年我親眼目睹了一些人超越了整個開發(fā)團隊,這并非因為他們一直以來都是隱藏的工程師。而是因為他們把工程視為一種可以自主設(shè)計的流程,而非需要獲得許可才能加入的 “專屬領(lǐng)域”。他們不會盲目崇拜任何特定模型,完全愿意將低技術(shù)含量的東西(模板、驗證器、重試機制)與高技術(shù)工具結(jié)合使用。他們積極迭代,而且至關(guān)重要的是,他們沒有把“主動”與“優(yōu)秀”混為一談。
市場的反應(yīng)比我預(yù)期的更快。我發(fā)現(xiàn),具有出色創(chuàng)造性問題解決能力的人,求職時被選中的速度比我預(yù)想的要快——這和媒體大肆報道的大規(guī)模裁員不同,不管報紙怎么說,目前沒有太多證據(jù)表明 AI 正在導(dǎo)致整體就業(yè)人數(shù)下降。但有一個明顯的信號:與 AI 高效協(xié)作,本質(zhì)上是一種創(chuàng)造性的、近乎文科思維的能力。想要展現(xiàn)創(chuàng)造力的技術(shù)人才終于有了機會,而一直覺得自己 “搞不了技術(shù)” 的創(chuàng)意人才,也發(fā)現(xiàn)自己之前對自己的認知是錯誤的。
我認為,明年真正的機遇之一在于那些渴望在自身專業(yè)領(lǐng)域邊緣地帶拓展的人。世界的確比十二個月前更加開放。你可以朝著以前受限的方向發(fā)展,而那些勇于嘗試的人將會收獲意想不到的驚喜。
提示詞很重要,但衡量標準才是規(guī)模化的關(guān)鍵
這件事的重要性讓我感到驚訝。
今年我花了很多時間寫關(guān)于提示詞的內(nèi)容,我依然堅持那些觀點——寫好提示詞是一項真正的技能,它能切實影響模型輸出結(jié)果的質(zhì)量。但大約在年中,我開始注意到,那些取得最佳成果的團隊,不僅僅是提示詞寫得巧妙,更重要的是他們找到了衡量輸出結(jié)果是否真正有效的方法。
這就是它如此重要的原因:當你能夠清晰地定義“好”的標準,并自動進行檢查時,你就可以把智能體放入循環(huán)中,讓它不斷迭代直到達到目標。智能體不會感到疲倦,不會對自己的工作感到抵觸,也不需要鼓勵。你只需告訴它“這樣做失敗是因為X,請修復(fù)X”,它就會再次嘗試。一次又一次。只要你衡量的是正確的指標,它就會不斷嘗試,直到成功或真正遇到瓶頸。
這就像給飛機裝上噴氣式發(fā)動機一樣,迭代速度快得幾乎不可思議。
提示詞能讓你得到一個不錯的初步嘗試,而衡量標準能讓你把這個嘗試規(guī)模化地轉(zhuǎn)化為可靠的成果。那些同時重視這兩點的團隊,已經(jīng)開始甩開那些還把提示詞當作全部的團隊。
對我來說,關(guān)鍵洞察是我之前低估了這個等式的一半。提示詞是用來傳達你的需求的,而衡量標準是用來確認你是否得到了想要的結(jié)果。兩者缺一不可,而大多數(shù)人(包括我自己)之前都沒有足夠認真地思考過后者。
我認為,我們對AI質(zhì)量低下問題的理解可能有誤。
沒錯,互聯(lián)網(wǎng)上充斥著AI的垃圾內(nèi)容。你肯定見過。千篇一律的博客文章,虛假的自信和斷言,以及那些似是而非、令人不安的內(nèi)容,最終只會讓你比什么都沒看到更沮喪。
我花了不少時間關(guān)注這股垃圾內(nèi)容的浪潮,一直在思考,在AI生成內(nèi)容如此泛濫的情況下,互聯(lián)網(wǎng)和通信會變成什么樣子。我們是否為了追求數(shù)量而犧牲了質(zhì)量,以至于無法挽回?
后來我開始想到印刷機。
普及識字是人類最偉大的成就之一。但問題是:人類所寫的大部分東西并非《基督山伯爵》或《指環(huán)王》那樣的巨著。我知道我寫不出那樣的作品!大多數(shù)作品甚至連邊都沾不上。印刷術(shù)和普及教育帶來了人類產(chǎn)出的爆炸式增長,而其中大部分——顧名思義——都平庸無奇。乏味的備忘錄,令人過目即忘的信件,無人問津的報告。在考古學(xué)中,我們稱之為陶片——在陶片上潦草刻畫的文字。只是以前我們不必大規(guī)模面對這些,因為傳播成本高、速度慢,而且大多數(shù)作品都是幾年內(nèi)就會消失的涂鴉(更不用說互聯(lián)網(wǎng)內(nèi)容的短暫性了)。
AI加劇了這種現(xiàn)象。事實證明,當每個人都能以近乎零成本獲得寫作工具時,得到的往往是大量平庸的寫作成果。這并不令人意外。每次通信工具普及化,我們都會看到同樣的模式。質(zhì)量低下并非新鮮事,只是被放大了而已。
讓我感到欣慰的是,平庸之作并非不可避免,而且我們?nèi)祟愑兄喈斂煽康臍v史,能夠從我們自己創(chuàng)作的大量平庸之作中發(fā)掘出偉大的作品(比如莎士比亞)。好東西終會脫穎而出。
當你構(gòu)建起真正的系統(tǒng)——當對生成的內(nèi)容以及發(fā)布前的檢查都嚴格把控——你就能產(chǎn)出遠超大多數(shù)人獨立完成的作品。我見過真正能吸引點擊的營銷文案、能獲得回復(fù)的郵件,以及效果遠超團隊手動制作的廣告創(chuàng)意。關(guān)鍵不在于模型本身,而在于圍繞模型的一切環(huán)節(jié)。檢索數(shù)據(jù)來佐證論點;驗證機制來發(fā)現(xiàn)錯誤;人工檢查點來應(yīng)對極端情況;以及在流程的某個環(huán)節(jié)融入個人品味。
內(nèi)容信息量是否豐富?是否值得反復(fù)閱讀?是否節(jié)省時間?這些都是正確的問題,而AI可以幫助你很好地回答這些問題——前提是你構(gòu)建的系統(tǒng)能夠?qū)崿F(xiàn)這一點,而不是僅僅將模型連接到發(fā)布按鈕然后聽天由命。
我不想生活在一個充斥著劣質(zhì)產(chǎn)品的世界里。但我不再認為劣質(zhì)產(chǎn)品是不可避免的未來。那些能夠大規(guī)模生產(chǎn)高質(zhì)量產(chǎn)品的開發(fā)者、廣告商和營銷人員,終將取代那些只追求數(shù)量的人。選擇壓力是真實存在的,而且我認為人們渴望真實的故事和真正有價值的內(nèi)容。
討論焦點正從成本削減,轉(zhuǎn)向質(zhì)量提升
這一點對我展望未來一年至關(guān)重要——但我必須謹慎,避免夸大其詞。這種轉(zhuǎn)變正在出現(xiàn),但并非普遍現(xiàn)象。每個人的情況可能有所不同。我能說的是,我親眼目睹了這種轉(zhuǎn)變,而且我認為其方向很明確。
2025年初,人員配置方面的討論占據(jù)了主導(dǎo)地位。“我們可以替換多少人?”我在與高管的每一次會議上都會聽到這個問題,而且這通常是他們問的第一個問題。AI被視為一種削減成本的工具。演示文稿中列出了當前團隊規(guī)模、引入AI后的預(yù)計團隊規(guī)模,以及由此產(chǎn)生的成本節(jié)約。
到了第三季度,我接觸到的那些更成熟的運營商開始提出不同的問題。
不是“如何以更低的成本做同樣的事情?”,而是“如何做以前做不到的事情?”我們?nèi)绾我院侠淼膬r格,大規(guī)模地為所有人提供最佳客戶質(zhì)量?我們?nèi)绾巫屢郧盁o法盈利的細分市場也能實現(xiàn)盈利?我們?nèi)绾螖U大產(chǎn)品和服務(wù)范圍,而不僅僅是降低成本?
我之所以看到這種轉(zhuǎn)變,是因為領(lǐng)導(dǎo)者們開始意識到其中的價值。他們看到早期提升質(zhì)量的實驗比削減成本的實驗效果更好。他們意識到削減成本是有限的——你最多只能削減一兩次,然后就到此為止了;如果削減過度,你只會以更低的價格讓自己變得更糟。
質(zhì)量提升帶來復(fù)合增長。新功能創(chuàng)造新市場。新產(chǎn)品建立新客戶關(guān)系。以往不盈利的領(lǐng)域也能實現(xiàn)盈利。增長空間遠不止于此。
仍然會有很多人秉持著我稱之為“粗暴主義”的思維模式——把AI一股腦地塞進去,削減成本,然后就完事了。我并不是說這種思維模式已經(jīng)消失了。但我越來越看到一些領(lǐng)導(dǎo)者意識到一個重要的事實:那些最終勝出的公司,都是那些將員工的注意力視為寶貴資產(chǎn)的公司。他們以人為本設(shè)計AI系統(tǒng),讓人們能夠?qū)⒆约旱膶I(yè)知識運用到最關(guān)鍵的領(lǐng)域,而不是設(shè)計那些試圖將人完全排除在外的系統(tǒng)。這樣做是切實可行的,因為這些系統(tǒng)仍然需要人。
這比“用機器人取代所有人”的愿景更有希望。而且我認為這更準確地反映了未來的發(fā)展方向,因為純粹的自動化方法總是會遇到同樣的瓶頸:任何實際工作流程的最后20%都包含所有的判斷,而判斷恰恰是模型目前還不可靠的部分。
注:我并不是說AI革命不會導(dǎo)致工作崗位變動或裁員。如此巨大的變革,這類事件早已屢見不鮮。我更想強調(diào)的是,許多領(lǐng)導(dǎo)者開始意識到,為團隊配備“鋼鐵戰(zhàn)衣”能帶來巨大的好處,從而倍增團隊的影響力。我認為這一點令人鼓舞,值得關(guān)注。
這一年教會了我什么
一月份,討論的焦點全在新模型發(fā)布和基準測試上——這也不難理解,因為當時的熱點都集中在這些方面。每隔幾周,就會出現(xiàn)新的功能提升、新的應(yīng)用場景或新的推理突破。
到了夏天,我開始注意到一些不同之處。模型改進一直在進行,但它們并非區(qū)分成功交付團隊和失敗團隊的關(guān)鍵因素。真正有趣的差距出現(xiàn)在其他方面——開發(fā)人員實際如何使用模型,新鮮感過后人們繼續(xù)使用哪些工具,以及他們?nèi)绾翁幚硌菔竞蜕a(chǎn)之間的過渡階段。
技術(shù)與非技術(shù)之間的界限正在消融。衡量標準是提示詞未被重視的補充(而非替代品),是實現(xiàn)規(guī)模化的關(guān)鍵;無論誰來創(chuàng)作,平庸的作品終究平庸,但好的系統(tǒng)能帶來巨大提升。領(lǐng)導(dǎo)者開始意識到,提升質(zhì)量比削減成本更具價值。這些都未曾出現(xiàn)在基準測試公告或模型發(fā)布說明中。它們源于對人們在嘗試構(gòu)建真正有價值的事物時,哪些方法行之有效的觀察。
這就是我明年要關(guān)注的重點。不是因為模型競賽不再重要,而是因為它已經(jīng)不再是我所關(guān)心的大部分工作的瓶頸。
對你而言,今年有什么改變?
本文編譯自substack,原文作者NATE
https://natesnewsletter.substack.com/p/year-end-reflections-why-2025-was
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.