網易首頁 > 網易號 > 正文申請入駐

年終反思：為什么2025年對AI來說是相當不錯的一年（但原因可能與你想象的不同）

2025-12-29 18:27:20　來源: Trend求索

北京舉報

分享至

總的來說，2025年對于AI來說是相當精彩的一年。哪些方面進展順利，哪些方面進展不順，以及哪些方面最讓我感到驚喜——放心，絕對不煽情！

作者：NATE 2025年12月25日

2025年并沒有出現科幻小說里那種吸引眼球的AI版本——沒有機器人管家，沒有通用人工智能（AGI）突破性進展的新聞發布會，也沒有什么驚天動地的轉折點。相關的討論常常令人疲憊不堪。GPT-5讓很多人失望。“智能體”成了避不開的熱詞，可那些演示只要你追問一句就會露餡。

然而，當我回顧今年我親眼所見人們創造出的東西——不是那些公告，、不是那些炒作，而是那些已經交付并在實際使用中經受住考驗的作品——我發現自己比預期的更加樂觀。

我想聊聊四件真正改變我認知的事——不是對AI未來的預測，而是我關注的重點及背后原因的轉變。

“技術型” 與 “非技術型” 的界限，徹底模糊了

多年來，我一直抱有這樣一種思維定式：世界上分為技術型人才和非技術型人才，他們身處不同的領域，使用不同的工具。技術人員負責構建產品，非技術人員負責使用產品。這種差異似乎很自然，幾乎是必然的，仿佛是知識工作組織方式的必然特征。

2025年打破了我對這種模式的認知。

打破它的不是某個瞬間——而是我們一次又一次地看到，那些原本不會自詡為技術人員的人，竟然遠遠超越了工程師團隊。這并非因為他們突然掌握了某種傳統意義上的編程技能，而是因為在我們忙于爭論哪種模式最佳的時候，“技術”的定義在我們所有人的潛移默化中發生了轉變。

我認為現在真正的事實是：每個人都會掌握解決自己感興趣的問題所需的技術技能。從某種意義上說，這一直都是如此，但“技術技能”的門檻已經大幅降低。當大語言模型（LLM）能夠將代碼作為工具——當簡單的英語能夠控制計算機——障礙就不再是語法了。不再是不知道正確的函數名或不記得循環的工作原理。真正的障礙完全在于其他方面：對問題的好奇心、迭代的意愿以及對模糊性的適應能力。

我現在每天早上六點都會進行代碼審查，找出我遺漏的地方，并在一個文件里留下記錄，然后一邊喝咖啡一邊查看。一年前，要做到這一點，要么需要我自己編寫腳本，要么需要請別人幫我寫。現在，我只需要描述一下我的需求，如果不太合適就進行調整，直到它正常工作為止。這并非傳統意義上的“技術化”——而是 “技術型” 這個分類本身正在瓦解。

今年我親眼目睹了一些人超越了整個開發團隊，這并非因為他們一直以來都是隱藏的工程師。而是因為他們把工程視為一種可以自主設計的流程，而非需要獲得許可才能加入的 “專屬領域”。他們不會盲目崇拜任何特定模型，完全愿意將低技術含量的東西（模板、驗證器、重試機制）與高技術工具結合使用。他們積極迭代，而且至關重要的是，他們沒有把“主動”與“優秀”混為一談。

市場的反應比我預期的更快。我發現，具有出色創造性問題解決能力的人，求職時被選中的速度比我預想的要快——這和媒體大肆報道的大規模裁員不同，不管報紙怎么說，目前沒有太多證據表明 AI 正在導致整體就業人數下降。但有一個明顯的信號：與 AI 高效協作，本質上是一種創造性的、近乎文科思維的能力。想要展現創造力的技術人才終于有了機會，而一直覺得自己 “搞不了技術” 的創意人才，也發現自己之前對自己的認知是錯誤的。

我認為，明年真正的機遇之一在于那些渴望在自身專業領域邊緣地帶拓展的人。世界的確比十二個月前更加開放。你可以朝著以前受限的方向發展，而那些勇于嘗試的人將會收獲意想不到的驚喜。

提示詞很重要，但衡量標準才是規模化的關鍵

這件事的重要性讓我感到驚訝。

今年我花了很多時間寫關于提示詞的內容，我依然堅持那些觀點——寫好提示詞是一項真正的技能，它能切實影響模型輸出結果的質量。但大約在年中，我開始注意到，那些取得最佳成果的團隊，不僅僅是提示詞寫得巧妙，更重要的是他們找到了衡量輸出結果是否真正有效的方法。

這就是它如此重要的原因：當你能夠清晰地定義“好”的標準，并自動進行檢查時，你就可以把智能體放入循環中，讓它不斷迭代直到達到目標。智能體不會感到疲倦，不會對自己的工作感到抵觸，也不需要鼓勵。你只需告訴它“這樣做失敗是因為X，請修復X”，它就會再次嘗試。一次又一次。只要你衡量的是正確的指標，它就會不斷嘗試，直到成功或真正遇到瓶頸。

這就像給飛機裝上噴氣式發動機一樣，迭代速度快得幾乎不可思議。

提示詞能讓你得到一個不錯的初步嘗試，而衡量標準能讓你把這個嘗試規模化地轉化為可靠的成果。那些同時重視這兩點的團隊，已經開始甩開那些還把提示詞當作全部的團隊。

對我來說，關鍵洞察是我之前低估了這個等式的一半。提示詞是用來傳達你的需求的，而衡量標準是用來確認你是否得到了想要的結果。兩者缺一不可，而大多數人（包括我自己）之前都沒有足夠認真地思考過后者。

我認為，我們對AI質量低下問題的理解可能有誤。

沒錯，互聯網上充斥著AI的垃圾內容。你肯定見過。千篇一律的博客文章，虛假的自信和斷言，以及那些似是而非、令人不安的內容，最終只會讓你比什么都沒看到更沮喪。

我花了不少時間關注這股垃圾內容的浪潮，一直在思考，在AI生成內容如此泛濫的情況下，互聯網和通信會變成什么樣子。我們是否為了追求數量而犧牲了質量，以至于無法挽回？

后來我開始想到印刷機。

普及識字是人類最偉大的成就之一。但問題是：人類所寫的大部分東西并非《基督山伯爵》或《指環王》那樣的巨著。我知道我寫不出那樣的作品！大多數作品甚至連邊都沾不上。印刷術和普及教育帶來了人類產出的爆炸式增長，而其中大部分——顧名思義——都平庸無奇。乏味的備忘錄，令人過目即忘的信件，無人問津的報告。在考古學中，我們稱之為陶片——在陶片上潦草刻畫的文字。只是以前我們不必大規模面對這些，因為傳播成本高、速度慢，而且大多數作品都是幾年內就會消失的涂鴉（更不用說互聯網內容的短暫性了）。

AI加劇了這種現象。事實證明，當每個人都能以近乎零成本獲得寫作工具時，得到的往往是大量平庸的寫作成果。這并不令人意外。每次通信工具普及化，我們都會看到同樣的模式。質量低下并非新鮮事，只是被放大了而已。

讓我感到欣慰的是，平庸之作并非不可避免，而且我們人類有著相當可靠的歷史，能夠從我們自己創作的大量平庸之作中發掘出偉大的作品（比如莎士比亞）。好東西終會脫穎而出。

當你構建起真正的系統——當對生成的內容以及發布前的檢查都嚴格把控——你就能產出遠超大多數人獨立完成的作品。我見過真正能吸引點擊的營銷文案、能獲得回復的郵件，以及效果遠超團隊手動制作的廣告創意。關鍵不在于模型本身，而在于圍繞模型的一切環節。檢索數據來佐證論點；驗證機制來發現錯誤；人工檢查點來應對極端情況；以及在流程的某個環節融入個人品味。

內容信息量是否豐富？是否值得反復閱讀？是否節省時間？這些都是正確的問題，而AI可以幫助你很好地回答這些問題——前提是你構建的系統能夠實現這一點，而不是僅僅將模型連接到發布按鈕然后聽天由命。

我不想生活在一個充斥著劣質產品的世界里。但我不再認為劣質產品是不可避免的未來。那些能夠大規模生產高質量產品的開發者、廣告商和營銷人員，終將取代那些只追求數量的人。選擇壓力是真實存在的，而且我認為人們渴望真實的故事和真正有價值的內容。

討論焦點正從成本削減，轉向質量提升

這一點對我展望未來一年至關重要——但我必須謹慎，避免夸大其詞。這種轉變正在出現，但并非普遍現象。每個人的情況可能有所不同。我能說的是，我親眼目睹了這種轉變，而且我認為其方向很明確。

2025年初，人員配置方面的討論占據了主導地位。“我們可以替換多少人？”我在與高管的每一次會議上都會聽到這個問題，而且這通常是他們問的第一個問題。AI被視為一種削減成本的工具。演示文稿中列出了當前團隊規模、引入AI后的預計團隊規模，以及由此產生的成本節約。

到了第三季度，我接觸到的那些更成熟的運營商開始提出不同的問題。

不是“如何以更低的成本做同樣的事情？”，而是“如何做以前做不到的事情？”我們如何以合理的價格，大規模地為所有人提供最佳客戶質量？我們如何讓以前無法盈利的細分市場也能實現盈利？我們如何擴大產品和服務范圍，而不僅僅是降低成本？

我之所以看到這種轉變，是因為領導者們開始意識到其中的價值。他們看到早期提升質量的實驗比削減成本的實驗效果更好。他們意識到削減成本是有限的——你最多只能削減一兩次，然后就到此為止了；如果削減過度，你只會以更低的價格讓自己變得更糟。

質量提升帶來復合增長。新功能創造新市場。新產品建立新客戶關系。以往不盈利的領域也能實現盈利。增長空間遠不止于此。

仍然會有很多人秉持著我稱之為“粗暴主義”的思維模式——把AI一股腦地塞進去，削減成本，然后就完事了。我并不是說這種思維模式已經消失了。但我越來越看到一些領導者意識到一個重要的事實：那些最終勝出的公司，都是那些將員工的注意力視為寶貴資產的公司。他們以人為本設計AI系統，讓人們能夠將自己的專業知識運用到最關鍵的領域，而不是設計那些試圖將人完全排除在外的系統。這樣做是切實可行的，因為這些系統仍然需要人。

這比“用機器人取代所有人”的愿景更有希望。而且我認為這更準確地反映了未來的發展方向，因為純粹的自動化方法總是會遇到同樣的瓶頸：任何實際工作流程的最后20%都包含所有的判斷，而判斷恰恰是模型目前還不可靠的部分。

注：我并不是說AI革命不會導致工作崗位變動或裁員。如此巨大的變革，這類事件早已屢見不鮮。我更想強調的是，許多領導者開始意識到，為團隊配備“鋼鐵戰衣”能帶來巨大的好處，從而倍增團隊的影響力。我認為這一點令人鼓舞，值得關注。

這一年教會了我什么

一月份，討論的焦點全在新模型發布和基準測試上——這也不難理解，因為當時的熱點都集中在這些方面。每隔幾周，就會出現新的功能提升、新的應用場景或新的推理突破。

到了夏天，我開始注意到一些不同之處。模型改進一直在進行，但它們并非區分成功交付團隊和失敗團隊的關鍵因素。真正有趣的差距出現在其他方面——開發人員實際如何使用模型，新鮮感過后人們繼續使用哪些工具，以及他們如何處理演示和生產之間的過渡階段。

技術與非技術之間的界限正在消融。衡量標準是提示詞未被重視的補充（而非替代品），是實現規模化的關鍵；無論誰來創作，平庸的作品終究平庸，但好的系統能帶來巨大提升。領導者開始意識到，提升質量比削減成本更具價值。這些都未曾出現在基準測試公告或模型發布說明中。它們源于對人們在嘗試構建真正有價值的事物時，哪些方法行之有效的觀察。

這就是我明年要關注的重點。不是因為模型競賽不再重要，而是因為它已經不再是我所關心的大部分工作的瓶頸。

對你而言，今年有什么改變？

本文編譯自substack，原文作者NATE

https://natesnewsletter.substack.com/p/year-end-reflections-why-2025-was

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.