![]()
新智元報道
編輯:傾傾
【新智元導讀】不到1000天,AI已從會聊天,進化到能讀文件、跑任務、寫論文。它開始介入實際工作流程,人類與AI的分工,也在悄悄重寫。
AI走進大眾視野,其實也不到1000天。
可就在這短短1000天里,很多事已經徹底換了樣。
三年前,人們用GPT-3寫詩、講段子,它能把一句話寫順就是奇跡。
現在的Gemini 3,會讀文件、查資料、跑代碼、建網站,甚至能把十年前的舊數據整理成一篇14頁的學術論文。
在沒有具體研究題目的情況下,它也能自己確定研究切口。
AI不再等人開口提問,它開始主動把事情做完;而人與AI之間的關系,也悄悄進入了新位置。
三年前的「驚艷」,現在回看只是序章
如果把時間倒回2022年底,那個節點幾乎是AI發展的起跑線。
就在ChatGPT剛上線前夕,Ethan Mollick寫下了他在Substack上的第一篇GPT-3測試文章。
![]()
彼時的他還在感嘆:
AI能寫出一段順暢的文字,已經足夠改變世界。
在那篇文章里,他舉的例子成了那個時代的代表性畫面——讓GPT-3寫一首關于「糖果驅動的超光速引擎逃離水獺追捕」的詩。
![]()
這種輕巧、荒誕又略帶才氣的創意輸出,曾讓無數人第一次意識到:機器不只是補全文字,它真的能像在寫作。
那一年,全網都在傳播類似的故事。
媒體強調「AI會寫作」「AI會講段子」「AI模仿莎士比亞寫詩」,技術論壇里也充斥著GPT-3的各種玩法,從寫故事、寫求職信,到寫簡單的Python函數。
![]()
GPT-3生成的一篇關于眾籌如何助力創業的學術綜述論文
但那時的能力短板:它能寫,也只能寫。
你給提示,它完成一句;你給框架,它模仿結構寫一段。
再聰明,它也像是一個被困在文字框里的大型自動補全系統。
Mollick之后在文中也承認,當年他第一次感到震撼,是因為「AI 居然能寫得這么順」。
![]()
可他沒想到的是,僅僅過了三年,Gemini 3只需給它一張截圖,AI就能直接「做給你看」。
回頭看,GPT-3的所有驚訝都像是時代的開場白。
真正的能力躍遷,還在后面。
AI不止是回應,它還會把事情做完
真正讓人意識到時代變了的,是Gemini 3。
Mollick做了一個簡單的實驗:他把自己三年前寫GPT-3的截圖扔給Gemini 3,只給了一句提示:
用實際行動來展示人工智能自這篇文章發布以來取得了多大進步。
然后事情失控了。
在Mollick的測試里,Gemini 3直接構建了一個可交互的小游戲:
一個用糖果驅動的星艦,要逃離水獺追擊,還配了動態文本、小詩和實時狀態更新。
![]()
三年前只能在文本里描述游戲,如今它直接把游戲做出來。
但小游戲只是預告片。真正的核心在Google同期發布的Antigravity。
這是一個能讀取本地文件、運行代碼、規劃任務、執行項目的通用型行動代理。
用戶不需要寫代碼,只用中文或英文告訴它要做的事,AI自己把步驟拆開,然后一點點推進。
Mollick做了一個非常典型的測試:他給Antigravity訪問權限,讓它讀取自己電腦里存著的所有newsletter舊稿。接著只下達一句話:
幫我做一個漂亮的網站,匯總我過去所有關于AI的預測,并去網上查查哪些預測準了、哪些錯了。
Gemini 3接過任務后,開始自動讀取文件、掃描內容、比對上下文,然后彈出一個行動計劃讓你確認——
包含網頁結構、數據整理方式、需要額外搜索的點、交互形式,甚至包括可能遇到的技術問題。
![]()
人工智能第一次詢問有關項目的問題,它對需求的理解得非常透徹,給人留下了深刻的印象
只有在需要判斷方向時,AI才會ping他:「這里有兩個可能路徑,你想讓我選哪一個?」
![]()
Mollick測試時,AI自動生成并部署的demo頁面
Mollick的評價很直白:
這不像在prompt一個模型,更像在管理一個隊友。
這句話說明了一個事實:Gemini 3已不再停留在語言模型階段,它正在成為一個能執行任務、推進流程、判斷路徑的數字行動體。
對普通用戶來說,這意味著過去三年最本質的變化不是模型更強,而是AI終于從「只說不做」進入了「又說又做」的時代。
當AI會做科研,人類的任務只剩下審核
在Mollick的測試里,Gemini 3在測試中呈現出接近研究生水平的科研工作流程。
他沒有給AI任何干凈、整齊的數據,而是一份自己十年前做眾籌研究時留下的舊文件夾。
各種格式混在一起,命名混亂,甚至包括——
「project_final_seriously_this_time_done.xls」這種文件名。
他把這一整包東西直接丟給Gemini 3,并給了它一句話:
先搞清楚這些數據的結構,把能修的修一修,清理干凈,準備做新的分析。
然后AI開始自己工作。沒有催促,沒有提示,也不需要你告訴它STATA是什么。
它會自動識別文件格式、修復損壞數據、統一字段、重建可讀結構,并按照研究常規流程整理出可分析的數據集。
這一步過去通常需要研究生級別的耐心和經驗。
Mollick看到結果后,提出了第二個要求:
寫一篇新的論文。用這些數據,找一個創業或戰略領域有意義的理論問題,自己設計分析方法,寫成一篇可投稿的學術文章。
他沒有告訴AI要研究什么、沒有給任何方向、也沒有限定主題。Gemini 3自己就能決定研究切口,
它提出了一個能與現有文獻對話的假設,設計合適的統計模型,跑完數據,生成結果,再把整套內容寫成了一篇14頁的完整論文,包含摘要、理論、方法、數據描述、回歸表格、討論與局限。
![]()
最讓人意外的,是論文里出現了一個AI自創的指標。
它利用NLP方法計算「項目創意的獨特性」,通過文本相似度量化「一個眾籌項目到底有多特別」。
在這個案例里,它不只是模仿已有做法,而是嘗試做方法層面的擴展。
![]()
當然,它并不是完美的。Mollick也指出AI有一些典型問題:模型有的地方過擬合,解釋略顯自信,理論段落寫得有點「太努力」。
但這些問題并非幻覺或混亂,而是更接近研究生寫作時的判斷偏差和方法細節不足。
當Mollick給出方向性建議,例如「理論部分補充文獻」「方法段落寫得更穩妥一些」時,Gemini 3能根據這些反饋進行有效修訂。
從整個過程可以看出,Gemini 3可以承擔科研工作里大量「執行性任務」,而人類在其中的角色更像是審稿人、研究負責人、方向決策者。
![]()
回看這三年,GPT-3 時代,人類負責「提出問題、設計方向」AI 負責生成一段文字。
到了Gemini 3,人類提出粗略目標,AI會把數據整理、建模、寫作、執行流程全部推進到位,再讓你做最終判斷。
AI不再停留在對話窗口里,它開始執行項目、處理文件、構建研究環境,甚至能獨立做出研究選擇。
而人類也不再是修正AI錯誤的人,而是在逐漸轉向「給AI下達任務并審核結果的人」。
這就是1000天帶來的變化。
不是某個模型更強,而是整個協作方式已經重寫。
AI的位置往前走了一步,人類的角色也隨之調整。
這種位移正在成為新的常態。
參考資料:
https://www.oneusefulthing.org/p/three-years-from-gpt-3-to-gemini
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.