![]()
編輯重點君
近日,吳恩達(Andrew Ng)在首屆Buildathon上發表主題演講,內容圍繞AI輔助編程、快速開發產品原型,以及AI工程師技能需求展開。
吳恩達是人工智能與機器學習領域的國際權威學者。他是谷歌大腦項目的創始人之一,也是在線教育平臺Coursera的聯合創始人。2014年,吳恩達加入百度,擔任首席科學家,2024年吳恩達進入亞馬遜董事會。他近年來活躍于AI投資和創業領域,創立了AI Fund和DeepLearning.AI等項目。
演講內容劃重點:
1、硅谷新箴言:“快速行動,承擔責任”。
AI輔助編程讓獨立原型開發實現10倍加速。原型成本大幅降低使快速多次試錯成為可行策略,真正價值在于在試錯中發現值得深度開發的項目。
吳恩達提出,原型開發對安全性、擴展性要求較低,AI進一步降低了試錯門檻。他推崇“快速行動,承擔責任”(Move fast and be responsible)原則,建議在沙盒環境中大膽實驗,再決定是否投入生產化改造。
2、代碼正在貶值,開發者需要轉型為系統設計者和AI指揮者。
編程工具已經歷多代進化:從GitHub Copilot到IDE,再到高度代理化的編程助手。工具迭代速度創造實質性效率差距,落后半代即可能顯著影響產出能力。
代碼價值本身正在降低。AI可自動生成代碼、遷移數據庫架構,使架構決策變得更可逆。開發者需要從代碼編寫者轉型為系統設計者和AI指揮者,重點把控核心架構與復合型系統構建。
3、工程效率革命,催生“產品管理新瓶頸”。
工程速度提升后,產品決策與用戶反饋成為新瓶頸。吳恩達以親身案例說明:當工程時間從3周壓縮到1天時,花費1周獲取用戶反饋會顯得極其漫長。
他提出數據使用的新范式:不應單純依賴數據做決策(如“數據說選版本三”),而要用數據修正直覺(“為什么我誤判用戶想要版本一”)。通過走廊測試、咖啡店調研、快速原型驗證等方式打磨用戶直覺,建立高效決策循環。
4、“AI時代無需學編程”是史上最糟的職業建議。
吳恩達強烈反對“AI時代無需學編程”的觀點,指出歷史上每次編程工具進步都讓更多人群具備編程能力。他團隊中的CFO、法律顧問、前臺人員均通過學習編程提升工作效率。未來核心技能是“精準告訴計算機該做什么”,這需要理解計算機語言與編程邏輯。非技術人員可通過AI輔助快速掌握基礎編程能力,實現跨領域效率提升。
5、AI工程師奇缺,大學課程卻已嚴重脫節。
計算機專業畢業生失業率升至7%,可企業卻仍面臨AI工程師嚴重短缺。核心矛盾在于大學課程未能及時覆蓋關鍵技能:AI輔助編程、大語言模型調用、RAG/Agentic工作流構建、規范錯誤分析流程等。新興AI工程師需掌握三大技能:使用最新AI編程工具、熟悉AI構建模塊(提示工程/評估技術/MCP)、具備快速原型能力與基礎產品直覺。吳恩達呼吁教育體系加速課程更新,并鼓勵開發者主動擁抱這些變化。
![]()
以下為演講原文:
很高興周末在這里見到大家。我想做的是與大家分享我對AI輔助軟件工程的一些看法,以及我們為什么要組織這次Buildation活動,即一天內從零到產品的快速工程競賽。
我發現,當你嘗試做一些創新的事情時,無論是像AI Fund那樣建立一家初創公司,還是在更大的企業環境中進行創新,預測項目是否可能成功的最大因素之一是速度。有些團隊只需以迅猛的速度執行,就可以讓他們獲得更多的迭代、嘗試更多的事情,成功的幾率就會大大提高。
坦率地說,當我與投資組合公司的工程師或CEO合作時,我非常尊重的一點就是能夠果斷、快速執行的人。順便說一句,我知道當我談論速度時,有時人們會想,“哦,Andrew只是在談論更加努力地工作嗎?”但事實并非如此。就像努力工作肯定有幫助一樣,我知道在世界的某些地方,談論努力工作并不十分正確,但坦率地說,我努力工作,我尊重努力工作的人,就是這樣。
但除了努力工作之外,還需要一定的決斷力,可以讓你執行力爆棚,并嘗試更多的事情,完成更多的工作。而我對AI輔助編程感到興奮的原因之一,是它把我們工作的核心部分提速了許多。
當我回顧我所從事的軟件工作時,我所做的一些工作是構建小型獨立產品的原型,而我所做的一些工作,以及你們很多人所做的工作,是在大型代碼庫上開發生產軟件。如果我們研究AI輔助編程的影響,很難進行嚴格的研究,但也許對于處理大型傳統的生產規模代碼庫而言,AI可能會讓我們的速度提高50%,甚至更高,我不確定。但對于構建小型獨立產品的原型來說,這并不是50%的加速,而是10倍的加速。
我想你們中的許多人都經歷過很多項目,而兩年前這些項目需要三名工程師花六個月的時間才能完成。現在,我們和朋友們可以在周末一起完成這件事。這意味著我們要嘗試新事物,我們可以構建20個原型并看看哪些有效。實際上因為我的時間安排,我往往在周六寫更多代碼。每周六,我都會編寫大量的軟件,然后說,“天哪,這根本行不通!”但我從來沒有告訴過任何人,它們也從來沒有面世過。事實證明,有些人感到焦慮,因為在AI領域,許多概念驗證從未投入生產。這被視為一個問題,但我實際上并不這么認為。對我來說,解決方案不是讓更多的概念驗證投入生產,解決方案是將概念驗證的成本降到如此低的水平,他們根本不會在意你是否構建了20個原型,其中18個失敗,并且永遠無法面世,但這是發現真正有價值的兩個原型的代價,你確實需要花費更多的時間來使其強大、可靠并擴大規模。
事實證明,在構建小型獨立產品的原型上,我們能夠特別快地做到可擴展化的要求是有原因的,坦率地說,如果我編寫的軟件只在我的筆記本電腦上運行,那么對可擴展性甚至安全性的要求就會低得多,因為我并不打算惡意攻擊我自己的筆記本電腦,所以,如果我沒有那么多防火墻也沒關系,只要我不泄露敏感信息或做其他壞事。因此,構建原型所需的工作量要低得多,而且AI正在繼續降低這一成本,同時也使其更加安全。
幾年前,硅谷的口頭禪“快速行動,打破常規”(Move fast and break things)名聲不佳,是因為它真的破壞了一些事情。我認為有些人由此得出的結論是,硅谷發展得太快了,不要發展得這么快,但這是錯誤的。而我的團隊的口頭禪是“快速行動,承擔責任”(Move fast and be responsible)。我發現許多聰明的團隊都有辦法創建一個沙盒環境,這樣你就不會向數百萬人發送可能以某種方式傷害他們的軟件。但是你正在構建一個原型,你正在親自嘗試,假設你不會對自己造成太大的創傷。你知道,如果大語言模型給出了一次錯誤的回答,那么,可以快速行動,但要在安全的沙箱中進行,以便進行原型設計,然后決定是否要采取安全措施,然后再進行衡量。
![]()
AI輔助編程的特點之一是,在過去的幾年里,已經出現了多波創新浪潮,多代創新。我認為兩年前GitHub代碼自動生成是一項巨大的創新,但現在我們已經遠遠超越了這一點。然后就會出現一波支持AI的集成開發環境(IDE)。我當時經常使用Windsurf或Cursor,同時,也出現了一波像Replit、Bolt、V0,也許還有Lovable這樣的企業,然后就在今年早些時候,或者過去幾個月,又出現了那股浪潮,一波高度代理的編程助手,比如Claude Code、Gemini CLI、Codex,你們中的一些人知道,我個人經常使用Claude Code,對吧?但是,我會在兩個月后再說一次我在用什么。
我發現,工具的進化速度非常快,它確實帶來了實質性的變化,使用最新一代工具與不使用最新一代工具實際上會有很大區別。也許大語言模型已經足夠成熟,如果你正在使用,那么有多個模型足以滿足許多商業應用的需求。但編程輔助是正在迅速發展的領域之一,落后半代或一代實際上已經產生了非常實質性的差異。然而,如果使用落后六個月的大語言模型,那么你知道,可能沒關系,對于很多應用程序來說它可能都是可以的。
我看到的另一件令人興奮的事情是,代碼曾經是一種非常有價值的產物,用這種傳統軟件來構建代碼非常困難,代碼非常有價值,需要維護它、更新它,但代碼作為一種產物的價值正在降低,因為AI可以為你編寫它。甚至選擇一種架構也更接近于“可逆決策”,這是杰夫·貝佐斯(Jeff Bezos)的術語,你可以做出決定,如果你不喜歡它,就改變它。
因此,之前,你設置了數據庫模式,你永遠不想改變它。但是現在,如果你有錯誤的數據庫模式,那也沒關系,讓AI為你完成遷移,這并不那么痛苦。所以當我建造時,有時我會在一天內探索三種完全不同的架構,一切都很好。然后,也許下周,我會說,“你知道嗎?讓我們放棄我的代碼庫,讓我們從頭開始重建一切。”因此,這將引發人們以非常新的方式思考軟件。
其中一件令人興奮的事情,我稍后會再談,就是硅谷,我想在座的各位,以及觀看直播的各位,實際上都處于這方面的前沿。我稍后會再談這個問題。
但我在軟件領域看到的最大變化之一是,當構建變得更容易時,然后決定構建什么就成了更大的瓶頸。我一直將此稱為產品管理瓶頸(Product Management Bottleneck)。
因此,在AI Fund,當我們構建產品時,我認為我們試圖推動一個非常快速的迭代循環,我們編寫一些軟件來構建原型,也許是一個快速而粗糙的原型,然后我們做一些產品管理工作,獲取用戶反饋,塑造我們對產品的看法,促使我們更新我們想要構建的內容,我們圍繞這個循環快速迭代,試圖建立用戶直覺,并獲得更好的產品。所以對我來說,這是一個核心循環,在AI Fund、DeepLearning.AI,我的許多團隊都在使用它來推動軟件開發。
由于AI編程輔助和快速工程,我們現在可以比以往更快地構建軟件,這意味著獲取反饋或磨煉我們對用戶真正想要什么的直覺,是一個越來越大的瓶頸。所以之前我花三個星期來構建一個原型,再花一周時間進行設計研究或其他什么的話,那就沒問題了。因此,花三周時間編寫代碼,一周時間獲取反饋,這樣就可以了。但現在,如果我們可以在一天內編寫軟件,那么就需要花一整周的時間來獲得用戶反饋,這感覺就像過了一個世紀一樣。
所以我看到的一個有趣的趨勢是,我的很多團隊越來越多地憑直覺做出決定,因為這是一個非常快的決策過程。你知道,我是一個數據型的人,我熱愛數據,我研究AI數據,我談論以數據為中心的AI。所以很明顯我重視并尊重數據。事實上,我們就像Snowflake,一家數據公司,數據很重要。
但是讓我給你舉一個我做出的決定的例子。史蒂文和我致力于開發一款產品,這款產品尚未發布,所以我不想談論細節,但長話短說,我們有四個產品創意。我喜歡其中一個,但我的團隊不同意我的觀點,所以他們進行了一項用戶調研,以了解用戶喜歡什么,結果數據出來了,我錯了。我喜歡第一版,用戶喜歡第三版。
所以對我來說,使用這些數據的糟糕方式是說,“哦,用戶喜歡第三個版本,讓我們構建第三個版本”,這很好,許多團隊都這樣做,你的決定是由數據驅動的。但對我來說,這是一種非常簡單的數據使用方法。我實際上所做的不僅僅是說“數據顯示版本三,讓我們決定這樣做”。我所做的是花了很長時間仔細檢查用戶數據,我們提出了多個問題,這是其中之一,我真的坐下來反思,“我怎么把事情搞砸了?為什么我認為用戶想要第一版,但數據卻清楚地表明用戶想要第三版?”
因為相比起單純的數據,即數據顯示用戶想要第三版,我更想要根據這個數據進行決策,我想要做的是使用數據來保持我的直覺,然后據此來決定要構建什么。這是一個很大的區別,因為這意味著,我真的花了幾個小時在想,“我怎么把這件事搞砸了?”因為我認為,通過花時間磨煉我的直覺,我不僅可以用更好的方式做出這個決定,還可以以更好的方式做出很多其他決定,以便為用戶提供服務。
鑒于此,我們實際上花費了大量時間思考一系列策略來磨煉我們對用戶的直覺。但是你知道,我們所做的一切都是從親自試用產品開始的,如果你很了解用戶,你的直覺就會很好。而且當你對用戶的直覺很好時,這是一個非常快速的決策過程。詢問朋友、團隊成員、進行走廊可用性測試(Hallway Usability Testing)、詢問一些陌生人,我經常會坐在咖啡店或酒店大堂,非常尊重地抓住陌生人并請他們看看我的產品,我現在仍然這樣做。從原型測試一直到上線做A/B測試,我知道硅谷喜歡A/B測試,當然,我們也進行A/B測試,我們希望產生結果,但對我來說,這實際上是我們投資組合中最慢的策略之一,我們很少使用。但是,這個例子展示的是,當工程加速時會在其他地方造成瓶頸,我們現在必須努力消除這種瓶頸。
我認為你們中的許多人都會被問到這個問題,因為你們中的許多人都是軟件工程師,或者你們的非軟件工程師朋友可能會問:“我應該學習編程嗎?”在結束之前,我想花一點時間來討論這個問題,在過去的一年里,很多人建議其他人不要學習編程,說AI將使其自動化,我認為我們會回顧這是有史以來最糟糕的職業建議。
當編程時,當軟件工程從穿孔卡片發展到鍵盤和終端時,實際上有人當時說,“看,我們現在有了編程機器人,編程非常簡單,就像你不需要軟件工程師一樣”,人們實際上是這么想的。但這是錯誤的。我的意思是,代碼或鍵盤和終端使編程變得更容易,并且更多的人這樣做。當我們從匯編語言發展到更高級的語言、從文本編輯器發展到集成開發環境(IDE)、從集成開發環境(IDE)發展到現在的AI編程輔助時,每一步都在使編程變得更容易。這意味著更多的人應該學習編程。
因此,我認為在AI Fund和DeepLearning.AI,每個人都會學習編程,而且我實際上已經在YouTube上發布過,當我們的CFO知道如何編程時,她可以做的工作會讓她和她的團隊更有效率;當我們的總法律顧問知道如何編程時,他會加快處理保密協議的速度;當前臺人員知道如何編程時,她可以做以前無法完成的工作。所以我發現,我鼓勵你所有的朋友都學習編程。
當我為每個人教授生成式AI這門課程時,有一件事讓我恍然大悟。這是我們在Coursera上推出的增長最快的課程,它旨在讓非技術人員了解生成式AI的商業意義。在幕后,我與一位了解藝術史的合作者湯米?尼爾森(Tommy Nelson)一起工作。他可以用藝術語言、藝術靈感、調色板、流派靈感來編寫Midjourney的提示語,因此他可以創作出像這樣的美麗圖畫。另一方面,你知道,我不懂藝術史,我所能做的只能是提示:“請為我制作漂亮的機器人圖片。”而我永遠無法獲得像湯米那樣的控制權,這就是為什么我們最終使用了他的所有照片,而沒有使用我的。
![]()
我認為,展望未來,不僅對于我們所有開發人員,而且對于每個人來說,未來最重要的技能之一就是能夠準確地告訴計算機你希望它做什么,以便計算機為你完成它,并且在可預見的未來,了解計算機語言,了解編程將使你對計算機有更深入的了解,從而更精細地控制它。并不是說人們需要用10個手指編寫那么多代碼,你可以讓AI為你完成這些工作,但更深層次的理解對于告訴計算機為你做什么至關重要。所以我希望他們能夠出去傳播這個觀點,因為我看到的是,不僅對于軟件工程師,而且對于幾乎所有的知識工作者來說,那些知道如何在AI的幫助下做到這一點的人,在有AI協助的情況下,都會變得效率更高、更強大。因此,我認為讓他們也加入我們,甚至提供幫助,這一點很重要,這樣可以讓在座的所有人的工作變得更加輕松。
我看到的另一個熱點是,人們想知道,我們需要計算機科學專業嗎?因此,我認為近期計算機科學專業畢業生的失業率已經上升到7%左右,這令人擔憂,但我看到的是,AI工程師的短缺。我在《The Batch》中寫過這篇文章,稱之為“生成式AI應用工程師”,但我認為這個名字太拗口了。不幸的是,我看到的是,仍有許多大學尚未升級其課程,無法讓學生了解當今的工作角色。但坦白說,我找不到足夠多的AI工程師,企業無法找到足夠的此類人才。有些人獲得了學位,但是,他們畢業時甚至沒有調用過一次大語言模型。事實上,我最近遇到過一些學生,他們還沒有嘗試過任何AI編程助手,我認為這真的很不幸。
但我發現,當我與許多企業交談時,我們就是找不到足夠的AI工程師。所以對我來說,這些是一些關鍵技能,也是我對于新興AI工程師角色的看法。一是熟悉AI輔助編程,它更加高效。好消息是,學習這些工具并不需要兩年的時間,因為這些工具實際上并沒有存在那么長時間,但這是一項關鍵技能。
我發現真正重要的第二個工具集是熟悉AI構建模塊。由于大語言模型,許多企業或開源或閉源現在已用于prompting、實施RAG、Agentic工作流、如何進行Evals的技術,我發現構建Agentic工作流最重要的技能之一,是推動一套規范的錯誤分析流程的能力,這出乎意料地困難,但這有點像要學習如何使用工具,例如MCP、語音技術棧(Voice Stack)等等。但我發現,這套新的AI構建模塊可以讓你編寫出比兩年前功能更強大的軟件。因此,如果你了解這一點,你就有更多可選構件,可以以組合的方式拼接在一起,來構建新型軟件。
最后一種技能就是這種快速原型制作技能,包括基本的全棧知識。這真的很有趣,我發現我是一個非常糟糕的前端開發人員。我的背景更多的是后端機器學習。但是在AI的幫助下,我是一個很棒的前端。使用AI輔助編程,你可以更輕松地發現前端錯誤,而棘手的后端錯誤仍然需要數周時間才能調試。而且由于產品管理瓶頸,我發現開發人員只具備非常基礎的產品管理技能,所以如果工程師只會像素完美的Figma設計,那就沒那么有價值了。而如果工程師可以擁有更多的用戶意識和用戶判斷力,那么就可以做出一些基本的產品決策,擁有一些用戶直覺和基本的設計決策,這實際上可以讓團隊發展得更快。
因此,盡管最近計算機科學畢業生失業率上升令人沮喪,這是我們需要解決的問題,但我發現硅谷各地的許多企業都找不到足夠擁有相關技能的人才,而就業機會實際上是這樣的,如果你擁有相關技能,那么來吧,你正在尋找工作,與我聯系,我可以向你介紹很多企業。對于很多人來說,確實存在短缺,但這也是真正的機會。
總而言之,我知道我觸及了很多要點,但最后再說幾點。我們中的許多人都處于快速工程的前沿,也許還有另一個術語“氛圍編程”(vibe coding)。我傾向于不經常使用這個術語,因為我認為它會誤導人們認為你只需要去感受氛圍,接受Cursor建議的所有更改建議,是的,你可以這樣做,但事情并沒有那么簡單。當我和一個編程助理一起編程一整天或一個下午時,我會筋疲力盡,這是一項非常耗費腦力的練習,所以我發現“氛圍編程”(vibe coding)這個術語很多非技術人員都會使用它,但我不會在簡歷上寫“我是一個氛圍編程員”。
這導致了工作流程和軟件的很多變化,以及產品管理瓶頸,但還有很多其他的事情,我很高興能和你一起探索。我希望我們今天能做的事情之一是,如果您看到了最佳實踐或工作流程中的奇怪變化,我很想聽聽你們所有人也看到了什么,因為你們正在創新,或者遇到不存在的新問題,然后找到新的解決方案,我發現這很有趣,所以我希望在這里的對話,我們都可以相互學習。
而這也是我們想要組織這次Buildation的原因之一,我清楚地看到,硅谷和其他主要科技中心,甚至其他地方的人們,他們的建設速度比一年前快得多。世界上很多人還沒有明白這一點。我們仍然會遇到有人說:“哦,我正在使用AI進行編程。”您知道,“這就像為我自動完成代碼一樣”這真是太棒了,但我們現在已經遠遠超越了這一點。因此,我希望我們能做的事情之一就是,彼此分享最佳實踐,互相學習,同時也要傳播觀點,讓世界上許多還未達到最前沿水平的人們了解現在所能達到的水平,甚至可能超越我希望你們所有人做的事情,即引領世界進步。
我認為軟件也是其他學科未來發展的先兆。因此,在大語言模型領域,我認為已經存在兩個清晰的價值領域。一是回答問題,你知道,ChatGPT是這方面的市場領導者,只是回答人們的問題。二是編寫代碼。這是兩大價值領域。正因為如此,人們在AI上投入了大量資金,這些工具比其他職業領域的工具已經先進得多。
但我認為,我們在軟件領域看到的很多東西,最終,這些工具也會為許多其他職業領域帶來更好的發展。因此,我們在軟件領域看到的這些真正令人興奮的加速,也將擴展到其他領域。
因此,除了快速工程和加速我們在軟件方面的工作之外,我覺得它甚至為非軟件工程師提供了早期的一課,讓他們知道他們的領域可能很快會發生什么,并為我們自己以及世界上所有知識工作者弄清楚這一點。也許人們也都是知識工作者。我發現這一系列令人興奮的任務,我希望我們所有人都能參與其中,這不僅是為了我們自己的工作,也是為了幫助其他人與我們一起努力。
所以我期待與大家一起度過愉快的一天,非常感謝。
![]()
問答環節
Q&A:
觀眾A:吳教授,我很高興來到這里。我畢業于斯坦福商學院,我的背景是商科。我沒有編程經驗。兩年前我認真考慮過編程,并且研究、編寫了很多Agent。今天我有一次很棒的經歷,因為在親眼看到一個項目之前,我根本不知道它會是什么樣子。
今天早上和你談論Agent的模塊化時,確實產生了共鳴。我們考慮prompt,我們考慮MCP,我們考慮各種各樣的事情,所以我們是否有針對Agent更快速地評估編程?最佳做法是什么?因為每個人都使用不同的工具,每個人都使用規范驅動(spec-driven),而且人們談論的是上下文工程(context engineering),而不是提示工程(prompt engineering),我們提出了自己的工作流程,但有時結果很好,有時則不然。所以我們真的很想聽聽你的觀點,看看我們能做些什么,讓我們做得更好。
吳恩達:坦率地說,AI編程的最佳實踐正在迅速發展。即使今天聽小組成員發言或在走廊里聊天,我也在學習。所以我不知道是否存在一個世界上最好的方案,因為最佳實踐發展得太快了。但我所知道的一些最佳實踐,比如測試驅動開發,我們確定要在其之上構建一些組件,因此要進行更嚴格的測試。而對于那些未在其之上構建的內容(例如前端),我會進行不太嚴格的測試,但對于后端數據庫,我會進行真正的測試,以避免以后無法發現的真正奇怪的錯誤。規范(Spec)很重要。我發現快速迭代確實有助于推動產品進步。我認為問題是如何協調多個Agent的協同工作,我看到很多不同的人做很多不同的事情來協調,感覺就像狂野的西部。
![]()
我認為MCP是一項偉大的進步。MCP面臨的挑戰是API的列表很長,所以我認為最終我們需要開發更具層次化的發現協議。實際上我經常做的一件事就是嘗試閱讀其他人的提示語。事實證明,我成為一個相當不錯的提示語作者的方法之一是,每當有一篇非常酷的研究論文發表時,我有時會去下載開源文件并真正閱讀提示語,變成優秀提示語工程師的唯一方法就是自己嘗試,同時也要閱讀別人的提示語。
關于eval的一件事,Agent稍微成熟一些,決定你構建Agent的能力的最大因素之一,是驅動規范的錯誤分析過程的能力。最佳實踐是,你有一個你知道的AI Agent,例如,下載PDF,提取文本,進行網絡搜索以檢查你是否在與某個被制裁的人打交道,如果你是供應方,你查看數據庫和定價等等。因此,我發現這些Agent工作流能夠快速構建端到端工作流程,然后對端到端工作流程進行評估,然后進行錯誤分析,以便當AI Agent沒有像人類專家那樣行事時,我們能夠真正仔細地將Agent和人類之間的差距歸因于哪個組件的行為不當,這樣它就可以將注意力集中在正確的組件上。
目前,我發現推動錯誤分析流程的團隊之間仍然存在很大差異。這樣一來,你就不必猜測要做什么了,Agent能診斷出哪里有問題,哪里表現都不佳,并真正將注意力集中在這一點上。它擁有一套非常系統化的評估系統,并且非常有系統性并且觀察AI Agent在哪些方面比人類專家做得差,并利用它來集中注意力,我希望你可以把它教給所有人,它對團隊的速度有很大的影響。
觀眾B:目前這種AI編程的限制是什么?就像我們可以看到它正在創建SaaS應用程序,我們已經看到了,但是大型后端軟件呢,比如,RDBMS是如何制作的。您是否看到了AI,現在可能不需要幾十年的時間來建立數據庫。您認為這可能從中獲得很多幫助嗎?
吳恩達:我曾聽到很多Anthropic的研究人員很久沒有手寫過一行代碼了。所以我認為我們正在看到用AI編程代理編寫的真正嚴肅的軟件。我所看到的是,對于更常見的任務,比如正常的前端后端開發,有了更多的訓練數據,所以在這方面表現出色。順便說一句,事實證明它非常善于實現一個transformer神經網絡,因為有足夠多的數據。但對于真正奇怪的極端情況或有時底層GPU編程,訓練數據較少。因此,它們實際上不太可靠,或者對于構建其他人尚未實現的非常奇怪的研究算法這些極端情況而言,你知道,你需要在提示語中降低層次。而對于前端來說,有很多React前端可以做高級提示,并且會有一定程度的合理解釋。然后你會發現,從最近的進展來看,模型確實變得非常好。所以我認為Claude4是一個驚人模型,GPT-5也是一個驚人的模型,但我發現它們的很多力量不僅僅是一個模型,而是Agent團隊,你知道那些云端代碼,比如Gemini CLI或任何圍繞這些構建器的東西。
我認為有趣的研究表明了這一點,如果你有一項人類可以完成的任務,那么兩年前,AI還無法完成人類需要30秒才能完成的任務。而現在的情況是,人類需要一分鐘、五分鐘、十分鐘、二十分鐘才能完成的任務,對于人類來說難度隨著要完成的時間增長成倍增加,而現在AI可以越來越自主地做這些事。這是一個非常令人興奮的趨勢,在AI的影響下,人類在一定時間內能夠編寫的代碼量迅速翻倍。
觀眾C:所以從像Agentic Coding這樣的技術來看,AI是新的電力,這可以追溯到使用圖形處理器進行深度無監督學習。請問您還堅持什么世界仍未普遍接受的觀點?
吳恩達:順便說一句,我有點懷念那些我說了些什么卻沒人相信我的日子。然后我記得當我說我們必須擴大機器學習的努力時,很多人不相信我,對吧?然后我就默默地為自己努力了很長時間,最終人們開始接受我的觀點。現在我真的很擔心我可能會說一些愚蠢的話,然后人們就會相信我。
我認為未來幾年還有很多工作要做,將大量企業工作流程實現為Agent工作流。有一件事我覺得很令人興奮。我認為人們仍然低估了語音堆棧(voice stack)的力量。我認為未來將會有更多基于語音的應用程序受到廣泛贊賞。我認為視覺AI的發展也有點慢,最有價值的圖像類型是PDF文件的圖像。有人告訴我,人類每年產生超過一萬億頁的文檔,那么Agentic文檔提取真的會這樣流行起來,能夠提取多個PDF文件進行下游處理。也許還有另一件事人們還不相信我,我認為每個人都應該學習編程,而不僅僅是軟件工程師等等。
觀眾C:您是指不借助Agentic AI的幫助自學編程,還是借助Agentic AI的幫助學習編程?
吳恩達:應該在AI的幫助下學習編程。但就我的團隊、AI Fund和DeepLearning.AI而言,每個人都學會了編程,我看到很多職責不是軟件工程師的人做的事情卻更有效果。他們不會成為軟件工程師,而且我也不希望每個人都成為軟件工程師。但是你知道,當非技術領域的非技術人員學習編程時,你會成為一個更好的營銷人員,一個更好的招聘人員,一個更好的人力資源專業人士,一個更好的財務專業人士。所以我認為世界仍需要相當長的時間來解決這個問題。
觀眾C:謝謝教授。因此,當今使用的很多模型都是在已經編寫的軟件上進行訓練的。現在,在未來,新的軟件構建模式將如何出現并傳播到這些模型中并得到廣泛傳播?這個機制是什么樣的?
吳恩達:你知道,有一件事我很好奇,在計算中,我們構建了抽象層,然后有時會有一些低層次的抽象層不是很好或者相當不錯,但我們只是把它放在一邊,然后我們只是在它的基礎上進行構建。例如,我認為Linux很棒。另一方面,我不知道,我們可能永遠都會被他困住,也許還有比Linux更好的操作系統可以發明。但其上已經構建了太多內容,可能不值得現在嘗試改變。所以我有點疑惑,你知道8086匯編,對嗎?坦白說,我們可能會被困住很長時間,但沒關系。因此,我有點懷疑,既然互聯網上有這么多Python和JavaScript代碼,是否會讓Python和JavaScript成為抽象層,或者C++和Java或其他什么,我認為如果是這樣的話會沒問題,因為它沒有那么糟糕,但是如果有人發明了一種新的編程語言,那也沒關系。正如我剛才提到的,我們在較底層的GPU編程方面遇到了很多困難,因為沒有足夠的數據。
哦,還有一件有趣的事。LLaMA論文。使用多版本的LLaMA論文和Agentic工作流來生成編程難題,所以他們讓AI長時間思考來生成編程難題和解決方案,這會生成數據來訓練下一代模型,以便快速解決相同的編程難題。因此我認為,由于具有agentic loop的AI系統可能需要很長時間才能解決這些難題,這會生成數據來訓練下一代AI,以嘗試更快地解決問題。因此,存在一條通往合成數據生成的道路,我認為這也非常令人興奮。
觀眾D:謝謝你,Andrew。我有一個問題。這是非常開放式的。因此,當我們談論大語言模型時,從最基本的層面上講,它是根據前一個標記來預測下一個標記,對嗎?但是當我們談論AGI時,現在人們對AGI的到來贊不絕口,當我感覺到,當我將它與人類思維進行比較時,人類基本上是基于直覺、基于信念來思考,還有很多其他因素參與其中。但是為了達到AGI,我們的瓶頸基本上就是意識。就大語言模型或將其發展為AGI而言,您認為這個瓶頸將如何發展,使模型能夠超越這個瓶頸,不再僅僅預測下一個輸出,而是去預測我們作為人類所做的事情,根據信念、勇氣和意識來預測我們人類所做的事情。這是不是太遠了?
吳恩達:那么讓我先談談AGI這個概念,然后再討論AI的進展。所以我覺得,AGI已經成為一個炒作術語,而不是技術術語。我認為我所知道的最初的定義是能夠完成人類相同智力任務的AI。而且我們大多數人都可以在全新的環境中學習駕駛汽車,比如在野生動物園,或者我們大多數人真的花了幾十個小時才學會駕駛飛機,或者學會駕駛船只,所以這些都是人類可以完成的任務。它們實際上距離AI所能做到的還很遠。所以我認為這實際上離我們設想的AGI還很遠。但出于各種經濟、商業或公關原因,許多公司一直在拋出AGI的替代定義來制造炒作或公關或其他什么。現在的情況是,對AGI的定義有很多不一致的地方,我不明白,很難知道人們在使用AGI時究竟在談論什么,這就是為什么我懷疑當一些公司宣布他們達到AGI時,我認為不會有一個技術里程碑或營銷里程碑。就像測序人類基因組的例子一樣,結果發現有兩個群體在公關、競爭等等方面展開競爭,最終決定,“我們就宣布成功吧。”他們召開了一次聯合公關會議,宣布成功,然后他們又回到了實際測序人類基因組的真正工作中。因此經濟學家往往會說:“我們為什么不直接宣布我們達到了AGI?我甚至不知道這意味著什么。”根據一些定義,我認為AGI幾十年前就已經出現了。所以我實際上真的很想知道,我們是否應該只是鼓勵公司,讓我們宣布成功,然后讓我們回到AI的真正工作。它可能會消除一些炒作并形成一個更健康的生態系統。我不知道,我可能會因為這個提議而陷入麻煩。
現在就我們的AI、意識的實際進展而言,我不知道如何衡量意識。意識是一個重要的哲學問題。但在哲學中,卻存在著這樣的問題:“你怎么知道我是否有意識?你怎么知道我是否有自我意識?”或者在哲學上有僵尸的概念。也許我沒有意識,但我只是表現得好像我有意識,而你卻看不出來。所以我認為我們已經決定在人類社會中,我們都不知道對方是否有意識,但假裝對方有意識被認為是禮貌的。我認為我對計算機也有同樣的感覺。對我來說,計算機是否有意識是一個哲學問題,而不是科學問題。因為據我所知,沒有針對意識的測試。我并不是否認哲學問題的重要性。它們很重要,但這將是人們可以爭論幾個世紀卻永遠無法解決的一個問題。因此,作為工程師和科學家,我只能說,我不知道計算機是否有意識,就像你不知道我是否有意識一樣。因此,如果我們將計算機的行為與智能人類的行為進行比較,就會發現兩者之間仍然存在明顯的差距。但在某些地方計算機遠遠超越人類,在某些地方計算機又遠遠不如人類。因此我認為完全縮小與人類的差距似乎真的很困難。我認為這可能需要好幾十年的時間,主要是因為計算機的設計原理與生物學截然不同。因此,人類大腦具有一些計算機難以比擬的優勢。對于計算機來說,有一些令人驚嘆的優勢是人類難以比擬的。所以我覺得我最終可能會做的就是專注于構建東西。
觀眾D:謝謝,Andrew。我有一個問題,關于您之前提到的話題,計算機科學對高校學生意味著什么?我當然知道顯而易見的答案是每個人都應該開始使用這些工具,以提高他們所構建的任何東西的效率。但我的問題是關于更基礎的東西,比如我們將重點關注到計算機科學基礎知識方面的學習內容。比如,是否仍然需要知道如何進行漢諾塔問題的遞歸或如何遍歷圖表?是否仍會通過網絡了解編譯器設計的工作原理?或者也許現在或將來編寫的編程或語言等問題將專門為大語言模型設計,而不是供人類去學習編寫代碼。所以我想知道,對于一個上大學的孩子來說,除了使用這些工具之外,他的重點還應該放在構建基礎知識上,以便他能夠擴展計算機科學領域本身嗎?
吳恩達:所以我覺得,作為一名計算機科學人員,我學到的東西有些現在已經過時了,但也不是那么多。我認為計算機科學學位并沒有教授很多有價值或有用的信息。我發現很多計算機科學課程存在的更大問題是,它們沒有教授極其重要的新知識,課程尚未適應,有些東西已經過時了。舉例來說,坦率地說,現在不要要求我記住JavaScript語法,對嗎?所以我認為諸如此類的事情并不那么重要。但是很多計算機科學基礎知識,例如了解數據是如何存儲的,數據庫模式是什么,這些東西如何擴展或不擴展?什么是網絡?比如抽象層是什么?你正在構建的堆棧是什么?我認為這些基礎知識可以讓具有更深層次計算機科學知識的人仍然能夠引導AI系統設計和構建更強大的可擴展系統。我想,我們中的許多人都有過這樣的經歷,AI coding Agent會獎勵黑客,就像我發生在你身上一樣,對吧?比如刪除所有測試,因為這是通過測試的最快方法。AI coding Agent會做這樣的事情。我認為具有更深計算機科學基礎的人能夠更好地思考解決問題。所以我發現這非常有價值,我的直覺是,兩三年前計算機科學系教授的東西,也許70%、80%仍然高度相關且值得了解。但我們也確實需要增加這些非常有價值的新知識,我認為許多大學對此的適應相對較慢。
觀眾E:你好,Andrew,謝謝你的主題演講。當天早些時候,您談到了產品管理瓶頸,即與人、用戶和陌生人一起測試的問題。所以我想知道您是否設想我們將使用AI來真正解決這個瓶頸,比如,您知道,促使大語言模型扮演產品用戶并測試應用程序等。您有設想嗎?如果是的話,那么如何設想呢?
吳恩達:是的,事實證明有很多人在做這樣的努力,實際上剛才有人,Ash抓住我并向我展示了一些可以做到這一點的產品,但事實證明有很多關于使用simulated agent進行用戶調研。所以我可以模擬100個角色,甚至以角色的身份進行調查,甚至可以回答他們,然后測試我的產品。所以現在有許多活躍且令人興奮的研究是,我如何校準由100名simulated agent組成的群體,使其能夠說出像提示語的話?比如:“你是這個年紀的這種人,適合這份工作。告訴我你的想法。”所以如何構建這個simulated agent集合,以便您得到的答案能夠很好地與用戶群體的行為相匹配。我認為這是第一步。我想我們中的許多人,如果我有一個產品創意,集思廣益,從一個默認的人格就能得到第一手反饋實際上已經相當不錯了。所以我認為這項研究有望繼續下去。
但這實際上是一件事,很多人的反饋是,這些信息在互聯網上并不存在。例如,當AI Fund構建大量B2B產品時,我們會與金融專業人士或合規專業人士等合作。互聯網上并沒有太多關于他們對不同產品特性的反應的數據。因此在這種情況下,大語言模型沒有上下文,他們不了解他們為之構建軟件的特殊工作。然后通過某種方式從真實的人那里獲得反饋或仍然很重要。我們是否會派遣AI Agent去采訪他們,而不是我們去與他們交談,我認為這實際上是一個非常令人興奮的領域。他們提出了一個產品管理問題,我認為我很有動力,看看我們是否可以找到方法來幫助你解決這個問題。
觀眾E:好的。非常感謝,Andrew。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.