<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.2連肝7天,300萬行代碼造出Chrome級瀏覽器

      0
      分享至


      新智元報道

      編輯:定慧 艾倫

      【新智元導讀】一個大模型持續(xù)寫代碼,能寫多久?一小時?一天?還是像大部分AI編程工具那樣,完成一個任務就結束對話?Cursor的CEO MichaelTruell決定搞一次極限壓力測試!

      Michael Truell讓Cursor中的GPT-5.2連續(xù)運行了整整一周

      不是一小時,不是一天,而是不眠不休,晝夜不停,168小時持續(xù)寫代碼。

      結果?

      300萬行代碼。數千個文件。

      AI完全從零構建出一個全新瀏覽器。


      而且,還是Chrome那種瀏覽器。

      HTML解析、CSS布局、文本渲染、還有一個自研的JavaScript虛擬機——全是AI自己寫的。

      Michael Truell輕描淡寫地發(fā)了條推文:它基本能跑!簡單的網頁能快速且正確地渲染出來。


      一個模型究竟能跑多久

      傳統(tǒng)的AI編程工具,比如Github Copilot和早期的其他IDE,都是一問一答模式。

      對話長度有限,上下文有限,任務復雜度有限。

      后來出現了所謂的Agentic編程——Claude Code、Cursor Agent、Windsurf等工具讓AI可以自主執(zhí)行多步任務,讀取文件、運行命令、修復錯誤。

      這已經是很大的進步,但大多數情況下,任務仍然以分鐘計算,最多幾小時。

      AI完成一個功能,人類review,然后繼續(xù)下一個任務。

      但沒有人嘗試過讓一個模型連續(xù)跑一周。

      直到GPT-5.2。

      Cursor團隊讓GPT-5.2持續(xù)運行了整整一周,不是斷斷續(xù)續(xù),而是連續(xù)工作


      在這一周里,它:

      • 寫下了超過300萬行代碼

      • 創(chuàng)建了數千個文件

      • 執(zhí)行了數萬億個token

      • 從零構建了一個完整的瀏覽器渲染引擎

      一個模型究竟能運行多久?

      答案是:理論上,可以無限

      只要基礎設施穩(wěn)定,只要任務足夠明確,AI就能持續(xù)工作——不眠不休,不吃不喝,7×24小時全年無休。

      就像澳洲的放羊大叔的「賽博黑工」。

      但實際上,不同模型的「耐力」差異巨大。

      上下文窗口是第一道門檻。

      早期的GPT-3.5只有4K token上下文,意味著對話稍長就會失憶。

      Claude 3推出了200K上下文,GPT-4 Turbo跟進128K,Gemini 1.5 Pro更是號稱支持100萬token。

      但上下文長度只是理論值——真正考驗的是模型在長任務中能否保持一致性、專注度和執(zhí)行力

      Cursor團隊在實驗中發(fā)現了關鍵差異。


      在Cursor這篇官方博客中,團隊在實驗中發(fā)現了關鍵差異:

      • GPT-5.2能長時間自主工作,遵循指令精準,保持專注不偏離;

      • Claude Opus 4.5傾向盡早結束,走捷徑,頻繁把控制權交還給用戶;

      • GPT-5.1-Codex雖專為編碼訓練,但規(guī)劃能力不如GPT-5.2,所以容易中斷。

      用更直白的話說:Opus像個急躁的實習生,干一會就想問「這樣行不行?我先交了哈」;


      GPT-5.2像個老練的高級工程師,交代清楚任務就埋頭干到底。

      這也是為什么Cursor官方宣稱:GPT-5.2是處理長期運行任務的前沿模型。

      不止瀏覽器。

      Cursor還透露了其他正在運行的實驗項目:JavaLSP、Windows 7模擬器和Excel克隆。

      數據都很夸張,AI自己不停地寫了55萬行代碼、120萬行代碼和160萬行代碼。(話說,Excel代碼比Windows還多點,因吹斯汀)


      多智能體系統(tǒng)協(xié)作

      一個模型在一周內寫300萬行代碼,注意是不停的寫,沒有人類干預!

      這顯然不是一個模型「單打獨斗」,怎么做到的?

      Cursor團隊透露了他們的秘密武器:多智能體系統(tǒng)(Multi-Agent System)


      最初,他們嘗試讓所有Agent平等協(xié)作,通過共享文件來同步狀態(tài)。結果發(fā)現:

      Agent會持有鎖太久,或者干脆忘記釋放鎖。二十個Agent的速度下降到相當于兩三個Agent的有效吞吐量。


      這像極了人類團隊中常見的問題:會議太多、溝通成本高、責任邊界不清。

      最終有效的方案是分層架構

      • 規(guī)劃者(Planners):持續(xù)探索代碼庫,創(chuàng)建任務,進行高層決策

      • 執(zhí)行者(Workers):專注于完成具體任務,不關心全局,提交后繼續(xù)下一個

      • 評審(Agent):判斷每輪迭代是否合格,決定是否進入下一階段

      這幾乎是人類軟件公司的組織架構:產品經理/架構師負責規(guī)劃,程序員負責執(zhí)行,QA負責評審。

      但區(qū)別在于——這是成百上千個Agent同時工作

      Cursor團隊實現了上百個Agent可以在同一個代碼庫上協(xié)同工作數周,幾乎沒有代碼沖突。

      這意味著AI已經學會了人類團隊需要多年才能磨合出的協(xié)作默契。

      瀏覽器的「護城河」

      比你想象的要深得多

      如果聽到「不就是個顯示網頁的軟件嗎」這種評價,所有做過瀏覽器內核的工程師大概都會苦笑。

      在計算機科學的鄙視鏈里,手寫瀏覽器內核的難度,僅次于手寫一個操作系統(tǒng)。

      為了讓你對這300萬行代碼有個概念,我們需要看一眼谷歌的Chromium(Chrome的開源母體)。

      作為人類軟件工程的巔峰之一,Chromium的代碼量早已突破3500萬行

      它不僅僅是一個軟件,本質上已經是一個「偽裝成應用程序的操作系統(tǒng)」。

      GPT-5.2挑戰(zhàn)的究竟是什么?

      首先是CSS的「混沌理論」。

      網頁排版從來不是簡單的堆積木。

      CSS標準里充滿了各種歷史遺留的怪癖、層疊規(guī)則(Cascade)和復雜的繼承邏輯。

      一位前火狐瀏覽器工程師曾打過比方:實現一個完美的CSS引擎,就像是在模擬一個物理法則隨心所欲變化的宇宙。你改動一個父元素的屬性,可能導致幾千個子元素的布局瞬間崩塌。

      其次是「虛擬機里的虛擬機」。

      這次AI不僅寫了界面,還寫了一個JS虛擬機。

      現代網頁跑的JavaScript代碼需要內存管理、垃圾回收(GC)和安全沙箱。

      稍微處理不好,網頁就會吃光你的內存,或者直接讓黑客穿透瀏覽器接管電腦。

      最要命的是,它選了Rust。

      Rust這門語言以「絕不妥協(xié)的安全」著稱,它的編譯器就像一位極度神經質的考官。

      人類工程師在寫業(yè)務邏輯時,往往要花一半的時間和編譯器「吵架」,處理借用檢查(BorrowChecker)和生命周期問題。

      AI不僅要懂業(yè)務,還得在幾百萬行代碼的規(guī)模下,讓這位「考官」挑不出毛病。

      能在七天內把這些硬骨頭啃下來,并且讓它們協(xié)同工作,這已經不是簡單的「寫得快」了,這意味機器開始具備了頂級的架構掌控力。

      當AI能夠「忍受孤獨」

      但這則新聞真正的炸點,其實不在于瀏覽器本身,而在于那個「Uninterrupted」(無中斷)

      這是AI進化的分水嶺。

      在此之前,我們熟悉的AI編程工具(比如早期的Copilot)的情況是:你寫個函數頭,它補全五行代碼;你發(fā)個指令,它生成一個腳本。

      它們的記憶是碎片化的,注意力是短暫的。

      一旦任務稍微復雜一點,比如「重構這個模塊」,它們往往會顧頭不顧尾,改了這頭壞了那頭,最后還得人來擦屁股。

      但這次不一樣。這是一次「長時任務」的勝利。

      這300萬行代碼分布在數千個文件里。

      當AI寫到第300萬行時,它必須依然「記得」第1行代碼里定下的架構規(guī)矩;

      當渲染引擎和JS虛擬機打架時,它必須能回溯幾萬行代碼去尋找Bug的源頭。

      這168個小時里,GPT-5.2肯定寫出過Bug。

      但它沒有停下來報錯等待人類投喂答案,而是自己讀取錯誤日志,自己調試,自己重構,然后繼續(xù)前行。

      這種「編寫-運行-修復」的自主閉環(huán),曾經是我們人類工程師最引以為傲的護城河。

      現在,這條護城河被填平了。

      我們正在目睹AI從「聊天伴侶」向「數字勞工」的質變。

      以前我們指揮AI做「任務」,比如「寫個貪吃蛇」;

      現在我們指揮AI做「項目」,比如「造個瀏覽器」。

      沉默的螺旋

      雖然這個AI版瀏覽器的成熟度距離Chrome還有很長的路要走,但它證明了路徑的可行性。

      當算力可以轉化為極其復雜的工程實施能力時,軟件開發(fā)的邊際成本將趨近于零。

      這場實驗最令人震撼的,其實不是屏幕上那個渲染出的網頁,而是那個在后臺沉默運行了整整七天的進度條。

      它不眠不休,不急不躁,以每秒數千字符的速度構建著數字世界的基石。

      也許我們該重新審視「創(chuàng)造」的定義了。

      只有當工具開始獨自在深夜里解決問題時,我們才明白,它不再只是工具,而是我們的同行者。

      從澳洲大叔的「賽博黑工」

      到AI長時任務

      用5行代碼逼瘋硅谷的澳洲放羊大叔,其實只做了一件事情,就是讓AI不達目標不能停止。


      至于Prompt.md寫了什么命令,并不是重點。

      就像今天Cursor CEO搞的這個極限壓力測試一樣,目標就是造一個Chrome、造一個Windows、開發(fā)一個Excel,只要沒完成目標,AI就要一直運行下去。 回到最開始那個問題:

      一個AI究竟能自己干多久?

      物理上的答案是無窮。只要你有足夠的算力、穩(wěn)定的基礎設施、清晰的任務定義,AI可以無限運行下去。

      但更重要的是,這改變了軟件開發(fā)的經濟學。

      傳統(tǒng)軟件開發(fā)的主要成本是人力和時間

      一個10人團隊開發(fā)一個復雜項目,可能需要6個月到數年。每個月的人力成本可能是幾十萬到上百萬。

      現在,AI可以在一周內完成原本需要數月的工作。

      成本可能只是一些token費用,Emad Mostaque(Stability AI前CEO)猜測Cursor瀏覽器項目可能消耗了約30億個token。

      他還有一個想法:用多少token能夠重寫一套Windows級別的操作系統(tǒng)?成本如何?


      Token是越來越便宜的,就像之前的水和電,最終基于token的算力也會變得極其廉價。

      于是,軟件經濟學就被徹底顛覆。比如,軟件按照授權付費的方式恐怕要消失了。

      在2026年的今天,軟件開發(fā)正在經歷一場基因級別的變異。

      從前,代碼是人類一行一行敲出來的產物。

      未來,代碼可能只是人類意圖的自動展開:你描述你想要什么,AI就能把它變成現實。

      一個模型能跑多久?

      只要你需要,它就能跑下去

      參考資料:

      https://x.com/mntruell/status/2011562190286045552

      https://x.com/leerob/status/2011565729838166269

      https://cursor.com/cn/blog/scaling-agents


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “每賣一輛問界,13.6萬流向華為”,賽力斯最新披露來了

      “每賣一輛問界,13.6萬流向華為”,賽力斯最新披露來了

      智能車參考
      2026-01-14 17:14:37
      伊朗高層48小時轉移15億美元出境,哈梅內伊兒子轉了3.28億美元

      伊朗高層48小時轉移15億美元出境,哈梅內伊兒子轉了3.28億美元

      桂系007
      2026-01-15 14:15:21
      寶能姚振華實名舉報,相關部門回應:舉報不實,拍賣正常推進

      寶能姚振華實名舉報,相關部門回應:舉報不實,拍賣正常推進

      南方都市報
      2026-01-15 11:04:11
      原來他就是聶衛(wèi)平長子,移民日本入日籍娶日本妻,拒絕讓兒子姓聶

      原來他就是聶衛(wèi)平長子,移民日本入日籍娶日本妻,拒絕讓兒子姓聶

      以茶帶書
      2026-01-15 14:14:27
      開年暴擊,四川某光伏巨頭清倉式裁員!

      開年暴擊,四川某光伏巨頭清倉式裁員!

      黯泉
      2026-01-15 10:59:17
      湖南小女孩突發(fā)心臟病死亡后:知情人曝更多,母親已社死,恐擔責

      湖南小女孩突發(fā)心臟病死亡后:知情人曝更多,母親已社死,恐擔責

      阿纂看事
      2026-01-15 14:09:01
      好友見證賀嬌龍從苦孩子成長為“推介官”,多人已趕赴昭蘇送她最后一程,有攝影師缺席她最后一次拍攝遺憾自責

      好友見證賀嬌龍從苦孩子成長為“推介官”,多人已趕赴昭蘇送她最后一程,有攝影師缺席她最后一次拍攝遺憾自責

      極目新聞
      2026-01-15 17:46:12
      噩耗傳來不足1天,惡心一幕出現,“貪心”的賀嬌龍被批演過頭了

      噩耗傳來不足1天,惡心一幕出現,“貪心”的賀嬌龍被批演過頭了

      有范又有料
      2026-01-15 15:54:50
      女子因廚師長一句不干就滾,在店門口躺了四天,店家還立一塊牌子

      女子因廚師長一句不干就滾,在店門口躺了四天,店家還立一塊牌子

      社會日日鮮
      2026-01-15 06:52:20
      9歲女童倒地猝死后續(xù):舅舅曝光真相,聊天內容流出,男方被打臉

      9歲女童倒地猝死后續(xù):舅舅曝光真相,聊天內容流出,男方被打臉

      有范又有料
      2026-01-15 15:26:30
      千億換來百萬輛,賽力斯交給華為的天價學費到底值不值?

      千億換來百萬輛,賽力斯交給華為的天價學費到底值不值?

      汽車十三行
      2026-01-15 09:22:09
      山姆中國一年賣 1400 億、增長 40%:不是超市不行,是“靠收地租”的零售走不通了!

      山姆中國一年賣 1400 億、增長 40%:不是超市不行,是“靠收地租”的零售走不通了!

      新浪財經
      2026-01-15 00:06:03
      16億只是保底,馬斯克想給朱曉彤的是100億

      16億只是保底,馬斯克想給朱曉彤的是100億

      字母榜
      2026-01-15 14:44:13
      機場偶遇宋佳,姐真的是老了,面部松弛下垂嚴重,歲月是把殺豬刀

      機場偶遇宋佳,姐真的是老了,面部松弛下垂嚴重,歲月是把殺豬刀

      溫讀史
      2026-01-15 11:48:44
      聶衛(wèi)平曾多次和鄧小平打橋牌:老爺子牌技比我好得多,但出錯牌也會虛心聽取批評

      聶衛(wèi)平曾多次和鄧小平打橋牌:老爺子牌技比我好得多,但出錯牌也會虛心聽取批評

      極目新聞
      2026-01-15 15:09:28
      湊湊火鍋鄭州門店清零?呷哺呷哺回應

      湊湊火鍋鄭州門店清零?呷哺呷哺回應

      魯中晨報
      2026-01-15 14:11:08
      盤后央行重磅利好!降息來了,A股午盤走強,ETF出現天量拋盤

      盤后央行重磅利好!降息來了,A股午盤走強,ETF出現天量拋盤

      看財經show
      2026-01-15 16:57:15
      裁判文書上網隱去法官姓名,破了“幾十年的規(guī)矩”

      裁判文書上網隱去法官姓名,破了“幾十年的規(guī)矩”

      中國新聞周刊
      2026-01-15 12:29:36
      強冷空氣+凍雨已在路上!重慶天氣即將“變臉”......

      強冷空氣+凍雨已在路上!重慶天氣即將“變臉”......

      魯中晨報
      2026-01-15 18:39:05
      閆學晶一家三口現身機場!疑似遇到麻煩,老公不停打電話面露難色

      閆學晶一家三口現身機場!疑似遇到麻煩,老公不停打電話面露難色

      阿纂看事
      2026-01-15 15:56:31
      2026-01-15 19:04:49
      新智元 incentive-icons
      新智元
      AI產業(yè)主平臺領航智能+時代
      14339文章數 66490關注度
      往期回顧 全部

      科技要聞

      阿里最狠的一次“自我革命”

      頭條要聞

      美方就伊朗局勢密集發(fā)聲 專家:動武的后果將十分嚴重

      頭條要聞

      美方就伊朗局勢密集發(fā)聲 專家:動武的后果將十分嚴重

      體育要聞

      聶衛(wèi)平:黑白棋盤上的凡人棋圣

      娛樂要聞

      傳奇棋圣聶衛(wèi)平離世,網友集體悼念

      財經要聞

      央行再次結構性降息0.25個百分點

      汽車要聞

      吉利帝豪/繽越推冠軍一口價 起售價4.88萬

      態(tài)度原創(chuàng)

      游戲
      健康
      親子
      旅游
      公開課

      一次性角色:《生化》14年未回歸的角色被遺忘了嗎?

      血常規(guī)3項異常,是身體警報!

      親子要聞

      惠州龍門獲評全國學前教育普及普惠縣,推動“幼有優(yōu)育”發(fā)展

      旅游要聞

      上海迪士尼2026馬年新春活動官宣,小馬紅心首次亮相

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产高清在线a视频大全| 午夜免费啪视频在线观看| 国产9区| 性色综合网| 亚洲欧美成人aⅴ在线| 亚洲国产成人久久精品软件| 97香蕉碰碰人妻国产欧美| 狠狠骚| 2020久久超碰国产精品最新| jizz麻豆| 狠狠色综合7777久夜色撩人ⅰ| 亚洲性爱在线| 亚洲成av人片在www鸭子| 色屁屁www影院免费观看| 高雄县| 欧美一性一乱一交一视频| 3p无码视频| 夜夜躁狠狠躁日日躁av| 国产精自产拍久久久久久蜜| 多毛小伙内射老太婆| 在线观看成人永久免费网站 | 亚洲国产在一区二区三区| 欧美最新精品videossexohd| 亚洲成人网站在线观看| 丰满人妻被黑人猛烈进入| 亚洲资源站| 出租屋勾搭老熟妇啪啪| 国产情侣激情在线对白| 久久久久亚洲av无码专区首jn| 欧美偷拍视频| 天天色天天综合网| 中文无码人妻有码人妻中文字幕| 91中文字幕一区二区| 日本新janpanese乱熟| 84pao强力打造永久免费高速高清| 国产成人欧美一区二区三区| 91成人社区| 久久精品欧美日韩精品| 国产三级va| 在线欧美精品一区二区三区| 99黄色|