<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5 vs Claude Opus 4.1:編程能力測評

      0
      分享至

      大數據文摘受權轉載自夕小瑤科技說

      聊起嚴肅的編程,Anthropic 的 Claude 幾乎是公認的王者,在很多開發者心里都是 No.1 的位置。

      但最近,風向似乎有點變了。

      OpenAI 發布了 GPT-5,我在公眾號里、社群里、論壇里,很多地方都在刷屏一個消息:GPT-5 來了,而且在編程能力上“強得可怕”。

      雖然看了很多說 GPT-5 是“編程新王”所謂的噱頭和關于 GPT5 的評測,說實話,我還沒看到一份有說服力的報告。要么是拿官方的 demo 說事,要么是測了幾個美觀度還行的 web 網頁就說 GPT-5 強。用這些下結論有點草率了吧。

      所以,對于 GPT-5 和 Claude 誰更厲害,模型編程 feature 各自擅長什么,好多人和我一樣好奇,

      今天刷到國外的一位開發者老哥 Rohit 發布了一篇 GPT-5 vs Claude Opus 4.1 編程能力的評測博客,比較實用,這里 share 出來。

      首選,評測生成的所有代碼都開源了,可以在這個鏈接查看。

      https://github.com/rohittcodes/gpt-5-vs-opus-4-1

      先說核心的結論:

      • 算法:GPT?5 在速度與 token 數量上勝出(8K vs 79K)。

      • 網頁開發:Opus 4.1 對 Figma 設計稿的還原度更高,但消耗的 token 量更大(90 萬 vs 140 萬 + token);

      GPT-5 響應更快且成本更低, token 消耗比 Opus 4.1 節省約 90%,更適合作為一個高效的日常開發助手使用;如果你想要設計還原度高,而且預算靈活,Opus 4.1 則更具優勢。

      再來看模型基礎信息與 token 使用效率對比:

      上下文窗口:Claude Opus?4.1 支持 20 萬 token,上限輸出不詳;而 GPT?5 支持 40 萬 token 上下文,最大可輸出 128K token。

      Token 使用效率:盡管 GPT?5 的上下文空間更大,但在相同任務下它總是使用更少的 token,從而大幅降低運行成本。

      雖然在 SWE-bench 等編碼基準測試中,GPT?5 略微領先于 Opus?4.1,但作者后續還實測了一些 case。


      測試內容涵蓋實際開發常見場景:

      • 編程語言與任務類型

        • 算法題:使用 Java 語言實現 LeetCode Advanced 題目。

        • Web 開發:使用 TypeScript + React,編寫基于 Figma 設計的 Next.js 頁面,通過 Rube MCP(一種通用 MCP 接入層)進行代碼生成。

        • 其他任務:包括客戶流失預測模型等業務邏輯實現。

      • 環境:所有任務均在 Cursor IDE 聯合 Rube MCP 的環境中完成。

      • 測量指標:token 數量、耗時、代碼質量、實際結果。

      兩個模型使用完全一樣的提示詞。

      01 Figma 設計稿開發

      Rohit 從 Figma 社區找了一個復雜的儀表盤設計,要求它倆用 Next.js 和 TypeScript 把它復刻出來。


      提示詞如下:

      Create a Figma design clone using the given Figma design as a reference: [FIGMA_URL]. Use MCP's Figma toolkit for this task. Try to make it as close as possible. Use Next.js with TypeScript. Include: Responsive design Proper component structure Styled-components or CSS modules Interactive elements

      兩位選手的表現:

      GPT-5:

      • 耗時:約 10 分鐘

      • Tokens:906,485(90 萬 token)

      GPT-5 的效率沒得說,10 分鐘就交卷了,應用也能跑。但成品……怎么說呢,功能完備,但視覺效果一言難盡。它 get 到了設計的框架,卻完全忽略了靈魂。顏色、間距、字體都和原稿相去甚遠,仿佛開了“低保真”模式。


      是一個能干活的工程師,但是不懂審美而且干活很粗糙。

      Claude Opus 4.1:

      • 耗時:更長(因為反復迭代)

      • Tokens:超過 140 萬 token (比 GPT-5 多了 55%!)

      Opus 4.1 上來先耍了點“小脾氣”,明明指定了 styled-components,它非要用 Tailwind,需要人工糾正。但當它“認錯”并開始工作后,結果令人震驚。

      UI 幾乎與 Figma 設計稿一模一樣! 視覺保真度堪稱完美。


      一位追求完美的“藝術家”,雖然燒錢又有點犟,但作品無可挑剔。

      02 LeetCode 算法題

      為了考驗純粹的邏輯和效率,Rohit 拋出了經典的 LeetCode 難題:“尋找兩個正序數組的中位數”,并要求時間復雜度為 O(log(m+n))”。

      提示詞如下:

      Given two sorted arrays nums1 and nums2 of size m and n respectively, return the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

      GPT-5:

      • 耗時:約 13 秒

      • Tokens:8,253

      GPT-5 幾乎沒有任何廢話,13 秒內給出了一個干凈利落、完全正確的二分查找解法。代碼優雅,效率拉滿。

      Claude Opus 4.1:

      • 耗時:約 34 秒

      • Tokens:78,920 (接近 GPT-5 的 10 倍!)

      Opus 4.1 則完全是另一種畫風。它不僅給出了答案,還附上了一篇“小論文”:詳細的推理步驟、全面的代碼注釋,甚至內置了測試用例,生怕你學不會。雖然算法核心是一樣的,但它的輸出附帶了極高的“教育價值”。


      想快速要答案,找 GPT-5;想學習解題思路,Opus 4.1 是你最好的老師。

      03 ML 復雜任務

      最后一個挑戰是構建一個完整的機器學習的 pipeline,預測客戶流失。

      然而,在見識了 Opus 4.1 在第一輪中驚人的 token 消耗后,Rohit 出于對錢包的尊重,明智地讓它“輪休”了。這一局,只有 GPT-5 單挑。

      提示詞如下:

      Build a complete ML pipeline for predicting customer churn, including: Data preprocessing and cleaning Feature engineering Model selection and training Evaluation and metrics Explain the reasoning behind each step in detail

      結果顯示,GPT-5 完全能勝任這種復雜的端到端任務。從數據預處理、特征工程,到多模型訓練(邏輯回歸、隨機森林、XGBoost),再到使用 SMOTE 處理數據不平衡問題和全面的效果評估,整個流程一氣呵成,代碼扎實可靠。

      • 耗時:約 4-5 分鐘

      • Tokens:約 86,850

      04 成本對決:真金白銀的較量

      效果看完了,那我們來算算賬。畢竟,這才可能是最能影響開發者選擇的因素。


      • GPT-5 (Thinking 模式)-完成三項測試任務

        • Web 應用:~$2.58

        • 算法:~$0.03

        • ML 流水線:~$0.88

        • 總計:約 $3.50

      • Opus 4.1 (Thinking + Max 模式)-僅完成兩項測試任務

        • Web 應用:~$7.15

        • 算法:~$0.43

        • 總計:$7.58

      結論一目了然:Opus 4.1 的使用成本是 GPT-5 的兩倍以上。

      05 評測結論

      GPT-5 的優勢

      • 算法任務中 token 使用少、響應快,效率極高。

      • 更適合日常開發,尤其是快速迭代與原型驗證。

      • 整體 token 成本大幅低于 Opus?4.1。

      Claude Opus 4.1 的優勢

      • 提供清晰的、一步步解釋的代碼邏輯,對學習過程友好。

      • 在視覺 fidelity(設計還原度)方面表現出色,非常貼近 Figma 原稿。

      • 適合對界面精度要求高的場景。

      所以,如果你是日常開發,優先使用 GPT?5,性能與成本兼顧。如果界面還原要求高的設計任務,可選擇 Claude Opus?4.1,提升最終效果,但需預算充足。

      推薦組合策略:先用 GPT?5 打好基礎,然后在關鍵界面環節,用 Opus?4.1 打磨細節,實現效率與精度的平衡。

      參考文獻
      https://composio.dev/blog/openai-gpt-5-vs-claude-opus-4-1-a-coding-comparison

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      芬蘭小姐歧視風波升級:政界聲援引發對種族議題的更大爭論

      芬蘭小姐歧視風波升級:政界聲援引發對種族議題的更大爭論

      華人生活網
      2025-12-14 03:38:57
      搞笑圖片第1086期:什么樣的設計師腦洞能設計出這樣的T恤來?

      搞笑圖片第1086期:什么樣的設計師腦洞能設計出這樣的T恤來?

      今天的快樂
      2025-12-13 20:30:21
      無視中俄警告,美軍派B52給高市早苗助威,8架殲-16不給F-15J機會

      無視中俄警告,美軍派B52給高市早苗助威,8架殲-16不給F-15J機會

      南宮一二
      2025-12-11 17:31:24
      官媒接連發聲:一查到底!是誰在糊弄國家和人民

      官媒接連發聲:一查到底!是誰在糊弄國家和人民

      詩意世界
      2025-12-12 21:22:07
      少林新規范眾怒?十公里50元車費引來爭議,印樂法師近況爆出

      少林新規范眾怒?十公里50元車費引來爭議,印樂法師近況爆出

      自娛眾樂
      2025-12-12 16:00:08
      WTT總決賽!男單4強名單出爐,張本智和絕殺晉級,林詩棟壓力很大

      WTT總決賽!男單4強名單出爐,張本智和絕殺晉級,林詩棟壓力很大

      知軒體育
      2025-12-13 18:14:53
      深圳樓市:房價太離譜了。。

      深圳樓市:房價太離譜了。。

      樓市諸葛
      2025-12-13 14:52:49
      在窗戶LED屏上惡意投放動態火焰,引來5輛消防車,廣州一市民被行政處罰

      在窗戶LED屏上惡意投放動態火焰,引來5輛消防車,廣州一市民被行政處罰

      環球網資訊
      2025-12-13 08:23:04
      為什么全世界只有中國人實現了“蔬菜自由”?竟是中國頂級特權?

      為什么全世界只有中國人實現了“蔬菜自由”?竟是中國頂級特權?

      歷史求知所
      2025-10-26 10:25:08
      中國有多少城市能撐住七日游?網友分享殺瘋了,各種神回復笑不活

      中國有多少城市能撐住七日游?網友分享殺瘋了,各種神回復笑不活

      墻頭草
      2025-10-23 07:58:58
      T2航站樓即將停用?不會!未來將與T1航站樓統籌使用

      T2航站樓即將停用?不會!未來將與T1航站樓統籌使用

      上游新聞
      2025-12-13 15:07:04
      克里米亞戰爭,歐洲禍水東引,受害最深的是誰?

      克里米亞戰爭,歐洲禍水東引,受害最深的是誰?

      地圖帝
      2025-12-13 13:17:48
      特朗普拿出“新五?!泵麊?,日本和印度頂替英法,中美俄穩坐不動

      特朗普拿出“新五?!泵麊?,日本和印度頂替英法,中美俄穩坐不動

      博覽歷史
      2025-12-12 21:23:17
      香煙為何要分軟包和硬包,這二者有什么區別?經常吸煙不妨了解下

      香煙為何要分軟包和硬包,這二者有什么區別?經常吸煙不妨了解下

      三農老歷
      2025-12-13 15:01:06
      澤連斯基造訪庫皮揚斯克,多個細節泄露位置,該城估計馬上就失控

      澤連斯基造訪庫皮揚斯克,多個細節泄露位置,該城估計馬上就失控

      堅果甜瓜
      2025-12-13 04:53:01
      越來越多孩子得白血???醫生坦言:家里4樣東西是禍根,趁早扔了

      越來越多孩子得白血???醫生坦言:家里4樣東西是禍根,趁早扔了

      DrX說
      2025-11-19 14:42:09
      劍南春|巴黎3-2梅斯,杜埃、恩賈恩圖破門,姆巴耶助攻雙響

      劍南春|巴黎3-2梅斯,杜埃、恩賈恩圖破門,姆巴耶助攻雙響

      懂球帝
      2025-12-14 04:09:11
      美國男子發現一個清除社區流浪漢的好辦法:送給他們5美元假鈔

      美國男子發現一個清除社區流浪漢的好辦法:送給他們5美元假鈔

      詩意世界
      2025-12-13 20:33:51
      官媒親宣,34歲韋東奕再破天花板,辦公室內景曝光,新水杯未開封

      官媒親宣,34歲韋東奕再破天花板,辦公室內景曝光,新水杯未開封

      烏娛子醬
      2025-12-11 16:37:45
      趙繼偉傷停,布朗16分,CBA遼籃80-68天津男籃,贏得賽季開門紅!

      趙繼偉傷停,布朗16分,CBA遼籃80-68天津男籃,贏得賽季開門紅!

      晚池
      2025-12-14 00:35:03
      2025-12-14 04:24:49
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6806文章數 94518關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      "小米公司不讓賣小米"涉事村莊村民:馮書記直播不收錢

      頭條要聞

      "小米公司不讓賣小米"涉事村莊村民:馮書記直播不收錢

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      插刀門后,印小天一舉動實現口碑逆轉

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

      態度原創

      房產
      健康
      教育
      藝術
      時尚

      房產要聞

      中糧好房子體系盛大亮相三亞,禮獻海南自貿港封關

      甲狀腺結節到這個程度,該穿刺了!

      教育要聞

      TTS新傳論文帶讀:弄不懂的數字資本主義看這一篇就可以啦!!

      藝術要聞

      全球十大昂貴的建筑錯誤,代價觸目驚心!

      法式方頭靴的30種穿法,時髦不重樣!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 一本一本久久| 自拍性旺盛老熟女| 精品国产人成亚洲区| 青草99在线免费观看| 99精品人妻少妇一区| 亚洲精品成人无码熟妇在线| 宜州市| 国产在线精品一区二区三区直播| 污污内射在线观看一区二区少妇| 国产精品亚洲一区二区| 亚洲欧美日韩综合久久| 女同av在线| 欧美亚洲色综久久精品国产| 日韩精品毛片无码一区到三区| 国产精品无码久久综合网| 亚洲人成精品久久久久| 91成人无码| 91视频www| 九九视频国产| 国产欧美性成人精品午夜| 自拍性旺盛老熟女| 韩国三级+mp4| 在线观看a视频| 亚洲国产人妻| 免费拍拍拍网站| 欧美噜噜久久久xxx| 免费国产好深啊好涨好硬视频| 精品30P| 人妻中文字幕精品| 性一交一黄一片| 黄页网址大全免费观看 | 福利网午夜视频一区二区| 亚洲无av码一区二区三区| 亚洲免费网站观看视频| 男人的天堂无码动漫av| 黑人一区| 松江区| 国产真人性做爰久久网站| 久久综合国产精品一区二区| 日本中文字幕色| 人妻少妇亚洲|