<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      GPT-5能讓普通人變成博士,但魔法依舊沒有

      0
      分享至


      千呼萬喚始出來的GPT-5終于在昨天晚上1點問世,在持續(xù)了一個小時10分鐘的發(fā)布會上,OpenAI向世人展示了一個性能絕對強大,更加易用,甚至能夠理解或者說準確猜測用戶真實意圖并且交付符合預(yù)期的產(chǎn)品的大模型。

      用Sam Altman在發(fā)布會上的話來說,GPT-5在各個領(lǐng)域都能達到博士的知識水平,能力可以比肩專業(yè)人士,從而讓普通人能夠完成以前自己無法想象的工作。


      相比于OpenAI兩年前發(fā)布GPT-4時,整個世界對于大模型的認知和體驗已經(jīng)充分得多。觀眾和用戶已經(jīng)不會對模型能夠看懂網(wǎng)絡(luò)梗圖這種事情感到驚嘆不已。但是作為一個幾乎每天都會使用AI產(chǎn)品的人來說,GPT-5的發(fā)布依然足夠驚艷。

      最重要的原因就是,從發(fā)布會上傳達出的內(nèi)容,我能深切地感受到,OpenAI想讓大模型已經(jīng)從一個“玩弄”語言和“智能”,不時讓人感受到驚喜和挫敗的大玩具,加速進化到一個生活中的可靠幫手。就像你的手機一樣,如果你離開它,你將深刻地感受到不方便,不習慣,甚至不安全。

      下面我將用發(fā)布會的幾個瞬間來幫助大家理解這一切是怎么發(fā)生的。

      孩子讓你給他解釋流體力學中的伯努利公式,以前的AI可能給你一篇文章,GPT-5能按照你的要求,一句話直接給你做一個可以互動的頁面。


      你想學習法語,GPT-5能按照你的要求去生成一個像多鄰國一樣的學習應(yīng)用,你可以用來背單詞,還能通過貪食蛇來幫你復(fù)習。如果你對生成的應(yīng)用有不滿意的地方,也可以直接通過自然語言讓GPT-5幫你修改。


      如果你是一個創(chuàng)業(yè)公司的CFO,你可以讓GPT-5用大概3分鐘的時間,根據(jù)你的所有數(shù)據(jù),生成一個詳細的財務(wù)狀況的可互動的演示板。而你需要的僅僅是一個100字左右的描述。GPT-5可以從零生成代碼,保證完成,它能猜測你想呈現(xiàn)的形式并自動幫你優(yōu)化代碼和呈現(xiàn)的效果。


      最夸張的是,演示中OpenAI的工作人員直接用3段提示詞,就讓GPT-5生成了一個帶射擊小游戲功能的城堡3D模型,還能和城堡上的士兵聊天。你點擊周圍的氣球,就能發(fā)射彈藥把氣球打爆,同時還會伴隨爆炸的音效。


      從演示中我們可以看出,GPT-5已經(jīng)全面進化成為一個直接輸出專業(yè)產(chǎn)品的萬能百寶箱。

      但是說實話,最讓我感到觸動的,是OpenAI關(guān)于醫(yī)療健康方面能力的介紹。OpenAI邀請了一個從3種癌癥中康復(fù)的患者,讓她聊了聊自己在抗癌過程中GPT-5給她的幫助。


      她說,當她得到診斷結(jié)果的時候,醫(yī)生給她提供了幾種治療方案進行選擇。她在求助了GPT-5之后,才真正理解了自己面臨的情況,而將自己的情況和GPT-5詳細聊過之后,她做出了最適合自己的選擇,最終戰(zhàn)勝了病魔,獲得了重生。她很難想象如果沒有GPT-5的專業(yè)建議,完全沒有醫(yī)療專業(yè)知識的自己如何能夠理解醫(yī)生給她的方案和選擇,更不知道最后自己是否能挺過來。

      看完發(fā)布會之后,能清晰地感覺到,大模型技術(shù)本身已經(jīng)進入了一個相對穩(wěn)定的發(fā)展曲線。GPT-5發(fā)布代表著OpenAI也沒有其他“魔法”,讓大模型能力產(chǎn)生跨越式的發(fā)展。而接下來的AI巨頭們的冷兵器戰(zhàn)爭,將會越加焦灼。

      性能介紹

      模型系統(tǒng)

      GPT-5 不再是一個模型,而是一個模型系統(tǒng):

      ? 自動切換器判斷查詢意圖

      ? 簡單問題路由到聊天版本(極速響應(yīng))

      ? 復(fù)雜問題路由到推理版本(深度思考)

      256k token上下文窗口,支持文本和圖像輸入,支持函數(shù)調(diào)用和結(jié)構(gòu)化輸出。


      目前打開我自己的ChatGPT,發(fā)現(xiàn)左上角的模型選項已經(jīng)默認為“GPT-5”,而且下拉選項中也不再能看到前代模型。正如奧特曼之前就承諾過的——GPT-5時代將不會再有繁瑣的模型選擇,由模型自行判斷用戶在當下情境是需要快速響應(yīng),還是需要深度思考和推理。

      編碼和寫作

      OpenAI將GPT-5稱為“我們迄今為止最強大的編碼模型”,在復(fù)雜的前端生成和大型代碼庫的調(diào)試方面表現(xiàn)出色。它通常只需一次提示就能創(chuàng)建美觀且響應(yīng)迅速的網(wǎng)站、應(yīng)用程序和游戲,并兼具美感,直觀而優(yōu)雅地將創(chuàng)意轉(zhuǎn)化為現(xiàn)實。


      此外,OpenAI也稱GPT-5是“我們迄今為止最強大的寫作工具”,可以寫出引人入勝、富有文學深度和節(jié)奏感的文本。它能夠更可靠地處理結(jié)構(gòu)模糊的寫作,例如持續(xù)不押韻的抑揚格五音步或流暢自然的自由詩,將對形式的尊重與清晰的表達相結(jié)合。這意味著 ChatGPT 能夠更好地幫助用戶完成日常任務(wù),例如起草和編輯報告、電子郵件、備忘錄等。

      我們也淺淺嘗試了一下新模型的作詩能力,以“秋天的第一杯奶茶”為題,的確比GPT-4要自然很多(AI味兒沒那么重了)。


      評估

      GPT-5 的全面智能化程度顯著提升,這體現(xiàn)在它在學術(shù)和人工評估基準測試中的表現(xiàn)上,尤其是在數(shù)學、編碼、視覺感知和健康領(lǐng)域。

      在數(shù)學(AIME 2025 無需工具測試得分 94.6%)、真實世界編碼(SWE-bench Verified 得分 74.9%,Aider Polyglot 得分 88%)、多模態(tài)理解(MMMU 得分 84.2%)和健康(HealthBench Hard 得分 46.2%)方面均創(chuàng)下了新的最高水平——這些提升在日常使用中得到了充分體現(xiàn)。

      憑借 GPT-5 pro 的擴展推理能力,該模型還在GPQA上創(chuàng)下了新的最高水平,無需工具測試得分高達 88.4%。


      GPT-5已經(jīng)在LMArean登頂。


      在Intelligence Analysis獲得的預(yù)覽訪問中,GPT-5同樣獲得了第一名。


      幻覺降低

      在啟用搜索的情況下,GPT-5出現(xiàn)事實性錯誤的概率比GPT-4o降低約45%。在“思考(thinking)”模式下,這一概率比OpenAI o3降低80%。


      除了事實性錯誤之外,AI還經(jīng)常“睜著眼睛說瞎話”,比如明明做不到/沒有權(quán)限做的事情,它也許會元氣滿滿地告訴你已經(jīng)搞定了,GPT-5在“欺騙”方面也表現(xiàn)得更好、更誠實。例如,為了測試這一點,OpenAI從多模態(tài)基準測試 CharXiv 的提示中刪除了所有圖像,結(jié)果發(fā)現(xiàn) OpenAI o3 仍然能夠以 86.7% 的概率對不存在的圖像給出自信的答案,而 GPT-5 的這一比例僅為 9%。

      更“高效”,更“節(jié)省”

      在OpenAI的評估中,GPT-5(具備思考能力)的表現(xiàn)優(yōu)于 OpenAI o3,在視覺推理、代理編碼和研究生水平的科學問題解決等功能上,輸出 token 數(shù)量減少了 50% 至 80%。

      也就是說,GPT-5 用更少的思考時間實現(xiàn)了更大的價值。

      API


      API價格方面,GPT-5性能最強,價格卻低得離譜,看來OpenAI是掌握了跨代的優(yōu)化方法。


      OpenAI和奧特曼對GPT-5無疑是寄予厚望的,他們也清楚,外界期待這一代模型已經(jīng)很久。

      奧特曼稱,這還是第一次,真的像是在與某個領(lǐng)域的專家對話。如果說GPT-4o是大學生,那GPT-5就是博士級的專家。

      這種重視,在發(fā)布會時長上也有所體現(xiàn),以往的新模型發(fā)布,OpenAI的線上發(fā)布會只有半個小時左右,這次持續(xù)了一個小時以上。而奧特曼本人,也在發(fā)布會進行的同時,在X(前推特)上發(fā)帖進行“文字直播”。


      不過也許是心急,發(fā)布會PPT里出現(xiàn)大錯誤——在“SWE-bench(人工驗證版)”相關(guān)的圖表中,條形圖明顯不對。GPT-5不加思考(thinking)的準確率為52.8%,在圖上卻高于OpenAI o3是69.1%,而o3的69.1%,又和GPT-4o的30.8%一樣高。

      所以很尷尬的一幕出現(xiàn)了:奧特曼在“文字直播”發(fā)布會,很多網(wǎng)友卻在評論區(qū)發(fā)這張截圖,戲謔OpenAI離了大譜的圖表。


      奧特曼倒是大方轉(zhuǎn)發(fā)了消息并且稱已經(jīng)改正,一些粉絲認為這只是無心之失。但不少人卻覺得這是“有意為之”,是為了讓GPT-5顯得厲害在圖表上玩花招,甚至稱之為“本世紀最大的圖表犯罪”。

      這大概也在表明,GPT-5的發(fā)布會沒能讓所有人信服,不少人開始問“GPT-6什么時候出”。

      馬斯克已經(jīng)跳出來,直言兩周前發(fā)布的Grok 4 Heavy比GPT-5更智能。


      而一向喜歡潑冷水的AI學者蓋里·馬庫斯(Gary Marcus)在贊揚GPT-5有很多良好進展的同時,稱這“并非一個巨大的飛躍”,GPT-5也夠不上外界的期待。

      “顯然不是AGI。”


      GPT-5是否足夠好?還需要更多時間檢驗。也許OpenAI能從中學到的教訓就是——做好外界的預(yù)期管理,不要拖延太久。

      歡迎在評論區(qū)留言~
      如需開白請加小編微信:dongfangmark



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      雷軍高調(diào)發(fā)文:“近50小時手工打磨”紫水晶車漆,網(wǎng)友炸了

      雷軍高調(diào)發(fā)文:“近50小時手工打磨”紫水晶車漆,網(wǎng)友炸了

      吃瓜局
      2025-12-15 16:01:07
      高市早苗宣布:自2026年起正式取消中國留學生打工收入免稅政策

      高市早苗宣布:自2026年起正式取消中國留學生打工收入免稅政策

      百態(tài)人間
      2025-12-15 16:12:20
      窮鬼套餐漲價登熱搜第一!網(wǎng)友:外賣大戰(zhàn)薅的羊毛要還回去了……

      窮鬼套餐漲價登熱搜第一!網(wǎng)友:外賣大戰(zhàn)薅的羊毛要還回去了……

      柴狗夫斯基
      2025-12-15 21:12:56
      朝鮮據(jù)稱拒絕俄羅斯再向俄烏戰(zhàn)場派遣士兵的請求,只因錢沒到位?

      朝鮮據(jù)稱拒絕俄羅斯再向俄烏戰(zhàn)場派遣士兵的請求,只因錢沒到位?

      之乎者也小魚兒
      2025-12-15 15:18:45
      沖突第八天!泰方拿下制空權(quán)后又封了泰國灣,洪森父子只無能狂怒

      沖突第八天!泰方拿下制空權(quán)后又封了泰國灣,洪森父子只無能狂怒

      科普100克克
      2025-12-15 12:45:29
      廣東江門發(fā)布情況通報

      廣東江門發(fā)布情況通報

      新京報政事兒
      2025-12-15 11:31:15
      全國“交警”集體改名!背后深意很多人沒看懂

      全國“交警”集體改名!背后深意很多人沒看懂

      李云飛Afey
      2025-12-15 20:15:17
      馬斯克大半夜在網(wǎng)上發(fā)文預(yù)測戰(zhàn)爭,這次可不是鬧著玩的!

      馬斯克大半夜在網(wǎng)上發(fā)文預(yù)測戰(zhàn)爭,這次可不是鬧著玩的!

      安安說
      2025-12-15 09:44:27
      女子全裸做SPA被安排男技師,拒絕后被嘲諷:孤陋寡聞!店家回應(yīng)

      女子全裸做SPA被安排男技師,拒絕后被嘲諷:孤陋寡聞!店家回應(yīng)

      瀟湘晨報
      2025-12-15 22:47:04
      笑了!柬泰沖突后,泰國駐華大使館微博下面,全是一樣的評論

      笑了!柬泰沖突后,泰國駐華大使館微博下面,全是一樣的評論

      消失的電波
      2025-12-15 14:10:23
      馬興全與他的深圳生意

      馬興全與他的深圳生意

      法經(jīng)網(wǎng)
      2025-12-15 17:52:35
      我國首批L3級自動駕駛車型產(chǎn)品獲得準入許可

      我國首批L3級自動駕駛車型產(chǎn)品獲得準入許可

      財聯(lián)社
      2025-12-15 15:37:04
      新娘跳樓曝更多內(nèi)幕:每月給500,工資卡被媽媽控制,彩禮給弟弟

      新娘跳樓曝更多內(nèi)幕:每月給500,工資卡被媽媽控制,彩禮給弟弟

      奇思妙想草葉君
      2025-12-15 19:39:32
      網(wǎng)紅馮提莫直播間換裝被封,有網(wǎng)友質(zhì)疑系直播“擦邊”,工作人員回應(yīng):封禁10分鐘后又再播了

      網(wǎng)紅馮提莫直播間換裝被封,有網(wǎng)友質(zhì)疑系直播“擦邊”,工作人員回應(yīng):封禁10分鐘后又再播了

      揚子晚報
      2025-12-15 22:48:32
      亂了!江蘇天氣又亂了!最新預(yù)測:冬春連旱

      亂了!江蘇天氣又亂了!最新預(yù)測:冬春連旱

      江南晚報
      2025-12-16 03:33:39
      多市黨委主要領(lǐng)導(dǎo)調(diào)整

      多市黨委主要領(lǐng)導(dǎo)調(diào)整

      上觀新聞
      2025-12-15 14:57:22
      楊瀚森18+10+4背后暖心一幕!克林根認真指導(dǎo) 球迷期待激發(fā)潛力

      楊瀚森18+10+4背后暖心一幕!克林根認真指導(dǎo) 球迷期待激發(fā)潛力

      羅說NBA
      2025-12-16 05:59:50
      湖北鄖西通報3名員工聚餐飲酒中毒:食堂誤將工業(yè)酒精當白酒,1人死亡2人救治中

      湖北鄖西通報3名員工聚餐飲酒中毒:食堂誤將工業(yè)酒精當白酒,1人死亡2人救治中

      界面新聞
      2025-12-15 21:56:31
      日本韓國西班牙的地產(chǎn)怎么崩盤的? 日本跌了18年、韓國跌了10年才見底

      日本韓國西班牙的地產(chǎn)怎么崩盤的? 日本跌了18年、韓國跌了10年才見底

      爆角追蹤
      2025-12-15 19:02:28
      何晴告別式現(xiàn)場,前夫許亞軍疑似現(xiàn)身雙眼泛紅,大量群眾自發(fā)悼念

      何晴告別式現(xiàn)場,前夫許亞軍疑似現(xiàn)身雙眼泛紅,大量群眾自發(fā)悼念

      萌神木木
      2025-12-15 11:18:27
      2025-12-16 08:12:49
      直面派 incentive-icons
      直面派
      講述值得講述的真實故事
      239文章數(shù) 236關(guān)注度
      往期回顧 全部

      科技要聞

      L3車型可以上路了!重慶北京兩款車獲批

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方?jīng)]認定

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方?jīng)]認定

      體育要聞

      戰(zhàn)勝完全體雷霆,馬刺“瘋狂動物城”只是半成品

      娛樂要聞

      何晴告別式現(xiàn)場,前夫許亞軍雙眼泛紅?

      財經(jīng)要聞

      新農(nóng)合漲到400元 農(nóng)民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態(tài)度原創(chuàng)

      藝術(shù)
      旅游
      游戲
      公開課
      軍事航空

      藝術(shù)要聞

      從木匠到巨匠,大師是如何煉成的

      旅游要聞

      免簽、直航助力中俄旅游雙向升溫

      當手機能自動清每日任務(wù),玩家天天上線是為了什么?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      澤連斯基稱烏方已妥協(xié)不加入北約 俄方發(fā)聲

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产野战AV| 色欲av无码一区二区人妻| 农村乱人伦一区二区| 亚洲成人在线| 青娱乐av| 马边| 国产精品无码一区二区桃花视频| 亚洲aⅴ天堂av天堂无码麻豆| 亚洲日韩国产二区无码| 欧美激情内射喷水高潮| 67194国产| 人妻熟妇久久久久久精| 又大又粗欧美黑人aaaaa片| 免费裸体美女网站| 99精品人妻少妇一区| 欧美天堂在线| 国产无遮挡又黄又爽又色| av无码精品一区二区三区| AV最新高清无码专区| 亚洲AV一卡| 国语精品一区二区三区| 中文字字幕人妻中文| 一本加勒比hezyo无码人妻| 亚洲嫩模喷白浆| 一区二区三区无效卡| 日韩丰满少妇无码内射| 实拍女处破www免费看| 亚洲无码丝袜熟女| 日韩精品人妻中文字幕无码流出| 国内精品视频一区二区三区| 国产激情无码一区二区三区| 51自拍视频| 亚洲成色www久久网站| 中文字幕一区二区三区人妻少妇| AV教师一区高清| 江达县| 2020无码专区人妻系列日韩| 在线综合亚洲欧美网站| 国产中文三级全黄| 离岛区| 国产中年熟女高潮大集合|