<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      毀三觀!被中國研究員扒出AI 論文造假后,蘋果竟然直接刪庫跑路了!

      0
      分享至

      ICLR 2026 (國際學術表征會議)將于明年 4 月在巴西里約熱內盧召開。目前(11 月11 日—12月3 日 )為論文的作者-評審階段。

      最近,這個國際頂級 AI 會議,爆出了個“讓業界都震驚了”的大丑聞。

      征集階段,蘋果研究團隊提交了一篇論文,標題為《推理究竟哪里出錯了?》(Where Did the Reasoning Go Wrong?) 。


      這篇論文提出名為 PRISM-Bench 的基準測試,稱能專門檢測多模態大模型在推理時的第一處錯誤。


      論文被上?!半A躍星辰”研究員 Lei yang看到后,他把階躍星辰模型適配到 Benchmark 上做了實驗。

      結果,他發現自家模型跑分,低得離譜。

      于是,他開始排查自己的集成方式,但在查閱 Apple 官方代碼時,他看到了一個震碎三觀的低級 Bug。

      在調用視覺語言模型進行推理時,本該傳入圖片像素數據,代碼卻錯誤地只傳了圖片的存儲路徑字符串。

      也就是說,模型壓根沒看到圖,只是讀到了一行類似“D盤/圖片/01.jpg”的文字


      于是, Lei Yang 順手改了 Bug,還把真正的圖片傳了進去。

      結果,分數反而更低了。

      這意味著,在蘋果公司提交的這個 Benchmark 里,模型瞎蒙的效果,比實際看圖還要好

      也就是說,其數據集本身存在巨大的邏輯漏洞,或者更可能的是,純粹是為了湊數的擺設。

      帶著這個懷疑, Lei Yang 決定放棄代碼,直接人工檢查數據。

      他隨機選擇了模型答錯的前20道題,結果,有 6 個題的標準答案本身就是錯的。

      真是震碎了三觀!

      就此, Lei Yang在 GitHub 上認真提交了一個問題反饋。

      沒想到,接下來 Apple 作者團隊的操作,讓人大跌眼鏡。

      6 天后,他們敷衍的給出了一個簡短回復,然后,然后,就連夜撤稿,刪庫跑路了!



      之后,Lei Yang 提出強烈抗議,他們才又不得不重新恢復。

      被蘋果式傲慢激怒的Lei Yang,最后選擇了將這一丑聞公之于眾。


      他用“可怕的錯誤”來形容蘋果論文的 bug,公布了 20 道題的測試文件,還表示,這些示例的“真實推理過程”也包含大量幻覺和錯誤。

      比如,在論文附錄的 Figure 11 里,題目要求找一條直線和一條曲線,圖里明明是相切,AI 生成的“正確推理”,卻說這一步錯了,理由是“這圖里展示的是相交” 。


      更吊詭的是,有網友查詢蘋果論文原文發現,在第 4 頁上煞有介事的寫著,“所有的思維鏈都經過標注員審查,以確?!e誤位置清晰明確”。


      簡直是自欺欺人!

      還有更恐怖的。在該論文的 Table 2 中,作者列出了一大堆模型在這個 Benchmark 上的跑分。比如,GPT-5 跑了 52.6%,Qwen2.5-VL 跑了 57.0%。


      這些精確到小數點后一位的分數,到底是怎么跑出來的??。。?/strong>

      除了蘋果公司本身的不靠譜,還可以繼續追問的是,這篇論文有 5 位審稿人,而論文發表的場合 ICLR,更是AI 界的頂級會議。這些評審都在做啥?

      我們來看看審稿人們的評價。


      這位審稿人評價為Soundness: 4 excellent(可靠性:極佳)的評價。


      這位審稿人的評價是Soundness: 3 good(可靠性:3 良好),并稱其“提供了詳細的復現細節”。

      這顯然與Lei Yang的復現結果大相徑庭,這位評審真的去認真復現了么?

      有網友揭秘稱,蘋果從2023年開始,每年發一篇實際上并不靠譜的論文,詆毀大模型。

      比如,2023 年的《ReLU 強勢回歸:利用大語言模型的激活稀疏性》,2024 年的

      《GSM?Symbolic:理解大語言模型在數學推理中的局限性》。

      開始時,還有很多人叫好,去年開始受到不少質疑,沒想到今年就翻車了,而且還這么徹底。

      沒想到高大上的蘋果公司,還有 AI 頂級學術界,也會“草臺班子”如此。

      幸好還有來自中國上海 AI 公司階躍星辰的這位較真的Lei Yang!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      男性在喝酒時,盡量少吃這3種下酒菜,尤其是第一種,一定要忍住

      男性在喝酒時,盡量少吃這3種下酒菜,尤其是第一種,一定要忍住

      熊貓醫學社
      2026-01-07 11:30:03
      蘋果加它是超強肝臟解毒水,連著喝3天,排出身體多年肝臟毒素

      蘋果加它是超強肝臟解毒水,連著喝3天,排出身體多年肝臟毒素

      江江食研社
      2026-01-26 10:30:08
      紅軍偵察部長流浪西北,路上討飯時被一地主識破:你是紅軍吧!

      紅軍偵察部長流浪西北,路上討飯時被一地主識破:你是紅軍吧!

      抽象派大師
      2026-01-28 02:34:40
      竇靖童:我媽錢多到用不完,但窮苦潦倒的爸爸,成了我如今的心病

      竇靖童:我媽錢多到用不完,但窮苦潦倒的爸爸,成了我如今的心病

      璀璨幻行者
      2026-01-20 04:29:30
      連克曼城、阿森納也沒用!卡里克被曝無緣紅魔帥位,或轉投熱刺

      連克曼城、阿森納也沒用!卡里克被曝無緣紅魔帥位,或轉投熱刺

      夜白侃球
      2026-01-27 20:10:16
      別去撩中年女人:她不是獵物,是你惹不起的人間清醒

      別去撩中年女人:她不是獵物,是你惹不起的人間清醒

      青蘋果sht
      2026-01-13 03:43:56
      當年為何要炸掉西湖邊的秋瑾墓?

      當年為何要炸掉西湖邊的秋瑾墓?

      呂醿極限手工
      2026-01-27 14:36:43
      花498萬買進“百強縣”榜單,官方回應

      花498萬買進“百強縣”榜單,官方回應

      中國新聞周刊
      2026-01-27 18:10:38
      三位大人物骨灰被移出八寶山,他們分別是誰?其中一人是開國上將

      三位大人物骨灰被移出八寶山,他們分別是誰?其中一人是開國上將

      文史達觀
      2025-09-08 20:13:26
      張蘭不聽勸,繼續曬孫子孫女,給孩子們夾菜很溫馨,馬筱梅不出鏡

      張蘭不聽勸,繼續曬孫子孫女,給孩子們夾菜很溫馨,馬筱梅不出鏡

      好賢觀史記
      2026-01-26 16:41:09
      央國企“近親繁殖”嚴查升級,擴大到四類關系!

      央國企“近親繁殖”嚴查升級,擴大到四類關系!

      環球通信
      2026-01-27 21:36:41
      人民日報鐘聲:必須遏制日本推進“新型軍國主義”

      人民日報鐘聲:必須遏制日本推進“新型軍國主義”

      上觀新聞
      2026-01-27 06:39:06
      遼籃52分大勝對手,烏戈賽后點評獲專家一致認可

      遼籃52分大勝對手,烏戈賽后點評獲專家一致認可

      三秋體育
      2026-01-27 22:44:01
      看到槍手輸球感覺如何?多庫:倒也不是開心,我們要專注自己

      看到槍手輸球感覺如何?多庫:倒也不是開心,我們要專注自己

      懂球帝
      2026-01-27 23:17:04
      收回臺灣不是最重要的,只要確保俄羅斯不敗,中國將迎百年大變局

      收回臺灣不是最重要的,只要確保俄羅斯不敗,中國將迎百年大變局

      阿器談史
      2026-01-26 16:34:59
      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      紀實:女子強迫情夫老公三人同床,逼丈夫看兩人茍合,結局釀慘案

      談史論天地
      2026-01-23 10:04:14
      王玉雯和楊玏分手實錘!狗仔大爆猛料,兩人有豪宅,戀情早有裂痕

      王玉雯和楊玏分手實錘!狗仔大爆猛料,兩人有豪宅,戀情早有裂痕

      李健政觀察
      2026-01-27 14:13:25
      沒想到,讓43歲郭晶晶發愁的,不是自己三個孩子,而是42歲的二弟

      沒想到,讓43歲郭晶晶發愁的,不是自己三個孩子,而是42歲的二弟

      手工制作阿殲
      2026-01-28 03:09:52
      薄一波的兩位親家,一位開國將軍,另一位官至副國級,分別是誰?

      薄一波的兩位親家,一位開國將軍,另一位官至副國級,分別是誰?

      獵火照狼山
      2025-05-28 18:04:02
      對越自衛反擊戰黃干宗被越女兵擄走生子,回國后想接她們來中國

      對越自衛反擊戰黃干宗被越女兵擄走生子,回國后想接她們來中國

      嘮叨說歷史
      2026-01-23 15:00:15
      2026-01-28 05:39:00
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應用精選與評測
      421文章數 47關注度
      往期回顧 全部

      科技要聞

      馬化騰3年年會講話透露了哪些關鍵信息

      頭條要聞

      美報告稱中國是其19世紀以來面對過的最強大國家

      頭條要聞

      美報告稱中國是其19世紀以來面對過的最強大國家

      體育要聞

      冒充職業球員,比賽規則還和對手現學?

      娛樂要聞

      張雨綺風波持續發酵,曝多個商務被取消

      財經要聞

      多地對壟斷行業"近親繁殖"出手了

      汽車要聞

      標配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗車下線

      態度原創

      數碼
      親子
      游戲
      家居
      藝術

      數碼要聞

      這事你怎么看 索尼與TCL簽署意向備忘錄 網友:Sony變Tony了

      親子要聞

      雙職工家庭,孩子上幼兒園后,無老人幫忙,夫妻倆能獨立帶娃嗎?

      LPL春季賽:決絕讓一追二,AL三局擊潰IG,大家的排名都不變

      家居要聞

      現代古典 中性又顯韻味

      藝術要聞

      14位西方著名畫家的女性肖像畫!

      無障礙瀏覽 進入關懷版