<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DeepSeek OCR論文引爆網(wǎng)絡(luò)!Andrej Karpathy:,我很喜歡;馬斯克:未來99%都是光子

      0
      分享至


      剛剛,AI大神Andrej Karpathy表示非常喜歡DeepSeek OCR 論文,原話:

      我相當(dāng)喜歡新的DeepSeek-OCR論文。它是一個很好的OCR模型(可能比dots稍微差一點),是的,數(shù)據(jù)收集等等,但無論如何都不重要。對我來說更有趣的部分(尤其是作為一個以計算機(jī)視覺為核心,暫時偽裝成自然語言的人)是像素是否比文本更適合作為LLM的輸入。文本標(biāo)記是否浪費且糟糕,作為輸入。

      還不知什么情況的看我這篇文章

      Karpathy認(rèn)為,拋開模型本身不談,deepseek這篇論文引出了一個更值得深思的問題:對于LLM來說,像素是否是比文本更優(yōu)越的輸入形式?文本Token是否既浪費又糟糕?

      他進(jìn)一步設(shè)想,或許所有LLM的輸入都只應(yīng)該是圖像。即便是純文本內(nèi)容,也應(yīng)該先渲染成圖片再輸入給模型

      Karpathy給出了支持這一構(gòu)想的四大核心理由:

      1. 更高的信息壓縮效率

      將文本渲染成圖像,可以實現(xiàn)更高的信息壓縮,這意味著更短的上下文窗口和更高的運行效率

      2. 更通用的信息流

      像素是一種遠(yuǎn)比文本更通用的信息流。它不僅能表示純文本,還能輕松捕捉粗體、彩色文本,甚至是任意的圖表和照片

      3. 默認(rèn)實現(xiàn)強(qiáng)大的雙向注意力

      像素化的輸入可以很自然、很輕松地默認(rèn)使用雙向注意力進(jìn)行處理,這種處理方式比自回歸注意力更為強(qiáng)大

      4. 徹底淘汰Tokenizer

      Karpathy毫不掩飾自己對Tokenizer的嫌棄。他認(rèn)為Tokenizer是一個丑陋、獨立、非端到端的階段。它引入了Unicode和字節(jié)編碼的所有丑陋之處,繼承了大量歷史包袱,并帶來了安全和越獄風(fēng)險(例如連續(xù)字節(jié)問題)

      他舉例說,Tokenizer會導(dǎo)致兩個在人眼看來完全相同的字符,在網(wǎng)絡(luò)內(nèi)部被表示為兩個完全不同的Token。一個笑臉emoji,在模型看來只是一個奇怪的Token,而不是一個由像素構(gòu)成的、真實的笑臉,這導(dǎo)致模型無法利用其視覺信息帶來的遷移學(xué)習(xí)優(yōu)勢。Tokenizer必須消失,他強(qiáng)調(diào)

      Karpathy總結(jié)道,OCR只是眾多視覺到文本(vision -> text)任務(wù)中的一種。而傳統(tǒng)的文本到文本(text -> text)任務(wù),完全可以被重構(gòu)成視覺到文本任務(wù),反之則不行

      他設(shè)想的未來交互模式可能是:用戶的輸入(Message)是圖像,而解碼器(Assistant的響應(yīng))的輸出仍然是文本。因為如何真實地輸出像素,或者是否有必要這樣做,目前還不明確

      核心爭議:雙向注意力與圖像分塊

      對于Karpathy的觀點,AI學(xué)者Yoav Goldberg提出了兩個疑問:


      1.為什么說圖像能輕松獲得雙向注意力,而文本不能?

      2.雖然沒有了Tokenization,但將輸入圖像切分成圖塊(Patches),難道不是一種類似且可能更丑陋的處理方式嗎?

      Karpathy對此進(jìn)行了解釋。

      他回應(yīng)說,原則上沒有任何東西阻止文本使用雙向注意力。但為了效率,文本通常都是以自回歸的方式進(jìn)行訓(xùn)練的。他設(shè)想,可以在訓(xùn)練中期加入一個微調(diào)階段,用雙向注意力來處理作為條件的信息(比如用戶的輸入消息,因為這些Token不需要模型去生成)。但他不確定在實踐中是否有人這樣做。理論上,為了預(yù)測下一個Token,甚至可以對整個上下文窗口進(jìn)行雙向編碼,但這將導(dǎo)致訓(xùn)練無法并行化

      最后他補(bǔ)充道,或許這個方面(雙向注意力)嚴(yán)格來說并非像素與Token的本質(zhì)區(qū)別,更多是像素通常被編碼(encoded),而Token通常被解碼(decoded)(借用原始Transformer論文的術(shù)語)

      馬斯克:未來99%是光子

      在這場討論的最后,Elon Musk也現(xiàn)身評論區(qū),并給出了一個更具未來感的判斷:


      從長遠(yuǎn)來看,AI模型超過99%的輸入和輸出都將是光子。沒有其他任何東西可以規(guī)模化

      馬斯克的這條評論并非隨口一說。他進(jìn)一步補(bǔ)充了一段堪稱硬核的宇宙學(xué)科普,來解釋為什么他認(rèn)為“光子”是終極的規(guī)模化方案

      簡單來說,宇宙中絕大多數(shù)的粒子都是光子

      而這些光子最主要的來源,是宇宙微波背景(CMB)。根據(jù)測算,CMB的光子密度約為每立方厘米410個。將這個密度乘以可觀測宇宙的巨大體積(半徑約465億光年),可以得出僅CMB貢獻(xiàn)的光子數(shù)量就達(dá)到了一個驚人的數(shù)字:約1.5 x 10??個

      相比之下,所有恒星發(fā)出的光子(星光)以及其他來源(如中微子背景、黑洞輻射等)貢獻(xiàn)的數(shù)量,則完全可以忽略不計

      這背后揭示的物理事實是:光子在數(shù)量級上擁有無與倫比的優(yōu)勢。這或許就是馬斯克認(rèn)為AI的未來輸入輸出將由光子主宰的底層邏輯

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      船東表態(tài):全面暫停涉俄所有航運業(yè)務(wù)

      船東表態(tài):全面暫停涉俄所有航運業(yè)務(wù)

      新浪財經(jīng)
      2025-12-08 07:25:14
      足球報:中赫接手國安9年已投80億,近兩年沒有屬地政府資金支持

      足球報:中赫接手國安9年已投80億,近兩年沒有屬地政府資金支持

      懂球帝
      2025-12-08 14:18:46
      72歲老戲骨濮存昕官宣外孫女出道,尖嘴猴腮,長相遭吐槽:太丑了

      72歲老戲骨濮存昕官宣外孫女出道,尖嘴猴腮,長相遭吐槽:太丑了

      深析古今
      2025-12-08 12:29:36
      0-2!姆巴佩失單刀,熊皇11場0球,皇馬主場爆冷,恐遭曼城吊打

      0-2!姆巴佩失單刀,熊皇11場0球,皇馬主場爆冷,恐遭曼城吊打

      我的護(hù)球最獨特
      2025-12-08 06:06:05
      國際巨頭確認(rèn)裁員!6000人將失業(yè)

      國際巨頭確認(rèn)裁員!6000人將失業(yè)

      支點財經(jīng)
      2025-12-08 09:53:08
      借調(diào)到市里2年被原單位催著回去,臨走前市長把我叫到辦公室

      借調(diào)到市里2年被原單位催著回去,臨走前市長把我叫到辦公室

      故事那點事
      2025-12-06 09:50:08
      中日戰(zhàn)機(jī)對峙創(chuàng)下3個首次,日方召見中國大使抗議,中方當(dāng)場駁斥

      中日戰(zhàn)機(jī)對峙創(chuàng)下3個首次,日方召見中國大使抗議,中方當(dāng)場駁斥

      時時有聊
      2025-12-08 07:19:38
      中日開戰(zhàn)概率到底有多大?答案震撼:日本敢開第一槍,就是結(jié)局!

      中日開戰(zhàn)概率到底有多大?答案震撼:日本敢開第一槍,就是結(jié)局!

      健身狂人
      2025-12-08 09:58:05
      楊振寧走后1個月,翁帆搬離別墅,穿帆布鞋吃食堂,帶走34箱東西

      楊振寧走后1個月,翁帆搬離別墅,穿帆布鞋吃食堂,帶走34箱東西

      禾寒?dāng)?/span>
      2025-11-28 19:07:41
      曾被中央通報違規(guī)聚餐飲酒致人死亡,魏栓師被開除黨籍和公職

      曾被中央通報違規(guī)聚餐飲酒致人死亡,魏栓師被開除黨籍和公職

      南方都市報
      2025-12-08 13:50:08
      黃循財強(qiáng)踩歷史雷區(qū)后,新加坡三線崩盤:內(nèi)政、外交與輿情全面失控

      黃循財強(qiáng)踩歷史雷區(qū)后,新加坡三線崩盤:內(nèi)政、外交與輿情全面失控

      阿離家居
      2025-12-08 12:06:28
      重磅決定!退休人員笑了?2026年養(yǎng)老金新政施行,每月多領(lǐng)多少!

      重磅決定!退休人員笑了?2026年養(yǎng)老金新政施行,每月多領(lǐng)多少!

      陳博世財經(jīng)
      2025-12-08 14:14:43
      我在邊境釋放被俘的女兵,35年后我訪問越南,剛落地就被軍車圍住

      我在邊境釋放被俘的女兵,35年后我訪問越南,剛落地就被軍車圍住

      張道陵秘話
      2025-12-04 16:36:04
      全體退休人員,12月養(yǎng)老金到賬后,千萬別急著花!先做這3件事

      全體退休人員,12月養(yǎng)老金到賬后,千萬別急著花!先做這3件事

      李博世財經(jīng)
      2025-12-08 10:49:40
      人民日報怒轉(zhuǎn)!杭州師大通報出爐:名單造假實錘,但是沒貪污!

      人民日報怒轉(zhuǎn)!杭州師大通報出爐:名單造假實錘,但是沒貪污!

      金哥說新能源車
      2025-12-08 09:57:15
      東方衛(wèi)視首播!35集諜戰(zhàn)巨制來襲,開播一天,口碑爆表。不輸潛伏

      東方衛(wèi)視首播!35集諜戰(zhàn)巨制來襲,開播一天,口碑爆表。不輸潛伏

      樂楓電影
      2025-12-08 15:41:04
      消防隊脫離武警后,如今是軍還是警?看完才知國家的良苦用心

      消防隊脫離武警后,如今是軍還是警?看完才知國家的良苦用心

      小莜讀史
      2025-12-08 13:06:39
      掃地出門!皇馬正式批準(zhǔn)出售“頭號廢柴”!1.1億歐強(qiáng)援“空降”

      掃地出門!皇馬正式批準(zhǔn)出售“頭號廢柴”!1.1億歐強(qiáng)援“空降”

      頭狼追球
      2025-12-08 11:13:44
      《三國演義》常被叫錯的12個名字,沒點文化張口就鬧笑話,你讀對了嗎?

      《三國演義》常被叫錯的12個名字,沒點文化張口就鬧笑話,你讀對了嗎?

      詩詞世界
      2025-12-06 06:04:09
      48歲男子因心梗猝死,生前堅持每天散步5公里,醫(yī)生:3個習(xí)慣致命

      48歲男子因心梗猝死,生前堅持每天散步5公里,醫(yī)生:3個習(xí)慣致命

      卡西莫多的故事
      2025-12-08 10:20:04
      2025-12-08 18:59:00
      AI寒武紀(jì) incentive-icons
      AI寒武紀(jì)
      專注于人工智能,科技領(lǐng)域
      1001文章數(shù) 375關(guān)注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      臺學(xué)者:殲-15開射控雷達(dá)照射F-15 反而是日本撿到寶

      頭條要聞

      臺學(xué)者:殲-15開射控雷達(dá)照射F-15 反而是日本撿到寶

      體育要聞

      一位大學(xué)美術(shù)生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經(jīng)要聞

      重磅!政治局會議定調(diào)明年經(jīng)濟(jì)工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態(tài)度原創(chuàng)

      親子
      本地
      旅游
      健康
      公開課

      親子要聞

      這屆家長,花5000元讓孩子“離8米遠(yuǎn)看書”,有用嗎?

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      旅游要聞

      “趣唱、趣跑、趣逛” 豐富游園體驗,世紀(jì)公園持續(xù)探索“公園+”

      甲狀腺結(jié)節(jié)到這個程度,該穿刺了!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 婷婷国产成人精品视频| 人妻少妇嫩草被猛烈进入无码蜜桃| 99久久精品免费看国产一区二区三区| 人妻人人摸| 99中文在线精品| 日韩久久精品| 中文字幕人妻系列| 黄色V国产| 国产?熟女| A级毛片18以上观看视频免费| 中文字幕A片免费观看| 91精品网| 91在线亚洲| 中文字幕A片无码免费看| 国产制服丝袜在线视频观看| 亚洲最大的成人网| 天堂网亚洲综合在线| 丁香五月亚洲综合深深爱| 国产午夜精品理论大片| 国产精品成人av电影不卡| 国产稚嫩高中生呻吟激情在线视频| 婷婷六月天在线| 亚洲sm另类一区二区三区| 国产女人18毛片水真多1| 一区二区三区免费| 久久久久人妻精品一区三寸| 日本一卡2卡3卡4卡无卡免费| 国产综合AV| 韩色区| www.youjizz日本| 中文字幕一级A片免费看| 富婆熟妇熟女二区三区| 青青草论坛| 金典黄色网| 射洪县| 国产97色在线| 国内自拍欧美亚洲| 鹤岗市| 亚洲一页在线| 欧美中文字幕人妻系列| 性生交片免费无码看人|