<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      五年,終于等來Transformers v5

      0
      分享至



      機器之心報道

      編輯:+0、陳陳

      剛剛,Transformers v5 發布首個 RC(候選) 版本 v5.0.0rc0。



      GitHub:https://github.com/huggingface/transformers/releases/tag/v5.0.0rc0

      這次更新標志著這一全球最流行的 AI 基礎設施庫,正式跨越了從 v4 到 v5 長達五年的技術周期。

      作為 Hugging Face 最核心的開源項目,自 2020 年 11 月 v4 版本發布以來,Transformers 的日下載量已從當時的 2 萬次激增至如今的超過300 萬次,總安裝量突破12 億次

      它定義了業界如何使用模型,支持的架構也從最初的 40 個擴展至超過400 個,涵蓋了文本、視覺、音頻及多模態領域,社區貢獻的模型權重更是超過75 萬個,涵蓋了文本、視覺、音頻及多模態領域。

      官方表示,在人工智能領域,「重塑」是保持長盛不衰的關鍵。Transformers 作為生態系統中領先的模型定義庫,需要不斷演進并調整庫的形態,以保持其相關性。

      v5 版本將 PyTorch 確立為唯一核心后端,并聚焦于四大維度的進化:極致的簡潔性、從微調邁向預訓練、與高性能推理引擎的互操作性,以及將量化提升為核心功能。

      簡潔性

      團隊的首要關注點是簡潔性。

      Hugging Face 希望模型的集成方式是干凈、清晰的。簡潔性能夠帶來更廣泛的標準化、更強的通用性,以及更全面的生態支持。

      新增模型

      從本質上講,Transformers 始終是一個模型架構工具箱。Hugging Face 目標是收錄所有最新的模型架構,并成為模型定義的唯一可信來源。

      在過去 5 年里,平均每周新增 1–3 個新模型,時間線如下圖所示:



      • 模塊化方法

      在過去一年里,Hugging Face 大力推進模塊化設計。這種方式使維護更簡單、集成速度更快,并能促進社區之間的協作。



      盡管 Hugging Face 始終尊崇「一個模型,一個文件」的哲學,但他們仍在不斷引入一些抽象層,以簡化通用輔助函數的管理。這方面最典型的例子就是引入了 AttentionInterface,它為注意力機制提供了一個集中的抽象層。Eager 方法將保留在建模文件中;而其他方法,如 FA1/2/3 (FlashAttention)、FlexAttention 或 SDPA,則被移至該接口中。

      • 模型轉換工具

      Hugging Face 也正在大力構建工具,以幫助識別某個新模型與現有模型架構之間的相似性。該功能通過機器學習來發現不同模型文件之間的代碼相似度。

      進一步來說,Hugging Face 希望自動化模型轉換流程:當有新模型需要集成到 Transformers 中時,系統將自動創建一個草稿 PR(Pull Request),將其轉換成符合 Transformers 格式的版本。

      這一流程將減少大量手動工作,并確保整體的一致性。

      代碼精簡

      • 精簡 Modeling & Tokenization/Processing 文件

      Hugging Face 對建模文件和標注相關文件也進行了大規模重構。

      得益于前文提到的模塊化方法,加上對不同模型之間的統一標準化,建模文件得到了顯著改善。標準化讓許多不真正屬于模型本體的工具都被抽象出去,使建模代碼只保留模型前向 / 反向傳播所需的核心部分。

      與此同時,v5 也在簡化 tokenization & processing 文件:未來將只關注 tokenizers 后端,并移除 Fast 和 Slow tokenizer 這兩個概念。

      圖像處理器今后也將只保留 fast 版本,這些版本依賴 torchvision 作為后端。

      最后,v5 將逐步停止對 Flax / TensorFlow 的支持,轉而專注于 PyTorch 作為唯一后端;不過團隊也在與 JAX 生態合作伙伴協作,以確保模型能夠與該生態兼容。

      PyTorch 基金會執行董事、Linux 基金會 AI 部總經理 Matt White 表示:隨著 v5 版本的發布,Transformers 正全面轉向 PyTorch。

      訓練

      關于 v5 版本的訓練仍然是團隊工作的重點,之前 Hugging Face 專注于微調而不是大規模預訓練以及完整訓練,v5 加大了對后者的支持。

      預訓練

      為了支持預訓練,Hugging Face 重新設計了模型初始化方式,同時也加入了對前向與反向傳播優化算子支持。目前,v5 已經與 torchtitan、megatron、nanotron 等工具實現了更廣泛的兼容。

      微調與后訓練

      Hugging Face 表示將繼續與 Python 生態系統中的所有微調工具保持緊密合作。同時,Hugging Face 也在與 JAX 生態中的 MaxText 等工具兼容,以確保他們的框架與 Transformers 之間具備良好的互操作性。

      現在,所有微調和后訓練工具都可以依賴 Transformers 作為模型定義的來源;這也進一步可以通過 OpenEnv 或 Prime Environment Hub 來支持更多的 Agentic 使用場景。

      推理

      推理也是 v5 優化的重點方向之一,Hugging Face 帶來了多項范式級的更新:包括專用內核、更干凈的默認設置、新的 API,以及優化對推理引擎的支持。

      此外,和訓練階段類似,Hugging Face 也投入了大量精力來封裝推理內核。

      在這項工作之外,他們還為推理新增了兩個專用 API:

      • 連續批處理和 paged attention 機制。這些功能已經在內部開始使用,之后會有使用指南放出。
      • 全新的 transformers serve 服務系統,可部署一個兼容 OpenAI API 的服務器,用于部署 Transformers 模型。

      在 v5 的更新中,Hugging Face 明確強化了對推理場景的支持,尤其是像模型評估這類需要同時處理大量請求的任務。

      值得注意的是,Transformers v5 的定位并不是取代 vLLM、SGLang、TensorRT-LLM 這樣的專業推理引擎。相反,他們的目標是與這些引擎實現兼容。

      生產環境

      本地部署

      團隊與最流行的推理引擎緊密合作,從而能夠將 Transformers 作為后端使用。這帶來了顯著的價值:只要某個模型被添加到 Transformers 中,它就會立即在這些推理引擎中可用,同時還能充分利用各引擎的優勢,例如推理優化、專用內核、動態批處理等。

      另外,Hugging Face 也在與 ONNXRuntime、llama.cpp 和 MLX 展開密切合作,以確保 Transformers 與這些建模庫之間具有良好的互操作性。例如,得益于社區的大量努力,現在在 Transformers 中加載 GGUF 文件以進行進一步微調變得非常簡單。反之,也可以輕松地將 Transformers 模型轉換為 GGUF 文件,以便在 llama.cpp 中使用。

      對于 MLX 而言也是如此,transformers 的 safetensors 文件可以直接兼容 MLX 的模型。

      最后,Hugging Face 也在推動本地推理的邊界,并與 executorch 團隊緊密合作,讓 Transformers 模型能夠在設備端直接運行,對多模態模型(視覺、音頻)的支持也在快速擴展中。

      量化

      量化正迅速成為當代前沿模型開發的標準,許多 SOTA 模型如今都以低精度格式發布,例如 8-bit 和 4-bit(如 gpt-oss、Kimi-K2、DeepSeek-R1)。

      緊跟技術前沿,v5 將量化作為 Transformers 的核心能力之一,確保它能夠與主要功能完全兼容,并為訓練與推理提供一個可靠的量化框架。

      參考鏈接:https://huggingface.co/blog/transformers-v5

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      欺騙了全世界的把戲,巴沙爾真的亡國了?泰國:別信,都是障眼法

      欺騙了全世界的把戲,巴沙爾真的亡國了?泰國:別信,都是障眼法

      小莜讀史
      2025-12-06 16:44:11
      欠債166億,頂流顧不得體面了

      欠債166億,頂流顧不得體面了

      陳天宇
      2025-12-02 00:10:05
      每天這樣跪趴10分鐘,內分泌正常了,肩頸腰背都不痛了!

      每天這樣跪趴10分鐘,內分泌正常了,肩頸腰背都不痛了!

      瑜伽解剖學
      2025-11-26 16:19:27
      濟南一小區地下車庫突發大火!多車燒成鐵架 疑似電動車起火引關注

      濟南一小區地下車庫突發大火!多車燒成鐵架 疑似電動車起火引關注

      奇葩游戲醬
      2025-12-08 09:48:43
      沒SGA仍30分大勝,豪取15連勝!霍姆格倫25分9板,杰威25分8助

      沒SGA仍30分大勝,豪取15連勝!霍姆格倫25分9板,杰威25分8助

      無術不學
      2025-12-08 11:52:45
      CBA俱樂部杯8強決出7席,僅1黑馬,8強戰對陣出爐,滬粵強強對話

      CBA俱樂部杯8強決出7席,僅1黑馬,8強戰對陣出爐,滬粵強強對話

      萌蘭聊個球
      2025-12-07 22:20:57
      原來有這么多不體面但掙錢的小生意!原來都是悶聲發大財啊!

      原來有這么多不體面但掙錢的小生意!原來都是悶聲發大財啊!

      另子維愛讀史
      2025-12-06 22:09:07
      他是梁山最陰狠之人,不懼宋江公然發起兵變,后妻妾成群得以善終

      他是梁山最陰狠之人,不懼宋江公然發起兵變,后妻妾成群得以善終

      銘記歷史呀
      2025-12-07 19:01:05
      徐靜雨:如果這是詹姆斯的最后一季,費城主場球迷則不虛此行

      徐靜雨:如果這是詹姆斯的最后一季,費城主場球迷則不虛此行

      懂球帝
      2025-12-08 11:49:50
      夢回巔峰!湖人112-108力克76人,看數據:他是頭號功臣!

      夢回巔峰!湖人112-108力克76人,看數據:他是頭號功臣!

      籃壇籃談
      2025-12-08 09:48:41
      15連勝!狂贏388分!NBA常規賽大結局

      15連勝!狂贏388分!NBA常規賽大結局

      籃球教學論壇
      2025-12-08 12:32:40
      連防守端的自信心都出來了!灰熊后場新星配得上一個先發的位置?

      連防守端的自信心都出來了!灰熊后場新星配得上一個先發的位置?

      稻谷與小麥
      2025-12-08 13:07:10
      火車員工用裝垃圾的簸箕接開水,12306回應:暫無規定不能用簸箕接水,會反饋改進

      火車員工用裝垃圾的簸箕接開水,12306回應:暫無規定不能用簸箕接水,會反饋改進

      極目新聞
      2025-12-07 16:35:20
      “走腎”黃暴,尺度盛宴,女主一個比一個“胸猛”,此片驚艷

      “走腎”黃暴,尺度盛宴,女主一個比一個“胸猛”,此片驚艷

      棱鏡電影
      2025-12-07 19:24:26
      廣東各地長途大巴,竟然復蘇了?

      廣東各地長途大巴,竟然復蘇了?

      知肇分子
      2025-12-07 20:25:15
      又一比賽獲獎名單復制百度人名大全,負責人:工作人員鉆空子

      又一比賽獲獎名單復制百度人名大全,負責人:工作人員鉆空子

      澎湃新聞
      2025-12-07 20:46:28
      斯卡洛尼戴白手套遞交世界杯,因凡蒂諾為儀式錯誤公開道歉

      斯卡洛尼戴白手套遞交世界杯,因凡蒂諾為儀式錯誤公開道歉

      懂球帝
      2025-12-07 20:45:08
      養牛場的秘密:兩年多未見一頭牛,每天盜采數十車礦石倒賣

      養牛場的秘密:兩年多未見一頭牛,每天盜采數十車礦石倒賣

      重案組37號
      2025-12-08 09:31:39
      一覺醒來,不僅賣電車的傻眼了,就連生產廠家也驚呆了!

      一覺醒來,不僅賣電車的傻眼了,就連生產廠家也驚呆了!

      今朝牛馬
      2025-12-06 12:21:16
      喀麥隆前主帥:埃托奧很自戀,他排擠奧納納等人參加非洲杯

      喀麥隆前主帥:埃托奧很自戀,他排擠奧納納等人參加非洲杯

      懂球帝
      2025-12-08 11:27:41
      2025-12-08 13:24:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11862文章數 142510關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      媒體:臺日竟然還想夾擊解放軍 笑話

      頭條要聞

      媒體:臺日竟然還想夾擊解放軍 笑話

      體育要聞

      厲害的后衛何其多 想想還少了哪一個

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      養牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰深圳地獄級路況 魏牌藍山VLA上車會思考聽得懂人話

      態度原創

      親子
      教育
      健康
      時尚
      軍事航空

      親子要聞

      家長帶孩子跑了很多家醫院,你是我們最后的希望

      教育要聞

      慈母多敗兒,到底是誰的錯

      甲狀腺結節到這個程度,該穿刺了!

      除了大衣,今年最火的外套一定就是它了!

      軍事要聞

      日本稱中方雷達照射日戰機 國防部回應

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品天干天干| 人妻 日韩精品 中文字幕| 成人国产亚洲欧美成人综合网 | 瑞丽市| 影音先锋你懂得| 成人av一区二区三区| 男女激情一区二区三区| 在线观看成人无码中文av天堂| 欧美丰满熟妇hdxx| 中文字幕天天躁日日躁狠狠躁免费| 修文县| 顺昌县| 日产国产精品亚洲系列| 成人午夜在线观看日韩| 夜夜躁天天躁很很躁| 欧美一区内射最近更新| 又黄又爽又色的视频| 丰腴饱满的极品熟妇| 美女黄网站人色视频免费国产| 宁安市| 亚洲日韩成人综合| 樱花草视频www日本韩国| 亚洲成a人无码| 国产精品亚洲一区二区三区喷水| 亚洲熟女视频| 国产精品18禁久久久久久白浆| 中文字幕日韩精品有码| 久久国产乱子伦免费精品| 后入内射无码人妻一区| 大学生久久香蕉国产线看观看 | 成人性生交大片免费看r链接| 日本一道高清一区二区三区| 男人吃奶摸下挵进去好爽| 艳妇臀荡乳欲伦交换在线播放| 日韩无码2020| 久久久久国产a免费观看rela| 国模小黎自慰gogo人体| 91青青草视频在线观看| 国产免费一区二区三区在线观看| 国产女人18毛片水真多1| 欧洲性开放老太大|