<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenAI前CTO首個創業產品Tinker,全量升級開放了,還有羊毛可薅

      0
      分享至



      機器之心發布

      當 OpenAI 前 CTO Mira Murati 創立的 Thinking Machines Lab (TML) 用 Tinker 創新性的將大模型訓練抽象成 forward backward,optimizer step 等?系列基本原語,分離了算法設計等部分與分布式訓練基礎設施關聯,把 “訓練” 大模型變成了簡單的 “函數調用” 時,行業進入一場從 “作坊式煉丹” 到 “工業化微調” 的升級。

      潞晨云微調 SDK 正式開放上線:基于 Thinking Machine Lab 開源的 Tinker SDK 構建,作為國內首個兼容 Tinker 范式且全面開放的 Serverless 微調平臺,為復雜昂貴的強化學習提供更具成本優勢的工業級解法 —— 開發者無需囤卡,rollout→reward→update 全鏈路按 Token 計價,讓每一分錢都花在產生梯度的 “刀刃” 上。

      擁抱后訓練與 RL

      算法層與底層算力架構的解耦

      隨著 OpenAI o1 在推理能力上的突破,業界逐漸形成共識:大模型的能力突破已不再單純依賴預訓練(Pre-training)階段的參數堆砌,后訓練(Post-Training) 特別是強化學習正成為決定模型實用價值的核心戰場。以 DeepSeek?R1 為例,僅靠強化學習訓練,模型在 AIME 數學推理基準上的 pass@1 從 15.6% 提升至 77.9%,充分展示了 RL 在低數據量條件下即可實現大幅能力躍升,迅速成為后訓練賽道的新范式。

      然而,擺在算法工程師面前的問題依舊嚴峻。強化學習涉及到更為復雜的系統設計,訓練過程中存在一系列的問題,如多個模型的優化,數據的傳遞,以及模型權重的傳遞;一系列工程化的工作,給算法的設計帶來了更多的困難,同時也對基礎設施提出了更高的要求。

      Tinker 的出現,就是為了解決這個問題:把繁雜訓練變成標準易用的 API。

      潞晨云把這一范式寫進底層假設,算法設計與基礎設施解耦—— 開發者只負責定義數據與 Loss 函數,底層的異構集群調度、并行策略優化、容錯運維等應被封裝為基礎設施服務,對開發者實現全托管與無感支持

      致敬創新,更致力于落地。潞晨云微調 SDK 兼容 Tinker 接口, 消除了從 “算法靈感” 到 “模型落地” 之間的工程化壁壘,在零代碼微調與裸機全手寫之間落在最佳平衡點,將研究精力和算力成本從集群運維還原至算法本身,帶給開發者 “本地寫碼,云端計算的 “訓練即服務(Training as a Service)” 流暢體驗 。



      潞晨云微調 SDK 今日起全量開放,前 150 名用戶通過專屬鏈接注冊,可獲得 30 元 Token 使用額度:

      https://cloud.luchentech.com/account/signup?invitation_code=JQZX

      顛覆性人力效能比

      1 名算法工程師頂替原龐大 Infra 團隊

      潞晨云微調 SDK 的核心思路可以概括為:算法工程師定義算法邏輯,潞晨云搞定 Infra 。

      在傳統的開發中,用戶往往要花大量精力去租賃合適的算力集群、管理環境配置、調訓練框架和集群運維。但潞晨云將大模型訓練拆解成了一組標準的函數原語,打通了從 SFT 到 RL 的全鏈路

      • Forward & Backward: 處理前向傳播與梯度計算
      • Optimizer Step: 執行權重更新策略
      • Sample (Rollout): 做推理生成和評估,使用戶不僅可以完成 SFT,更能輕松構建 PPO、GRPO、DPO 等復雜的強化學習(RLHF/RLAIF)訓練流
      • Save State: 管理模型檢查點與狀態保存



      這意味著,用戶可以在本地熟悉的 Jupyter Notebook 或 IDE 里,用最標準的 Python 語法像搭積木一樣自由組合,掌控訓練邏輯的細節。

      這種模式帶來了顛覆性的‘人力效能比’提升:它將原本需要運維工程師、Infra 工程師、平臺工程師和算法工程師緊密配合的龐大團隊,簡化為了‘一個算法工程師’的獨立閉環。

      用戶不再被底層繁雜的基建拖累,不再背負多職能的枷鎖,也不再是黑盒填參的被動執行者,而是能夠獨立駕馭大規模訓練流的主動設計師。無論是監督微調(SFT)還是更復雜的強化學習(RL)Pipeline,都能通過組合這些原子函數來靈活構建。



      為什么這種體驗如此絲滑?

      為了實現極致的流暢度,潞晨云基于現有的 GPU 云服務架構實現了一套完整的后端系統。在具體實現中,潞晨云采用控制面與計算面分離設計,通過統? API Server 管理跨地域的多個 GPU 計算集群,實現多云部署能力。核心采用基于 Future 模式的異步 API,所有訓練操作?持非阻塞調用,用戶無需等待 GPU 計算完成即可繼續執行后續邏輯。



      潞晨云微調 SDK 還具備智能隊列系統,即使在資源洪峰期,任務也會自動進入持久化隊列(Persistence Queue),一旦底層資源可用,毫秒級啟動,隊列等待期間 0 計費,僅對實際 prefill + sample + train 的 Token 量收費,無資源閑置,將用戶每一分錢都用在產生梯度的刀刃上。

      模型微調的算力零售革命

      從 “包機租賃” 到 “按 Token 計費”

      如果說 “易用性” 是后訓練平臺的入場券,那么 “成本結構” 則是決定誰能走得更遠的護城河。

      在傳統云主機的 “包機 / 時租” 模式中,用戶一直在為 “過程” 買單 —— 無論是在加載數據、調試代碼,還是僅僅在思考 Loss 函數,只要占用了顯卡,計費表就在跳動。這種模式下,開發過程中有一半以上的預算都浪費在了這些沒有實際產出的 “垃圾時間” 里。

      潞晨云為微調大模型場景引入了 Serverless 架構,推行 “按 Token 計費” 的商業模式,將微調場景的算力服務切分到了最細的顆粒度:

      • 為價值付費: 就像使用推理 API 一樣,用戶只需為 Prefill (輸入)、Sample (推理輸出) 和 Train (訓練) 產生的有效計算 Tokens 量付費。
      • 其他環節全免費: 本地代碼調試、環境配置、數據預處理、模型 Checkpoint 保存…… 這些在傳統租卡模式下分秒必爭的環節,在潞晨云全部免費
      • 極致性價比:通常,RL 需要同時維護高吞吐的推理集群(vLLM)和訓練集群,算力成本極高。但在潞晨云上,實測基于官方 Cookbook 的 math_rl recipe 跑通包含 Rollout 采樣、Reward 評分和 PPO 更新的完整 RL 流程(~300 steps),總算力成本僅8.61 元。這意味著,個體開發者也能低成本復現 RLHF/RLAIF 探索。



      技術落地的三個場景

      SFT 與 RL 同時 “開箱即用”

      這種新模式,也將徹底改變不同領域開發者的工作流:

      • 科研場景:告別資源焦慮

      學術界,時間與算力往往是最緊缺的資源。研究人員不僅要面對繁瑣的集群運維(Slurm/Docker 配置),還要應對昂貴的實驗復現成本。潞晨云微調 SDK 支持 “白盒級” 的科研探索,全面兼容 Tinker API。研究人員可以自定義 Evaluation 邏輯、通過 Forward/Backward,Sample 等原語精確控制后訓練和強化學習 Pipeline,而無需關心底層的分布式實現,讓實驗復現成本大幅降低。

      • 創業與獨立開發:極速驗證 MVP

      對于初創團隊,“快” 是生存根本。利用潞晨云微調 SDK 的 Serverless 特性,開發者無需等待資源排期。配合極低的 Token 成本,實測從 pip install 到跑通一個包含 1000 條樣本的 SFT 或 RL 微調實驗,僅需數分鐘。這種極致的邊際成本,讓創業者敢于在有限預算下快速迭代 Reward 模型,實現真正的 “低成本試錯”。

      • 工業級落地:復雜架構突圍

      在金融、醫療等垂直領域的工業應用中,已有微調 API 往往難以應對復雜的異構架構與 RLHF/RLAIF 需求。潞晨云微調 SDK 允許工程師通過 train_step 自由定義 Loss 邏輯與強化學習獎勵函數。開發者擁有對模型權重與訓練細節的完整控制權,實現端到端定制。

      極簡實戰:三步上手

      沒有復雜的集群配置,沒有冗長的 Docker 構建。使用潞晨云微調 SDK,訓練一個大模型就像寫普通 Python 腳本一樣簡單:

      1.Install & Import:

      Bashpip install hpcai

      2.Initialize Client: 目前已支持 Qwen3 系列 (4B-32B) ,更多模型即將上線

      Pythonimport hpcai# 初始化 LoRA 訓練客戶端,無需配置復雜的分布式參數training_client = service_client.create_lora_training_client ( base_model="Qwen/Qwen3-4B", rank=32)

      3.Define Training Loop & Run: 像在本地寫 PyTorch 一樣,擁有對訓練循環的完整控制權:

      Python# 訓練循環:完全可控forstepinrange(target_steps): # 前向與反向傳播 fwd_bwd = training_client.forward_backward (batch,"cross_entropy") # 優化器步進 optim = training_client.optim_step (adam_params) # 實時獲取 Loss 進行監控 loss = fwd_bwd.result ().metrics.get("loss:mean")

      目前,微調 SDK 已覆蓋 Qwen3 系列模型(4B、8B、14B、32B),支持監督學習和強化學習訓練方式,并將持續擴展更多模型能力與細分落地場景,大家也可以向官?提交需求 push 更新。

      平臺還準備了開箱即用的 HPC-AI Cookbook,提供包括DeepSeek-R1 GRPO 算法、基于 Verifier 的數學推理、自定義 Reward 函數等復雜 RL 場景的完整代碼實現。開發者無需從零構建復雜的 PPO/GRPO 流水線,只需復制 Cookbook 中的 “配方”,運行輕量級本地 train.py 腳本,即可驅動云端復雜的分布式 RL 訓練流,在潞晨云上復現具備復雜邏輯推理能力的 SOTA 模型。

      現在體驗

      后訓練正從學術支線升級為工程主線,AI 基礎設施的終極形態應該是 “零認知負荷”—— 開發者只需描述數據與算法,其余(租卡、配環境、并行策略、運維調度、故障自愈,乃至 RL 涉及的一系列工程化的工作)全部下沉到用戶無感。當 GPU 閑置成本趨近于 0,環境配置時間趨近于 0,長序列 RLHF 也能按 Token 即時計費,應用創新效率直接逼近算力上限。

      潞晨云微調 SDK 今日起全量開放:

      • 無需白名單,無需預約
      • 前 150 名注冊即得 30 元體驗金(填寫專屬福利碼 JQZX)

      把資源彈性交給平臺,把算法自由度留給自己,每一分錢都用在產生梯度的刀刃上!

      • 立即體驗:https://cloud.luchentech.com/fine-tuning
      • 使用文檔:https://cloud.luchentech.com/doc/docs/finetune-sdk/

      Reference

      [1] Tinker SDK: https://github.com/thinking-machines-lab/tinker

      [2] DeepSeek-R1: https://arxiv.org/pdf/2501.12948

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      畫火吳營村日入800萬,卻喂不飽村民貪婪!他要逃離,太寒心

      畫火吳營村日入800萬,卻喂不飽村民貪婪!他要逃離,太寒心

      鋭娛之樂
      2026-01-04 21:37:14
      身份證尾號“Ⅹ”不讀“叉”,也不讀“??怂埂?,正確讀法是啥?

      身份證尾號“Ⅹ”不讀“叉”,也不讀“埃克斯”,正確讀法是啥?

      潘軮旅行浪子
      2026-01-08 17:27:25
      闞清子被曝生早夭畸形兒后,憂心的事發生,其車輛一直未離開醫院

      闞清子被曝生早夭畸形兒后,憂心的事發生,其車輛一直未離開醫院

      聚焦最新動態
      2026-01-09 06:36:13
      電視劇《三體:大史》登央視2026片單,劉慈欣監制

      電視劇《三體:大史》登央視2026片單,劉慈欣監制

      IT之家
      2026-01-09 23:38:09
      日方召見中國大使抗議,吳江浩大使當場駁回:中方意志不會改變

      日方召見中國大使抗議,吳江浩大使當場駁回:中方意志不會改變

      博覽歷史
      2026-01-09 17:58:48
      鄭告蔣家后代:蔣介石逝哪葬哪,是對全體中國人民的最好安排!

      鄭告蔣家后代:蔣介石逝哪葬哪,是對全體中國人民的最好安排!

      扶蘇聊歷史
      2025-12-26 16:08:12
      趙本山:我拯救了一個惡毒女人的演藝生涯,她卻忘恩負義踩我上位

      趙本山:我拯救了一個惡毒女人的演藝生涯,她卻忘恩負義踩我上位

      芳芳歷史燴
      2025-07-23 17:53:28
      “世界已不再建立在歐洲價值觀之上”

      “世界已不再建立在歐洲價值觀之上”

      觀察者網
      2026-01-10 15:16:04
      最新民調:絕大多數美國人反對武力接管格陵蘭島

      最新民調:絕大多數美國人反對武力接管格陵蘭島

      參考消息
      2026-01-09 19:36:25
      地球真的病了?塔克拉瑪干迎來2026年初雪,中國最干的地方濕了

      地球真的病了?塔克拉瑪干迎來2026年初雪,中國最干的地方濕了

      游者走天下
      2026-01-07 14:41:55
      “比凌遲還要難受!”山東小伙將截肢,醫生把10萬只活蛆放其身上

      “比凌遲還要難受!”山東小伙將截肢,醫生把10萬只活蛆放其身上

      有書
      2026-01-09 21:45:29
      四川高縣一村支書暴打殘疾村婦致輕傷二級!法院:免于刑事處罰!

      四川高縣一村支書暴打殘疾村婦致輕傷二級!法院:免于刑事處罰!

      兵叔評說
      2026-01-07 12:13:15
      樸槿惠出獄生活:住別墅,與小10歲律師為伴,如今生活安逸

      樸槿惠出獄生活:住別墅,與小10歲律師為伴,如今生活安逸

      策略述
      2026-01-09 13:02:41
      美國得到格陵蘭島的三種可能路徑:只剩3年任期的特朗普VS千年命運考量的島民

      美國得到格陵蘭島的三種可能路徑:只剩3年任期的特朗普VS千年命運考量的島民

      紅星新聞
      2026-01-09 19:24:42
      比福建艦還大!4艘萬噸巨船同時出塢,美這才明白,輸給中國了

      比福建艦還大!4艘萬噸巨船同時出塢,美這才明白,輸給中國了

      趣文說娛
      2026-01-07 18:25:45
      北京“刻小貓章的大爺”火了,但他有點茫然……

      北京“刻小貓章的大爺”火了,但他有點茫然……

      環球網資訊
      2026-01-10 09:42:53
      樸鎮燮:我正在找中文老師;隊友們經常帶我去韓餐館吃飯

      樸鎮燮:我正在找中文老師;隊友們經常帶我去韓餐館吃飯

      懂球帝
      2026-01-10 15:52:09
      退休金多少才能養活自己?3位老人同時說出這個數,你達標了嗎?

      退休金多少才能養活自己?3位老人同時說出這個數,你達標了嗎?

      蟬吟槐蕊
      2025-12-19 11:20:22
      島內最新民調出爐,蔣萬安橫掃;鄭麗文赴陸時間已定,吳成典促統

      島內最新民調出爐,蔣萬安橫掃;鄭麗文赴陸時間已定,吳成典促統

      影孖看世界
      2026-01-10 13:27:15
      俄反潛機首次在北極完成空中加油!聯合國安理會將召開烏克蘭局勢緊急會議!烏全境頻遭空襲,我使館發布重要提醒

      俄反潛機首次在北極完成空中加油!聯合國安理會將召開烏克蘭局勢緊急會議!烏全境頻遭空襲,我使館發布重要提醒

      每日經濟新聞
      2026-01-10 14:13:09
      2026-01-10 18:28:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12088文章數 142534關注度
      往期回顧 全部

      科技要聞

      傳DeepSeek準備第二次震驚全世界

      頭條要聞

      男生遭老師按地上強制要求剪頭發 被老師勒脖子騎身上

      頭條要聞

      男生遭老師按地上強制要求剪頭發 被老師勒脖子騎身上

      體育要聞

      怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

      娛樂要聞

      吳速玲曝兒子Joe是戀愛腦

      財經要聞

      這不算詐騙嗎?水滴保誘導扣款惹眾怒

      汽車要聞

      寶馬25年全球銷量246.3萬臺 中國仍是第一大市場

      態度原創

      房產
      旅游
      親子
      藝術
      軍事航空

      房產要聞

      66萬方!4755套!三亞巨量房源正瘋狂砸出!

      旅游要聞

      人均2萬多元的高端團被指名不副實,出行前3天行程突然變更,專屬項目取消

      親子要聞

      韓國女星公開備孕全過程,面對鏡頭忍不住落淚,疼到哭也堅持生孩

      藝術要聞

      你能認出毛主席手書的全部嗎?揭秘其中隱藏的秘密!

      軍事要聞

      ??沼⑿鄹呦枋攀?曾駕駛殲-6打爆美軍機

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产免费自拍视频| 精品人妻一区二区三区日产乱码| 大地影院高清在线观看免费使命| 99热久久这里只有精品| 久久天天躁夜夜躁狠狠I女人 | 国产精品亚洲综合久久小说| 永久黄网站色视频免费直播| 亚洲国产av一区二区三区四区| 欧美成人免费全部| 久久人妻精品白浆国产| 人人肏屄| 少妇粉嫩小泬喷水视频www| 一 级 黄 色 片免费网站| 九色91| 国产一区二三区| 老熟妇老熟女老女人天堂| 国产精品揄拍100视频| 亚洲鲁丝片一区二区三区| 亚洲黑人av| 中文字幕一精品亚洲无线一区| 亚洲成在人线视av| 日韩欧美亚洲综合久久| 大地资源中文在线观看西瓜| 人妻少妇精品久久久久久0000| 国产美女裸体无遮挡免费视频| 亚洲30p| 青青草无码免费一二三区| а√天堂最新版在线资源| a毛片免费在线观看| 久久久噜噜噜久久中文字幕色伊伊| 国产精品自在线拍国产| 久久久精品波多野结衣| 国产成人精品无码片区在线观看| www插插插无码视频网站| 亚洲精品字幕| 你懂的国产在线| 91狼友社| 日韩91| 久久国产精品老人性| 久久精品人妻无码一区二区三区| 最新国产精品久久精品|