<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      字節的“羅福莉”,撐起了Seedance的半邊天

      0
      分享至




      隨著小米新模型的推出,“天才少女”羅福莉再度成為焦點。其實在AI科學家圈子里,女性數量雖然相對較少,但也絕非羅福莉一顆獨苗。在字節跳動,就有一位羅福莉式的人物。

      她就是Seedance 2.0視頻生成模型的預訓練負責人,曾妍。

      一般聊起Seedance 2.0,大家普遍想到的人是掌舵人吳永輝、研發負責人周暢、視頻生成技術核心負責人蔣璐。

      很少有人知道,曾妍的存在,同樣無可或缺。

      因為預訓練是整個模型的“基石”,它決定了模型的能力上限。

      大多數人把預訓練當成“喂數據”,但真正的高手知道,預訓練是在“塑造模型的世界觀”。

      數據怎么配比、架構怎么設計、訓練策略怎么調整,每一個決策都在決定模型能看到什么、理解什么、生成什么。

      無論你后面怎么努力優化,預訓練只要沒做好,這個模型就一輩子達不到Seedance 2.0現如今的高度。

      不僅是貢獻大,曾妍的晉升速度在字節也是相當快的。

      從她畢業進入字節開始算起,到現在的4-2職級,曾妍僅僅花了5年時間。

      4-2職級對應高級總監/權威架構師層級,屬于公司核心戰略級技術骨干,年包(含基本工資、年終獎、股票)普遍在500萬以上。

      她到底做了什么,才有如此成就?讓我們從她的求學之路說起。

      01

      從西交到字節

      說實話,當我第一次看到曾妍的履歷時,并沒有覺得特別驚艷。

      1997年出生,西安交通大學本科,加拿大蒙特利爾大學計算機碩士。這條路徑放到現在的AI圈里太常見了。

      但接下來發生的事,就不那么“標準”了。

      2021年9月,曾妍以校招生身份加入字節跳動 AI Lab,起點職級是算法工程師。

      入職僅兩個月,曾妍就以第一作者身份在arXiv上發表了論文《Multi-Grained Vision Language Pre-Training: Aligning Texts with Visual Concepts》,也就是后來大家熟知的X-VLM模型。



      這篇論文解決的問題,用大白話說就是:怎么讓 AI 既能看懂“大場面”,又能注意到“小細節”。

      傳統的視覺語言模型有兩個極端。一種是“粗線條”派,只看圖像整體和文本的對應關系,就像你給AI看一張照片,它只能說“這是海灘”,但說不出更多了。

      另一種是“顯微鏡”派,依賴昂貴的目標檢測器去摳每個物體,雖然能看到細節,但計算成本高得嚇人,還得依賴大量人工標注數據。

      曾妍提出的X-VLM,就是取兩者之所長。

      它能同時學習從整體到局部、從場景到物體、從粗到細的多層次視覺概念,并與文本中的不同粒度信息精準對齊。

      或者我用一個我最近剛學會的話來形容:既見森林,又見樹木。

      這個“多粒度對齊”的思想,在當時看起來只是個學術創新,但它為曾妍后來擔任Seedance 2.0預訓練負責人埋下了伏筆。

      因為視頻生成的預訓練,本質上也是個多粒度建模的問題。

      你要想生成一個好看的視頻,那就既要把握整體敘事節奏,讓一段視頻有連貫的故事線;又要控制每一幀的細節質量,確保人物面容不變形、物體運動符合物理規律;還要建立時序維度上的關聯關系,讓前后幀之間的過渡自然流暢。

      這剛和X-VLM的底層邏輯是一致的。

      接下來的兩年,曾妍就像開了掛一樣。

      她以第一作者身份在TPAMI、ICML、CVPR、ACL、NAACL等國際頂會發表了八篇論文,還擔任了TPAMI、ICML、NeurIPS、ICLR、ACL、EMNLP等頂會的審稿人。

      2023年,一個關鍵轉折點到來了。

      字節跳動成立大模型研究部門Seed,曾妍和所在團隊一同轉入。

      這個時間節點你得放在大背景下看,2022年底ChatGPT橫空出世,2023年初各大公司紛紛All in大模型,字節也在這波浪潮中調整了技術戰略。

      曾妍擅長的多模態預訓練,在視頻生成這個新戰場上,能發揮她的全部實力。

      在Seed部門,曾妍作為第一作者主導了兩個重要項目,分別是CCLM和Lynx。

      先說CCLM(Cross-View Language Modeling)。

      這個項目讓AI模型同時學會“跨語言”和“跨模態”的理解能力。CCLM通過統一的預訓練框架,讓在英文圖像-文本數據上訓練的模型,可以零樣本遷移到中文、日文等其他語言的多模態任務上。

      說白了,就是讓 AI 學會“舉一反三”——在英文視頻上學到的理解能力,能直接用到中文、日文、西班牙文的視頻上。

      再說Lynx。

      這是一個系統性研究如何訓練GPT-4風格多模態大語言模型的項目。2023年正是GPT-4剛發布的時候,大家都在摸索怎么做出“能看圖說話”的大模型。

      曾妍團隊通過一系列對比實驗,找出了模型架構設計、訓練數據配比、指令微調策略等關鍵因素,最終做出了 Lynx 模型,在多模態理解和指令跟隨能力上都表現出色。

      用人話說,就是研究“怎么造出一個既能看懂圖片又能流暢對話的AI”,并且搞清楚了哪些因素真正重要。

      真正讓曾妍“出圈”的,是2023年年底的PixelDance。

      這個項目的論文題目很有意思,叫《如何讓像素跳舞》(Make Pixels Dance: High-Dynamic Video Generation)。它解決的是視頻生成領域一個長期存在的矛盾,如何平衡動態性和穩定性。

      你想想,如果一個AI生成的視頻動作幅度很大、畫面變化劇烈,看起來確實生動有趣,但很容易出現畫面崩壞、角色變形、物體突然消失這些“靈異事件”。

      反過來,如果你追求穩定性,讓角色和場景保持一致,人物面容不突變,那生成的視頻就容易僵硬,像幻燈片切換而不是流暢的動態影像。

      曾妍團隊的突破在于,他們在預訓練階段就建立了嚴格的時序約束。

      傳統的視頻生成模型都是先生成視頻,然后再一幀一幀去修補。PixelDance則是讓模型學會了在保持一致性的前提下生成動態內容。

      核心創新點是在擴散模型框架中,引入首幀+末幀的雙圖像指令,配合文本指令聯合約束視頻生成,同時在網絡結構中新增時序卷積與時序注意力層,從生成的源頭就錨定了視頻的起止狀態,從而保證大動態動作下的主體與場景一致性。

      就像訓練一個舞者,從一開始就教她在保持平衡的前提下做大幅度動作。

      PixelDance的成功,讓曾妍在字節內部的地位迅速提升。

      2024年,她從算法工程師晉升為算法研究員,成為Seed團隊中最年輕的研究員之一。這個晉升不只是對她學術能力的認可,更重要的是,她證明了自己能把研究成果轉化為實際產品。

      在大廠里,這兩種能力的差別,就像會做菜和會開餐廳的差別。

      02

      從 PixelDance 到 Seedance 2.0

      有意思的是,PixelDance就是Seedance的前身。

      Seed代表字節的大模型部門,dance則保留了“讓像素起舞”的核心理念。這個改名不只是品牌策略,更標志著模型從研究原型向商業產品的轉變。

      2025年6月11日,字節正式發布了Seedance 1.0,曾妍是該模型的核心研發負責人。

      雖然直至2026年2月,曾妍才被字節官方確認為Seedance 2.0 視頻模型預訓練負責人,但知情人士爆料,早2025年下半年時,曾妍就已經正式牽頭Seedance 2.0的預訓練全流程工作,成為該項目的核心一號位。

      她的+2 leader是周暢,+3 leader是Seed團隊負責人吳永輝。

      Seedance 2.0核心技術突破之一是雙分支擴散變換器架構,這是曾妍團隊在預訓練階段就確立的基礎架構。

      傳統視頻生成模型采用“先畫后配”的模式。即先生成視頻畫面,再單獨生成或匹配音頻。

      這種方式的問題在于,音畫分離導致同步性差,人物說話時嘴型對不上,背景音樂的節奏與畫面情緒脫節,音效出現的時機與畫面動作不匹配。

      Seedance 2.0通過視頻與音頻并行生成的方式,共享同一個理解編碼器,從根源上實現了音畫原生協同。

      這個架構設計的關鍵在于,讓模型在生成每一幀畫面的同時,就考慮對應的音頻應該是什么樣的,而不是等畫面全部生成完再去“配”音頻。

      文章開頭我就講了,預訓練是整個模型能力的基石。

      曾妍在這個階段需要處理海量的視頻數據,建立視覺、文本、音頻等多模態之間的對齊關系。

      她通過引入“跨分支校準模塊”,實時校準視頻與音頻的節奏、情緒與場景匹配度,確保嘴型與臺詞同步、音效與畫面契合、背景音樂與情緒氛圍一致。

      預訓練階段把所有的多模態對齊關系、物理規律、運動模式都塞進模型里,成為“默認項”。后續模型只要調用到相關內容,就會立刻給出預訓練時的結果。



      它不是簡單地讓模型記住訓練數據,而是讓模型從海量數據中提煉出普遍規律,形成對世界的基礎理解。

      Seedance 2.0生成時長1分鐘的2K視頻僅需60秒,比上一代Seedance 1.5 Pro快了30%。

      速度提升的背后,是曾妍團隊在預訓練階段對模型架構、訓練策略、數據配比的精細調優。

      她的團隊迭代速度極快,在預訓練階段就完成了擴散模型的多輪優化。

      優化注意力機制減少冗余計算,改進噪聲調度策略加快收斂速度,精選高質量訓練數據提升樣本效率。

      每一個優化點單獨看都不起眼,但累積起來就是質的飛躍。模型規模越大,訓練成本越高,每一個百分點的效率提升都意味著數百萬元的成本節約和數周的時間縮短。

      Seedance 2.0還實現了多鏡頭敘事能力。這意味著模型不僅能生成長視頻,還能理解“全景-中景-特寫”的專業分鏡邏輯,自動規劃鏡頭切換,生成帶有蒙太奇效果的完整敘事序列。

      曾妍團隊通過高質量樣本,讓模型學習到了人類導演的鏡頭語言和敘事節奏。這種從數據中提煉出的“導演直覺”。

      03

      曾妍與羅福莉


      同為女性AI科學家,曾妍和羅福莉在模型研發中,都擅長尋找“平衡點”。

      在DeepSeek時期,羅福莉參與的DeepSeek-V2,通過MoE架構的稀疏激活,把推理成本降到了GPT-4 Turbo的七十分之一,但是性能卻與頂尖的閉源模型十分相近。

      這就像設計一個大型圖書館,雖然藏書百萬冊,但每次查詢只需要翻開其中幾本,而不是把所有書都搬出來。這種“按需激活”的機制,讓大模型的成本驟然下降,卻不怎么損失性能。

      羅福莉在性能與成本之間,找到了這樣一個平衡點。



      到了號稱“性價比之王”的小米,羅福莉把DeepSeek的精神貫徹到底。她主導團隊與北京大學聯合研發資源管理系統ARL-Tangram,讓模型的算力成本直降71.2%。

      然而成本下降并不意味著性能下降。使用了該技術的萬億參數的旗艦模型MiMo-V2-Pro,在Artificial Analysis全球大模型綜合智能排行榜上位列第八、國內第二。

      羅福莉證明了一件事:性價比不是某個項目的偶然,而是一種可以跨平臺復制的方法論。

      曾妍的平衡點則是前文提到的動態性和穩定性,讓視頻生成模型又能講好故事,又有畫面張力和視覺沖擊力。

      兩人不同的是職業規劃。

      羅福莉從阿里跳到幻方,再到DeepSeek,這條路徑是“從大廠到創業公司,從工程應用到模型研究”。

      曾妍則是在字節內部一路深耕,5年時間完成了從校招畢業生,坐到了4-2的位置。

      兩條路徑沒有高下之分。

      在AI大模型這個燒錢、拼資源、看長期積累的領域,年輕的技術人才依然可以通過對問題的深刻理解,在短時間內做出關鍵貢獻。

      有可能他們研究的方向,你聽都沒聽過,但就是有效。

      她們的故事才剛剛開始。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      5億遺產,67%歸妻,16.5%留女!張雪峰留給世界的最后賬本!

      5億遺產,67%歸妻,16.5%留女!張雪峰留給世界的最后賬本!

      新浪財經
      2026-03-27 10:53:31
      中年人的“窮鬼樂園”爆火半年即涼,50萬投資30天沒生意

      中年人的“窮鬼樂園”爆火半年即涼,50萬投資30天沒生意

      豆腐腦觀察局
      2026-03-30 06:30:03
      藏拙藏到決賽!施海榮完勝蔡斌,江蘇女排扮豬吃虎打懵上海

      藏拙藏到決賽!施海榮完勝蔡斌,江蘇女排扮豬吃虎打懵上海

      金毛愛女排
      2026-03-30 00:00:15
      “生女兒的,再厲害也是給我兒子服務!”家長低認知發言,被群嘲

      “生女兒的,再厲害也是給我兒子服務!”家長低認知發言,被群嘲

      妍妍教育日記
      2026-03-30 18:56:05
      網友預訂一家“寵物友好”酒店,店方推薦其到當地鎮上吃狗肉,文旅局工作人員:該飲食文化悠久,最早追溯至明清

      網友預訂一家“寵物友好”酒店,店方推薦其到當地鎮上吃狗肉,文旅局工作人員:該飲食文化悠久,最早追溯至明清

      極目新聞
      2026-03-30 19:04:32
      吐槽一下,長沙的就業環境

      吐槽一下,長沙的就業環境

      一條要飛躍的咸魚
      2026-03-30 18:45:11
      國歌中一句話引發爭議,建國以來被反復修改,其中一版本只用四年

      國歌中一句話引發爭議,建國以來被反復修改,其中一版本只用四年

      顧秋韻
      2026-03-30 14:39:53
      擋不住了!10倍光纖牛股5天3板,市值突破2000億!創新藥集體走強,是反彈還是反轉?

      擋不住了!10倍光纖牛股5天3板,市值突破2000億!創新藥集體走強,是反彈還是反轉?

      雪球
      2026-03-30 16:26:00
      大跳水!金價跌破1000元,第一批跟風炒黃金的受害者,已經出現了

      大跳水!金價跌破1000元,第一批跟風炒黃金的受害者,已經出現了

      毒sir財經
      2026-03-30 16:03:36
      王曼昱贏下47歲老將!早田考夫蔓同一地方滑倒,王藝迪展望次輪

      王曼昱贏下47歲老將!早田考夫蔓同一地方滑倒,王藝迪展望次輪

      排球黃金眼
      2026-03-30 15:49:26
      謝霆鋒不再隱瞞!坦言拒絕和王菲結婚的真相,讓她開心的另有其人

      謝霆鋒不再隱瞞!坦言拒絕和王菲結婚的真相,讓她開心的另有其人

      最新聲音
      2026-03-30 03:01:44
      張蘭欺詐轉移資產實錘!2億名畫遭美國扣押,9.8 億欠債啥時候還清

      張蘭欺詐轉移資產實錘!2億名畫遭美國扣押,9.8 億欠債啥時候還清

      煙潯渺渺
      2026-03-30 12:00:52
      上海男籃的難題又來了!

      上海男籃的難題又來了!

      新民晚報
      2026-03-30 10:42:17
      重磅回歸!反詐老陳抖音賬號解封,全網刷屏歡迎回來

      重磅回歸!反詐老陳抖音賬號解封,全網刷屏歡迎回來

      雷科技
      2026-03-30 15:42:06
      三任嬌妻皆絕色,他卻晚景凄涼,一生令人唏噓

      三任嬌妻皆絕色,他卻晚景凄涼,一生令人唏噓

      嘮叨說歷史
      2026-03-27 16:39:19
      迪拜崩了!伊朗美國大戰,迪拜40年的造富神話,11天就崩了!

      迪拜崩了!伊朗美國大戰,迪拜40年的造富神話,11天就崩了!

      澳洲紅領巾
      2026-03-19 14:27:38
      章澤天穿小香風接待卡塔爾公主,兩人見面就擁抱,老板娘很大氣!

      章澤天穿小香風接待卡塔爾公主,兩人見面就擁抱,老板娘很大氣!

      阿廢冷眼觀察所
      2026-03-30 13:14:47
      美國華盛頓特區撞機事故畫面曝光:67人遇難,無人生還

      美國華盛頓特區撞機事故畫面曝光:67人遇難,無人生還

      IT之家
      2026-03-30 21:58:15
      努涅斯身價跌1000萬至2500萬歐,兩年前巔峰身價7000萬歐

      努涅斯身價跌1000萬至2500萬歐,兩年前巔峰身價7000萬歐

      懂球帝
      2026-03-30 22:03:53
      俄羅斯不賣油了!普京禁令一下,最慘的不是歐洲,而是兩個鄰國

      俄羅斯不賣油了!普京禁令一下,最慘的不是歐洲,而是兩個鄰國

      聽風喃
      2026-03-30 10:42:29
      2026-03-30 22:32:49
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2329文章數 8055關注度
      往期回顧 全部

      科技要聞

      一句謊言引發的硅谷血案

      頭條要聞

      開發商承諾有學校3年后交房沒建 業主起訴被當地駁回

      頭條要聞

      開發商承諾有學校3年后交房沒建 業主起訴被當地駁回

      體育要聞

      想進世界杯,意大利還要過他這一關

      娛樂要聞

      單依純凌晨發長文道歉!李榮浩再回應

      財經要聞

      本輪地緣沖突,A股憑什么走出獨立行情

      汽車要聞

      限時12.58萬起 銀河星耀8遠航家系列上市

      態度原創

      時尚
      本地
      旅游
      教育
      軍事航空

      這件衣服絕美!今年流行的風格而都離不開它

      本地新聞

      用Color Walk的方式解鎖城市春日

      旅游要聞

      貴州“仰阿莎”和山東“夏雨荷” 在此刻夢幻聯動了

      教育要聞

      媽媽不要怕,有我在,你的兒子女兒會平安快樂長大!

      軍事要聞

      第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

      無障礙瀏覽 進入關懷版