<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      GPU編程新機(jī)遇!TritonNext 2026大會(huì)來襲,首批嘉賓與議題重磅揭曉

      0
      分享至


      過去二十年,CUDA幾乎定義了GPU編程的主流路徑,開發(fā)者可以在其框架內(nèi)充分挖掘GPU性能。隨著國產(chǎn)AI芯片進(jìn)入訓(xùn)練與推理主戰(zhàn)場,這套長期依賴CUDA的開發(fā)模式也面臨新的工程挑戰(zhàn):算子如何高效編寫、性能如何精細(xì)調(diào)優(yōu)、同一套代碼能否在不同硬件上長期迭代,成為核心課題。在這種背景下,Triton作為新興高性能算子編程模型,正受到越來越多團(tuán)隊(duì)關(guān)注。它在提供底層性能調(diào)優(yōu)能力的同時(shí),通過合理抽象,也為跨硬件部署和長期維護(hù)提供了可行方案。

      圍繞這一正在發(fā)生的工程轉(zhuǎn)變,由眾智FlagOS社區(qū)、北京智源人工智能研究院、CSDN聯(lián)合主辦的「TritonNext 技術(shù)大會(huì)(TritonNext 2026)」,將于2026年1月9日北京海淀區(qū)中關(guān)村國家自主創(chuàng)新示范區(qū)展示中心拉開帷幕。作為國內(nèi)首個(gè)聚焦Triton的技術(shù)盛會(huì),本次大會(huì)將聚焦于國產(chǎn)芯片與算子實(shí)踐這一核心戰(zhàn)場。

      來自智源、摩爾線程、華為、中國科學(xué)院計(jì)算技術(shù)研究所、百度、先進(jìn)編譯實(shí)驗(yàn)室、螞蟻集團(tuán)、上海苦芽科技有限公司、湖南卡姆派樂信息科技有限公司等深耕GPU編譯、算子優(yōu)化與芯片軟件棧的一線資深專家,將圍繞Triton在真實(shí)業(yè)務(wù)中的落地成效,以及在國產(chǎn)AI芯片上的適配經(jīng)驗(yàn),展開一場場緊扣工程實(shí)戰(zhàn)的深度分享。

      話不多,大會(huì)報(bào)名通道現(xiàn)已開啟。掃描下方二維碼,搶先注冊參會(huì):


      https://www.bagevent.com/event/9117276?bag_track=csdngzh

      同時(shí),首波嘉賓已經(jīng)就位,精彩議題同步揭曉,快來看看有哪些行業(yè)大咖——


      首批嘉賓陣容和議題


      林詠華

      北京智源人工智能研究院副院長兼總工程師

      簡介:現(xiàn)任北京智源人工智能研究院副院長兼總工程師,主管大模型研究中心、人工智能系統(tǒng)及基礎(chǔ)軟件研究、產(chǎn)業(yè)生態(tài)合作等重要方向。IEEE女工程師亞太區(qū)領(lǐng)導(dǎo)組成員,IEEE女工程師協(xié)會(huì)北京分會(huì)的創(chuàng)始人。曾任IBM中國研究院院長,同時(shí)也是IBM全球杰出工程師,在IBM內(nèi)部引領(lǐng)全球人工智能系統(tǒng)的創(chuàng)新。從事近20年的系統(tǒng)架構(gòu)、云計(jì)算、AI系統(tǒng), 計(jì)算機(jī)視覺等領(lǐng)域的研究。本人有超過50個(gè)全球?qū)@⒍啻潍@得ACM/IEEE最佳論文獎(jiǎng)。獲評2019年福布斯中國50位科技領(lǐng)導(dǎo)女性。

      演講議題:開源統(tǒng)一AI系統(tǒng)軟件棧FlagOS新技術(shù)特性


      崔慧敏

      中國科學(xué)院計(jì)算技術(shù)研究所研究員、博士生導(dǎo)師,中科加禾創(chuàng)始人兼CEO

      簡介:崔慧敏,中國科學(xué)院計(jì)算技術(shù)研究所研究員,博士生導(dǎo)師,中科加禾創(chuàng)始人,任中科院計(jì)算所編譯與編程實(shí)驗(yàn)室主任。曾主持過多項(xiàng)自然科學(xué)基金、973項(xiàng)目、科技部重點(diǎn)研發(fā)計(jì)劃等國家級科研項(xiàng)目與課題,是2030新一代人工智能某編程項(xiàng)目的首席科學(xué)家。發(fā)表包括ASLPOS、MICRO、PLDI、PPoPP、OSDI、SC、TOCS、TPDS、TACO等編譯和系統(tǒng)領(lǐng)域的頂級國際會(huì)議和期刊論文60余篇。

      演講議題:AI編譯器學(xué)術(shù)報(bào)告:面向快速演進(jìn)計(jì)算架構(gòu)的自適應(yīng)編譯器構(gòu)建與優(yōu)化技術(shù)

      議題介紹:隨著計(jì)算架構(gòu)向異構(gòu)化與定制化方向演進(jìn),人工智能正在驅(qū)動(dòng)編譯技術(shù)新范式的發(fā)展。本報(bào)告旨在系統(tǒng)探討大模型在編譯領(lǐng)域的潛力,重點(diǎn)研究如何基于長期積累的編譯技術(shù)演進(jìn),實(shí)現(xiàn)編譯流程的自動(dòng)化與智能化,從而使編譯器能夠高效適配新興硬件平臺(tái),進(jìn)行深度資源優(yōu)化,并最終構(gòu)建面向領(lǐng)域特定計(jì)算的高效編譯與架構(gòu)協(xié)同生態(tài)體系。


      門春雷

      北京智源人工智能研究院AI系統(tǒng)研究團(tuán)隊(duì)負(fù)責(zé)人

      簡介:高級工程師,主要負(fù)責(zé)智能算力調(diào)度平臺(tái)、AI編譯器和AI芯片研究。先后在多家互聯(lián)網(wǎng)公司擔(dān)任技術(shù)主管/專家,從事人工智能研發(fā)工作,包括基礎(chǔ)技術(shù)研發(fā)和應(yīng)用落地。代表成果:京東物流無人機(jī)/無人車規(guī)模化落地,快手大模型在短視頻場景應(yīng)用落地。已授權(quán)發(fā)明專利13篇。

      演講議題:Triton多芯片統(tǒng)一編譯器FlagTree新特性介紹


      鄭思澤

      字節(jié)跳動(dòng)工程師

      簡介:鄭思澤博士現(xiàn)任字節(jié)跳動(dòng)機(jī)器學(xué)習(xí)系統(tǒng)研究員,主要負(fù)責(zé)Triton-distributed 項(xiàng)目。他在北京大學(xué)獲得計(jì)算機(jī)博士學(xué)位;此前,他曾于華盛頓大學(xué)訪學(xué)。他的研究聚焦于編譯器設(shè)計(jì)與代碼優(yōu)化、CPU/GPU高效訓(xùn)練與推理的算法及框架設(shè)計(jì),相關(guān)成果發(fā)表于MICRO、ASPLOS、ISCA等頂級會(huì)議。同時(shí),他活躍于學(xué)術(shù)社區(qū),擔(dān)任ChinaSys PC成員及ICLR、TPDS等多個(gè)國際會(huì)議與期刊的審稿人。

      演講議題基于Triton-Distributed的推理與訓(xùn)練實(shí)踐

      議題介紹:在單芯片摩爾定律失效,多芯片系統(tǒng)成為主流的今天,如何在分布式系統(tǒng)中面向多芯片編程成為當(dāng)前機(jī)器學(xué)習(xí)系統(tǒng)發(fā)展的一個(gè)重要問題。為了解決這個(gè)問題,本報(bào)告介紹Triton-distributed。通過拓展Tile編程語義,Triton-distributed提供了大量分布式編程語義,支持單機(jī)、跨機(jī)多種場景的多種訓(xùn)練推理算子。實(shí)驗(yàn)證明,Triton-distributed可以取得和底層編程一致的性能,同時(shí)極大降低開發(fā)門檻。


      甄羿

      螞蟻集團(tuán)技術(shù)專家

      簡介:螞蟻集團(tuán)技術(shù)專家,在基礎(chǔ)技術(shù)、編譯、編程語言等方面有多年經(jīng)驗(yàn)。

      演講議題:DeepSeek V3.2 DSA算子Triton開發(fā)實(shí)踐

      議題介紹:概述DSA算子基于Triton適配和優(yōu)化的實(shí)踐。 同時(shí)聊一聊FlagOS、FlagGems生態(tài)軟件在螞蟻應(yīng)用的情況。


      馬永強(qiáng)

      百度資深工程師

      簡介:負(fù)責(zé)飛槳框架多硬件適配技術(shù)體系構(gòu)建,研發(fā)面向大模型的高性能計(jì)算和融合優(yōu)化技術(shù),強(qiáng)化大模型在多硬件下的訓(xùn)練效率與推理性能。

      演講議題:飛槳原生Triton支持方案詳解——大模型軟硬件適配技術(shù)分享

      議題介紹:本次分享將圍繞以下三部分展開:

      1、triton/flagtree的支持方案

      2、triton算子在訓(xùn)推中的使用

      3、paddle適配方案相關(guān)內(nèi)容


      海納

      摩爾線程編譯器負(fù)責(zé)人

      簡介:摩爾線程編譯器負(fù)責(zé)人,編譯器資深專家,長期從事系統(tǒng)性能優(yōu)化等工作。著有圖書《從零開始寫Linux內(nèi)核》,《自己動(dòng)手寫Python虛擬機(jī)》,以及極客專欄《高手必學(xué)的內(nèi)存知識(shí)》等。

      演講議題:摩爾線程在FlagTree中的優(yōu)化實(shí)踐

      議題介紹:摩爾線程編譯團(tuán)隊(duì)在Triton中適配Tensor Core,同時(shí)開啟了pipeline、warp specialize、split k等優(yōu)化方案。本次演講會(huì)重點(diǎn)介紹這些優(yōu)化工作。


      劉廣

      北京智源人工智能研究院系統(tǒng)智能研究組負(fù)責(zé)人

      簡介:劉廣,智源人工智能研究院系統(tǒng)智能研究組的負(fù)責(zé)人,領(lǐng)導(dǎo)OpenSeek等開源項(xiàng)目,主導(dǎo)開發(fā)了悟道天鷹(Aquila)系列語言大模型,構(gòu)建并開源Infinity-Instruct/-MM 以及CCI4.0等系列等數(shù)據(jù)集,目前正專注于KernelGen項(xiàng)目來提升算子開發(fā)的效率,致力于推動(dòng)系統(tǒng)領(lǐng)域的的AI技術(shù)應(yīng)用和創(chuàng)新。

      演講議題:Triton算子自動(dòng)生成探索和實(shí)踐

      議題介紹:圍繞大模型訓(xùn)練與推理的高性能需求,我們基于KernelGen開展了Triton算子自動(dòng)生成的探索與實(shí)踐。通過構(gòu)建覆蓋算子描述、自動(dòng)代碼生成、性能搜索與驗(yàn)證的一體化流程,KernelGen顯著降低了算子開發(fā)門檻與工程成本,并在多種核心算子上實(shí)現(xiàn)接近甚至優(yōu)于手寫Triton/CUDA的性能表現(xiàn),同時(shí)具備良好的跨芯片適配能力,為算子自動(dòng)化生成與AI for System的工程化落地提供了可行路徑。


      邵恩

      中國科學(xué)院計(jì)算技術(shù)研究所高級工程師

      簡介:邵恩,中國科學(xué)院計(jì)算技術(shù)研究所,高級工程師,主要研究方向?yàn)楦咝阅苡?jì)算與系統(tǒng)軟件。入選北京市科技新星計(jì)劃和中國科學(xué)院青年創(chuàng)新促進(jìn)會(huì),主持國家重點(diǎn)研發(fā)計(jì)劃(青年科學(xué)家項(xiàng)目)、國家自然科學(xué)基金(青年基金)、CCF-百度松果基金、CCF-螞蟻軟硬件協(xié)同專項(xiàng)基金等。帶領(lǐng)科研團(tuán)隊(duì)完成百度飛槳、Apache TVM、oneAPI、光合開發(fā)者在內(nèi)多個(gè)開源社區(qū)對SYCL的編譯支持。

      演講議題:面向異構(gòu)硬件的系統(tǒng)軟件共性優(yōu)化

      議題介紹:伴隨著計(jì)算機(jī)產(chǎn)業(yè)的不斷發(fā)展,種類多樣化的處理器和加速器芯片的微體系結(jié)構(gòu),正朝著異構(gòu)、領(lǐng)域?qū)S谢姆较虬l(fā)展。與此同時(shí),面向跨異構(gòu)硬件的并行編程模型(SYCL),也逐漸在高性能計(jì)算的系統(tǒng)軟件中發(fā)揮重要作用。系統(tǒng)軟件是否能夠同時(shí)適用于來自不同芯片廠商的處理器和加速器,將直接限制集成異構(gòu)處理器的高性能計(jì)算機(jī)的應(yīng)用研制與生態(tài)發(fā)展。本次報(bào)告將結(jié)合面向跨異構(gòu)硬件的現(xiàn)狀展開,結(jié)合對國產(chǎn)高性能計(jì)算機(jī)的適配現(xiàn)狀,討論系統(tǒng)軟件的共性優(yōu)化問題與機(jī)遇。


      朱天陽

      北京中科加禾智能科技有限公司研發(fā)總監(jiān)

      簡介:中科加禾研發(fā)總監(jiān),主要負(fù)責(zé)Triton編譯器和大模型端側(cè)推理引擎的研發(fā)工作,曾先后就職于Intel、華為和阿里的編譯器和模型部署團(tuán)隊(duì),負(fù)責(zé)相關(guān)研發(fā)和管理工作。

      演講議題:Triton語言擴(kuò)展TLE的架構(gòu)感知層的設(shè)計(jì)和實(shí)現(xiàn)

      議題介紹:TLE是針對Triton的語言的擴(kuò)展,它需要充分暴露硬件特性供算子開發(fā)者編寫針對某種硬件架構(gòu)的高性能算子,本議題針對DSA和GPU硬件架構(gòu)特性進(jìn)行語言層面的抽象和實(shí)現(xiàn)。


      郭依蓬

      華為昇騰CANN生態(tài)技術(shù)專家

      簡介:昇騰CANN生態(tài)技術(shù)專家,對昇騰開發(fā)工具鏈有較為深刻的理解。深耕編譯器與編程語言領(lǐng)域,積累了豐富的MLIR/LLVM編譯優(yōu)化相關(guān)經(jīng)驗(yàn),深度參與畢昇編譯器開發(fā)。

      演講議題AscendNPU IR完備表達(dá)昇騰,開源開放支持多語言接入

      議題介紹:昇騰CANN畢昇編譯器組件AscendNPU IR已達(dá)成全面開源。AscendNPU IR作為面向三方框架的MLIR接入層,提供靈活對接、完備表達(dá)與昇騰親和編譯優(yōu)化能力,可支撐多前端DSL實(shí)現(xiàn)算子性能提升。


      柴赟達(dá)

      先進(jìn)編譯實(shí)驗(yàn)室基礎(chǔ)編譯部部長

      簡介:柴赟達(dá),主研方向?yàn)?AI 編譯器、基礎(chǔ)編譯器以及編譯優(yōu)化技術(shù)。精通LLVM編譯器前端設(shè)計(jì)、中間代碼級編譯優(yōu)化及后端代碼生成等,精通MLIR 語法, triton - shared 編譯器、以及 Linalg IR 中間表示設(shè)計(jì)等編譯系統(tǒng)的研發(fā)工作。

      演講議題:面向 Triton 編譯器的編譯優(yōu)化實(shí)踐

      議題介紹:本次分享將剖析 Triton 的生態(tài)與發(fā)展,分析 triton - shared 編譯器, linalg IR 中間表示設(shè)計(jì)。結(jié)合 FlagTree 編譯器生態(tài),講解Triton算子生成,以及面向不同架構(gòu)的triton編譯器優(yōu)化實(shí)踐。


      郭暉

      北京智源人工智能研究院AI編譯器研究員

      簡介:郭暉,7 年端/云 AI 推理芯片軟硬件協(xié)同設(shè)計(jì)經(jīng)驗(yàn),曾于嘉楠科技擔(dān)任 AI 編譯部經(jīng)理,負(fù)責(zé)全自研開源 AI 編譯器 nncase 的研發(fā)。目前于智源人工智能研究院擔(dān)任 AI 編譯器研究員,主要研究方向?yàn)?AI 編程語言和編譯器。

      演講議題:TLE: 一種為各層次用戶設(shè)計(jì)的Triton語言擴(kuò)展

      議題介紹:Triton是一種Python DSL形式的算子編程語言,它基于Block的編程理念屏蔽了存儲(chǔ)層級、Layout、流水線、同步等硬件細(xì)節(jié),通過編譯器優(yōu)化實(shí)現(xiàn)較高性能的算子。Triton的這些優(yōu)點(diǎn)吸引了大量的開發(fā)者,形成了龐大的社區(qū)和生態(tài)。

      但近年來Triton的進(jìn)一步發(fā)展遇到一些困難,一方面在DSA和新GPU架構(gòu)上的適配進(jìn)展比較緩慢,另一方面相比一些新興語言如TileLang因?yàn)樵诩?xì)粒度控制存儲(chǔ)層級和并行粒度上缺少抽象,在性能上表現(xiàn)出一些劣勢。

      針對Triton發(fā)展的困境,我們提出了TLE(Triton Language Extentions),它從三個(gè)層級擴(kuò)展了Triton,從而滿足不同層次用戶對算子編程語言的迫切需求。


      張先軼

      澎峰科技創(chuàng)始人&CEO

      簡介:北理工本碩,中科院博士, UT Austin和MIT博后,CCF高性能計(jì)算專委常委,OpenBLAS開源項(xiàng)目發(fā)起人,曾榮獲中國計(jì)算機(jī)學(xué)會(huì)科技進(jìn)步二等獎(jiǎng)、中國科學(xué)院杰出科技成就獎(jiǎng)、北京市自然科學(xué)二等獎(jiǎng)。

      演講議題:基于FlagGems Triton的運(yùn)行時(shí)調(diào)優(yōu)與算子優(yōu)化

      議題介紹:本報(bào)告將介紹針對FlagGems算子庫的性能優(yōu)化工作,包括Triton運(yùn)行時(shí)多后端對接和調(diào)優(yōu),以及Triton算子優(yōu)化等。


      吳偉

      上海苦芽科技有限公司聯(lián)合創(chuàng)始人

      簡介:吳偉是苦芽科技聯(lián)合創(chuàng)始人,在開源編譯器和RISC-V社區(qū)有著多年的經(jīng)驗(yàn)。目前擔(dān)任LLVM基金會(huì)理事、RISC-V國際基金會(huì)技術(shù)委員會(huì)委員、CCF系統(tǒng)軟件專委RISC-V基礎(chǔ)軟件工作組組長等職務(wù)。在加入苦芽科技之前,吳偉于2019年創(chuàng)建并領(lǐng)導(dǎo)著PLCT實(shí)驗(yàn)室,推動(dòng)了全球RISC-V的軟件生態(tài)的發(fā)展。2024年出席,吳偉聯(lián)合多家機(jī)構(gòu)聯(lián)合發(fā)起“甲辰計(jì)劃”,致力于在2036年之前,實(shí)現(xiàn)RISC-V軟件生態(tài)的全面繁榮。

      演講議題:FlagOS on RISC-V:現(xiàn)狀及規(guī)劃

      議題介紹:RISC-V已經(jīng)成為世界三大主流ISA架構(gòu)之一,并且有希望在十年內(nèi)成為國際ISA開放標(biāo)準(zhǔn)。RISC-V在中國受到了廣泛的重視,在多個(gè)領(lǐng)域落地應(yīng)用;同時(shí)中國也已經(jīng)成為RISC-V開源軟硬件生態(tài)的重要推動(dòng)力量,取得了一系列重要的成果。智算場景RISC-V生態(tài)蓬勃發(fā)展的領(lǐng)域,而FlagOS致力于為國產(chǎn)智算芯片提供統(tǒng)一、全面的AI軟件棧。

      在本次演講中,吳偉將會(huì)介紹FlagOS在RISC-V架構(gòu)的最新適配進(jìn)展,并展示2026年的工作規(guī)劃。歡迎廣大開發(fā)者參與進(jìn)來,共同為FlagOS社區(qū)添磚加瓦。


      王鋒

      湖南卡姆派樂信息科技有限公司總經(jīng)理

      簡介:湖南卡姆派樂信息科技有限公司總經(jīng)理,湖南大學(xué)特聘研究員,博士生導(dǎo)師,湖南大學(xué)編譯技術(shù)研究中心主任。長期從事高性能計(jì)算、編程語言與編譯優(yōu)化、并行編程模型及AI編譯框架研究,面向多種體系結(jié)構(gòu)開展數(shù)據(jù)預(yù)取、Cache優(yōu)化、自動(dòng)向量化等關(guān)鍵技術(shù)研究,熟悉PGAS等并行模型以及TVM等機(jī)器學(xué)習(xí)編譯器。率先在千萬億次異構(gòu)超算系統(tǒng)中引入MPI/OpenMP/Streaming混合編程模型并實(shí)現(xiàn)全系統(tǒng)擴(kuò)展,成果應(yīng)用于天河系列超級計(jì)算機(jī),為其取得世界領(lǐng)先性能做出重要貢獻(xiàn)。

      演講議題:基于Triton的高性能分布式算子實(shí)現(xiàn)及編譯優(yōu)化

      議題介紹:Transformer Engine、Triton Distributed等高性能分布式算子實(shí)現(xiàn)及性能對比;基于Triton編譯器,對矩陣乘(MM)算子進(jìn)行系統(tǒng)性優(yōu)化,通過引入shared memory hint機(jī)制,顯式控制張量在寄存器、共享內(nèi)存與全局內(nèi)存之間的分配策略;采用TMA(Tensor Memory Accelerator)異步拷貝優(yōu)化重寫矩陣乘算子;擴(kuò)展Autotune配置空間,優(yōu)化矩陣乘算子的block形狀與執(zhí)行參數(shù)選擇;支持在K維度上進(jìn)行更細(xì)粒度的切分(split-K),實(shí)現(xiàn)粗粒度數(shù)據(jù)搬移,細(xì)粒度矩陣計(jì)算等優(yōu)化手段減少內(nèi)存訪問次數(shù)、隱藏訪問延遲、提升計(jì)算密度與整體性能。


      李先鐸

      北京智源人工智能研究院AI框架研發(fā)工程師

      簡介:李先鐸,北京智源人工智能研究院研發(fā)工程師,曾就職于百度PaddlePaddle,南開大學(xué)碩士。目前負(fù)責(zé)大模型分布式訓(xùn)練、性能優(yōu)化等方向。

      演講議題:基于FlagOS軟件棧的多芯片統(tǒng)一后端插件設(shè)計(jì)與實(shí)踐

      議題介紹:隨著AI芯片架構(gòu)日益多樣化,如何在異構(gòu)硬件上實(shí)現(xiàn)高效、統(tǒng)一的模型訓(xùn)練與推理,已成為大模型落地的關(guān)鍵挑戰(zhàn)。FlagOS是由北京智源人工智能研究院牽頭推出的開源智算系統(tǒng)軟件棧,致力于通過統(tǒng)一軟件層解耦A(yù)I模型與異構(gòu)硬件,打破不同架構(gòu)芯片之間的軟件生態(tài)壁壘,實(shí)現(xiàn)“一次開發(fā),處處運(yùn)行”。

      本議題將圍繞FlagOS軟件棧下的多芯片統(tǒng)一后端插件設(shè)計(jì)與實(shí)踐展開,重點(diǎn)介紹如何通過插件化架構(gòu),實(shí)現(xiàn)對多種AI芯片的統(tǒng)一支持。議題內(nèi)容涵蓋:

      1)統(tǒng)一后端插件架構(gòu)設(shè)計(jì):基于FlagTree編譯器與FlagGems算子庫,構(gòu)建可擴(kuò)展的插件機(jī)制,實(shí)現(xiàn)多芯片后端的快速接入與適配;

      2)插件生命周期管理:從插件注冊、加載、調(diào)度到卸載,構(gòu)建完整的插件管理機(jī)制,保障系統(tǒng)的穩(wěn)定性與可維護(hù)性;

      3)典型芯片適配案例:分享國產(chǎn)芯片在FlagOS中的適配經(jīng)驗(yàn),展示插件化設(shè)計(jì)在實(shí)際工程中的落地效果;

      4)未來演進(jìn)方向:探討統(tǒng)一后端插件在支持新芯片架構(gòu)、自動(dòng)化適配工具鏈等方面的拓展?jié)摿Α?/p>

      更多重磅嘉賓以及熱門議題正在陸續(xù)確認(rèn)中!敬請期待。


      不止于「聽」,三大工作坊同步開啟!

      除了精彩紛呈的主題演講,本次大會(huì)還精心安排了三場深度技術(shù)工作坊,讓參會(huì)開發(fā)者可以近距離接觸最前沿的工具與技術(shù)實(shí)踐:

      • “人機(jī)協(xié)作”的Triton算子開發(fā)培訓(xùn)班

      本工作坊將圍繞KernelGen v1.0展開,聚焦真實(shí)算子開發(fā)流程與工程實(shí)踐。

      值得注意的是,KernelGen v1.0這款工具面向多元芯片場景,通過“自然語言提示+AI 生成+驗(yàn)證+循環(huán)修正”的人機(jī)協(xié)同工作流,降低算子開發(fā)中大量低層細(xì)節(jié)的編寫成本,并在過程中持續(xù)對比與優(yōu)化性能。

      屆時(shí),智源研究團(tuán)隊(duì)將于大會(huì)現(xiàn)場結(jié)合不同類型算子進(jìn)行示例講解,從需求分析到高性能實(shí)現(xiàn),全流程演示算子開發(fā)過程,帶領(lǐng)開發(fā)者完整走一遍算子從設(shè)計(jì)到落地的實(shí)踐路徑,幫助參會(huì)者掌握KernelGen v1.0在實(shí)際項(xiàng)目中的應(yīng)用方法。

      當(dāng)然,為確保現(xiàn)場實(shí)操效果,大會(huì)組委會(huì)也特別建議參會(huì)者提前準(zhǔn)備一臺(tái)性能充足的筆記本電腦(推薦不少于 16GB 內(nèi)存,具備 GPU 的設(shè)備可用于實(shí)際調(diào)試),并預(yù)先配置好開發(fā)環(huán)境,包括 Python、Triton 相關(guān)依賴以及 PyTorch、FlagGems 等常用庫,同時(shí)安裝好常用代碼編輯器(如 VS Code 或 PyCharm)以及正常的網(wǎng)絡(luò)訪問權(quán)限,以便獲取教程資源和示例代碼。

      • FlagOS-AI編譯器培訓(xùn)班

      針對AI模型編譯與優(yōu)化,F(xiàn)lagOS-AI編譯器培訓(xùn)班將帶領(lǐng)參會(huì)者深入理解AI編譯器在實(shí)際算子和系統(tǒng)開發(fā)中的應(yīng)用與潛力。

      這一工作坊內(nèi)容覆蓋FlagOS/Triton基本原理、從前端到硬件的完整技術(shù)棧、個(gè)性化手寫算子,以及傳統(tǒng)編譯技術(shù)與AI編譯技術(shù)的對比和典型優(yōu)化方法。通過實(shí)際動(dòng)手示例,開發(fā)者將從“會(huì)用框架”逐步進(jìn)階到“能造引擎”,掌握從算子設(shè)計(jì)到硬件執(zhí)行的全鏈路編譯流程,打通框架與底層硬件的認(rèn)知斷層。

      如果你也想在現(xiàn)場直接動(dòng)手操作?同樣建議提前準(zhǔn)備好性能充足的筆記本電腦(x86_64架構(gòu),16GB內(nèi)存起,32GB更佳)。操作系統(tǒng)則推薦Ubuntu 20.04/22.04或Windows WSL,并預(yù)裝PyTorch、Triton、FlagTree,以及 CUDA(如有NVIDIA GPU更佳)。

      • 基于FlagOS的具身一站式平臺(tái)/FlagOS-Robot培訓(xùn)班

      面向具身智能研發(fā)與工程落地場景,本工作坊系統(tǒng)講解了從多本體真機(jī)任務(wù)設(shè)計(jì)、真實(shí)機(jī)器人數(shù)據(jù)采集與標(biāo)注,到基于FlagOS-Robo與RoboBrainX0的具身模型訓(xùn)練全流程。

      大會(huì)現(xiàn)場,將會(huì)有資深技術(shù)專家精彩演示如何在國產(chǎn)算力環(huán)境下,利用智源具身一站式平臺(tái)和FlagOS-Robo完成具身模型訓(xùn)練,讓與會(huì)者掌握“真機(jī)數(shù)據(jù) → 國產(chǎn)算力→具身模型”的完整工程閉環(huán),緊貼科研、產(chǎn)業(yè)與工程團(tuán)隊(duì)的實(shí)際需求,幫助開發(fā)者快速落地具身智能系統(tǒng)。


      報(bào)名參會(huì)

      如果說主題演講和技術(shù)工作坊解決的是“怎么看、怎么學(xué)”,那么這次TritonNext 2026更希望開發(fā)者真正“動(dòng)手參與”。圍繞大型算子庫、統(tǒng)一AI編譯器、并行訓(xùn)推框架、統(tǒng)一通信庫等核心開源項(xiàng)目,大會(huì)現(xiàn)場還將正式啟動(dòng)FlagOS全球大賽。

      無論你是想了解Triton的最新實(shí)踐,還是希望在國產(chǎn)芯片、AI生態(tài)中找到展示和落地的機(jī)會(huì),這里都是一個(gè)不可多得的起點(diǎn)。

      • 大會(huì)時(shí)間:2026年1月9日

      • 大會(huì)地點(diǎn):北京海淀區(qū)中關(guān)村國家自主創(chuàng)新示范區(qū)展示中心

      「TritonNext 技術(shù)大會(huì)(TritonNext 2026)」現(xiàn)已經(jīng)開放報(bào)名!

      與一線工程師面對面,聽真實(shí)案例、看真實(shí)代碼、聊真實(shí)問題

      立即加入這場面向未來 GPU 編程的技術(shù)現(xiàn)場


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      王欣瑜VS阿尼西莫娃,比賽時(shí)間出爐,誰能進(jìn)澳網(wǎng)8強(qiáng)?獎(jiǎng)金有多少

      王欣瑜VS阿尼西莫娃,比賽時(shí)間出爐,誰能進(jìn)澳網(wǎng)8強(qiáng)?獎(jiǎng)金有多少

      體育大學(xué)僧
      2026-01-25 12:02:19
      美媒很感慨:要不是中國還在反抗特朗普,幾乎全世界都向他投降了

      美媒很感慨:要不是中國還在反抗特朗普,幾乎全世界都向他投降了

      議紀(jì)史
      2026-01-24 16:45:03
      一個(gè)奇怪的現(xiàn)象:50歲以后的人,能活到90歲的,基本上50歲的時(shí)候,就不再做這3件事了!

      一個(gè)奇怪的現(xiàn)象:50歲以后的人,能活到90歲的,基本上50歲的時(shí)候,就不再做這3件事了!

      犀利強(qiáng)哥
      2026-01-25 06:59:26
      縫“哭哭馬”的他找到了!“接到電話還有點(diǎn)不好意思”,老板娘:獎(jiǎng)!每年8888元,直到下一個(gè)馬年

      縫“哭哭馬”的他找到了!“接到電話還有點(diǎn)不好意思”,老板娘:獎(jiǎng)!每年8888元,直到下一個(gè)馬年

      大象新聞
      2026-01-24 17:45:16
      “這是被摧毀前的我”—英國逆天網(wǎng)紅再發(fā)多人事前事后視頻

      “這是被摧毀前的我”—英國逆天網(wǎng)紅再發(fā)多人事前事后視頻

      隨波蕩漾的漂流瓶
      2026-01-24 20:28:36
      退休夫婦花10萬“郵輪養(yǎng)老”:船上住15年,包吃包打掃,環(huán)游世界4圈,比房租便宜得多!

      退休夫婦花10萬“郵輪養(yǎng)老”:船上住15年,包吃包打掃,環(huán)游世界4圈,比房租便宜得多!

      背包旅行
      2026-01-23 10:33:42
      記住吧,歷史總要清算

      記住吧,歷史總要清算

      火事雜談
      2026-01-24 18:52:38
      就在今天!努爾基奇打破塵封51年的紀(jì)錄,登頂爵士隊(duì)史第一

      就在今天!努爾基奇打破塵封51年的紀(jì)錄,登頂爵士隊(duì)史第一

      籃球大視野
      2026-01-25 15:23:19
      就在今晚!1月25日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

      就在今晚!1月25日晚19:30!中央5套CCTV5、CCTV5+直播節(jié)目表

      皮皮觀天下
      2026-01-25 08:58:48
      中國哪個(gè)城市的水質(zhì)最好?經(jīng)評比:這10個(gè)城市上榜,快來看看,有你的家鄉(xiāng)嗎?

      中國哪個(gè)城市的水質(zhì)最好?經(jīng)評比:這10個(gè)城市上榜,快來看看,有你的家鄉(xiāng)嗎?

      美食格物
      2026-01-23 17:04:10
      哈梅內(nèi)伊進(jìn)入超級防護(hù)掩體,權(quán)力轉(zhuǎn)交兒子!

      哈梅內(nèi)伊進(jìn)入超級防護(hù)掩體,權(quán)力轉(zhuǎn)交兒子!

      桂系007
      2026-01-24 23:29:23
      “大傻”去世15年后,兒子入獄孫子身亡,王晶曝他舊事:是狠角色

      “大傻”去世15年后,兒子入獄孫子身亡,王晶曝他舊事:是狠角色

      妙知
      2026-01-22 16:41:19
      平均每人負(fù)債1300萬,書記吳仁寶去世10年后,華西村的現(xiàn)況如何?

      平均每人負(fù)債1300萬,書記吳仁寶去世10年后,華西村的現(xiàn)況如何?

      哄動(dòng)一時(shí)啊
      2026-01-24 21:29:54
      茅臺(tái)跌破1499元,為何i平臺(tái)還一瓶難求?囤積者后續(xù)會(huì)虧更可恨?

      茅臺(tái)跌破1499元,為何i平臺(tái)還一瓶難求?囤積者后續(xù)會(huì)虧更可恨?

      勻楓財(cái)技大兜底
      2026-01-25 11:10:03
      刑場上那一槍打偏了,周乙并未身亡,他在地下室醒來,而高彬也在

      刑場上那一槍打偏了,周乙并未身亡,他在地下室醒來,而高彬也在

      呆子的故事
      2026-01-21 16:20:07
      山姆2026年開店計(jì)劃曝光?浙江是……

      山姆2026年開店計(jì)劃曝光?浙江是……

      最金華
      2026-01-24 22:41:38
      牢A含金量提升!澳洲中國留學(xué)生墮胎率超30%,16年前報(bào)道數(shù)據(jù)扎心

      牢A含金量提升!澳洲中國留學(xué)生墮胎率超30%,16年前報(bào)道數(shù)據(jù)扎心

      火山詩話
      2026-01-25 06:48:02
      14年,李鵬坦白與周總理的真實(shí)關(guān)系:別人說我是他的養(yǎng)子,不正確

      14年,李鵬坦白與周總理的真實(shí)關(guān)系:別人說我是他的養(yǎng)子,不正確

      大運(yùn)河時(shí)空
      2026-01-25 13:00:02
      越南內(nèi)部資料披露:越軍在中越戰(zhàn)爭主戰(zhàn)場——諒山,傷亡與結(jié)果

      越南內(nèi)部資料披露:越軍在中越戰(zhàn)爭主戰(zhàn)場——諒山,傷亡與結(jié)果

      范烽舍長
      2026-01-25 14:19:32
      一戰(zhàn)創(chuàng)多項(xiàng)紀(jì)錄!18歲新星53分鐘橫掃晉級,首進(jìn)大滿貫八強(qiáng)

      一戰(zhàn)創(chuàng)多項(xiàng)紀(jì)錄!18歲新星53分鐘橫掃晉級,首進(jìn)大滿貫八強(qiáng)

      全景體育V
      2026-01-25 12:05:40
      2026-01-25 18:47:00
      CSDN incentive-icons
      CSDN
      成就一億技術(shù)人
      26279文章數(shù) 242221關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛在上海逛菜市場,可能惦記著三件事

      頭條要聞

      游客自稱爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬元

      頭條要聞

      游客自稱爬衡山時(shí)掛脖子上80克金牌遺失 價(jià)值超10萬元

      體育要聞

      中國足球不會(huì)一夜變強(qiáng),但他們已經(jīng)創(chuàng)造歷史

      娛樂要聞

      王玉雯方嚴(yán)正聲明 劇方回應(yīng):涉事人員已被開除

      財(cái)經(jīng)要聞

      隋廣義等80人被公訴 千億騙局進(jìn)入末路

      汽車要聞

      別克至境E7內(nèi)飾圖曝光 新車將于一季度正式發(fā)布

      態(tài)度原創(chuàng)

      旅游
      數(shù)碼
      家居
      教育
      公開課

      旅游要聞

      一秒入仙境!金佛山冬雪、日出、云海絕美同框

      數(shù)碼要聞

      AMD核顯規(guī)劃分化,中端APU將沿用RDNA3.5舊架構(gòu)直至2029年

      家居要聞

      在家度假 160平南洋混搭宅

      教育要聞

      看似復(fù)雜,尖子生一個(gè)技巧口算

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲欧美熟妇久久久久久久久| JIZZJIZZJIZZ亚洲日本| 99RE6在线观看国产精品| 精品人妻少妇一区二区三区在线| 国产精品国产三级国产a| 怀来县| 国产偷人爽久久久久久老妇app| 娇小另类XXXHD| 综合激情五月综合激情五月激情1| 三级片久久久| 国产无遮挡性视频免费看| 无码国内精品人妻少妇| 欧美国产日韩久久mv| 天天综合天天添夜夜添狠狠添| 欧洲亚洲色一区二区色99 | 精品国模| 亚洲中文字幕乱码av波多ji| jizz日本版| 日韩精品人妻中文字幕不卡 | 蜜臀久久99精品久久久久久牛牛| 曰本久久久免费黄| 亚洲人成网站观看在线观看| 国产午夜福利一区二区三区| 欧美高清一区三区在线专区| 国产欧美日韩在线不卡第一页 | 一边捏奶头一边高潮视频| 亚欧女AV| 中文字幕久荜| 婷婷开心中文字幕| 蜜桃视频中文字幕一区二区三区| 国产欧美精品一区aⅴ影院| 久久精品人成免费| 国产偷自视频区视频| 最好看的电影2019中文字幕| 久久久受www免费人成| 国产欧美一区二区三区在线| www国产亚洲精品久久麻豆| 水蜜桃自拍视频在线观看| 久久国产色av免费观看| 辽阳市| 久久精品噜噜噜成人av|