![]()
作者:大頭
轉載請聯系本公眾號獲得授權,并標明來源
2025 Meet AI Compiler 第 8 期技術沙龍將于 12 月 27 日在上海創智學院舉辦。
一直以來,由 HyperAI超神經主辦的 Meet AI Complier 技術沙龍,匯聚科研機構、企業內的專家學者與一線工程師,從技術創新聊到應用攻堅,為大家搭建了交流平臺。今年 7 月,北京站的第 7 期 Meet AI Compiler 技術沙龍圓滿落幕,現場熱烈討論不斷,技術干貨引發持續互動!
![]()
12 月 27 日,第 8 期 Meet AI Compiler 如約而至。本期我們邀請了來自上海創智學院、TileAI 社區、華為海思、先進編譯實驗室、AI9Stars 社區的多位專家,他們將帶來從軟件棧設計、算子開發到性能優化的全鏈路分享,內容涵蓋 TVM 的跨生態互操作、PyPTO 的融合算子優化、TileRT 的低延遲系統、Triton 面向多架構的關鍵優化技術以及 AutoTriton 的算子優化,呈現從理論到落地的完整技術路徑。
報名已開啟,席位有限~快來現場蹭干貨,我們在上海等你!
活動詳情
? 時間:12 月 27 日(周六)13:30-17:30
地點:上海市徐匯區華發路 699 弄 3 號上海創智學院
人數:150(現場座位有限,請盡早報名)
報名:點擊下方小程序報名
掃碼備注「AI 編譯器」加入活動群:
嘉賓及議程
分享嘉賓
13:40-17:20
![]()
13:40-14:20
馮思遠
上海創智學院助理教授
Apache TVM PMC
分享主題:TVM FFI: Open ABI and FFI for Machine Learning Systems
內容簡介:TVM FFI 旨在解決機器學習系統生態割裂與互操作性難題。通過定義開放的 ABI 和 FFI 標準,該項目利用穩定的 C ABI 及 DLPack 實現零拷貝數據傳遞,打通了 PyTorch 等框架與底層編譯器的連接。它支持跨語言高效調用,顯著降低了多平臺適配的工程成本。
觀看本場分享,你將了解:
1. 學習 TVM-FFI 通用標準,大幅降低跨語言 Mlsys 開發維護成本
2. 了解并構建兼容未來的模塊化 ML 生態
![]()
14:20-15:00
薛繼龍
Tile-AI 社區
創始成員
分享主題:TileRT:面向低延遲大模型推理的軟硬件探索
內容簡介:隨著大模型跨入萬億參數,處理序列跨過百萬 token,模型能力正在不斷打破各項記錄。然而,人們對模型極致計算速度的追求從未停止。一方面許多低延遲場景需要在秒級甚至毫秒級得到響應,如實時決策、博弈等場景;另一方面大模型訓練進入 Agent 時代,超長序列的 rollout 時間成為主要瓶頸。
本報告介紹 TileRT 項目,從 AI 編譯器、runtime、到架構設計的角度,思考如何構建針對極低延遲的大模型計算軟件棧。
觀看本場分享,你將了解:
1. 了解大模型低延遲推理場景背景、重要性和未來展望
2. TileRT 的技術挑戰與實踐分享
![]()
15:20-16:00
汪超
華為海思
軟件工程師
分享主題:PyPTO:基于白盒編譯的融合算子開發框架
內容簡介:本次分享聚焦華為新推出的融合算子開發框架 PyPTO。它基于 Tensor/Tile 編程范式,通過聚焦核內 SRAM 管理、跨平臺 PTO 指令集和 MPMD 運行時等技術,結合 Human-In-The-Loop 調優,以白盒編譯方式實現高性能與易用性的統一。
觀看本場分享,你將了解:
1. 掌握原生為 SIMD 架構設計的融合算子開發框架PyPTO的設計理念與核心架構
2. 掌握 PyPTO 聚焦于發揮用戶的專家經驗的白盒編譯思想與 Human-In-The-Loop 調優精髓
3. 掌握 利用 PyPTO 提供的可視化工具,快速在昇騰平臺開發出高性能融合算子的完整流程
![]()
16:00-16:40
李嘉楠
先進編譯實驗室
研究員
分享主題:面向 Triton 編譯器的編譯優化實踐
內容簡介:本次分享聚焦面向 Triton 編譯器的優化實踐,系統介紹 Triton 的語言與編譯器結構、生態演進與算子庫開發方法,并深入覆蓋 CPU、NPU、GPU 等多架構的關鍵優化技巧,展示構建高性能統一算子體系的完整路徑。
觀看本場分享,你將了解:
1. Triton 生態的最新進展
2. Triton 編譯器在多架構(CPU/NPU/GPU)上的關鍵優化技術
![]()
16:40-17:20
施琦
AI9Stars 社區
研究員
分享主題:AutoTriton:強化學習驅動的大模型 Triton 算子優化技術探索
內容簡介:利用 CUDA 等語言編寫高效內核是性能工程師的專屬領域,隨著 Triton 等編程框架的出現,內核可編程性有著重大飛躍。但開發人員仍然需要手動配置關鍵參數,限制了性能可移植性和廣泛應用。本報告將介紹在大模型算子生成評價基準與模型方面的探索,并展望大模型在算子優化方面的巨大潛力。
觀看本場分享,你將了解:
1. 大模型賦能算子優化的相關工作及最新進展
2. 大模型在算子優化領域的關鍵技術
主辦方及合作伙伴
![]()
HyperAI超神經(hyper.ai)作為國際領先的人工智能及高性能計算社區,旨在通過提供行業資訊報道、數據集加速下載、在線教程演示、熱門模型性能評測、前沿論文推薦、高價值成果解讀、頂會日歷集成等一系列服務,助力全球數據科學及??智能?業的開發者及愛好者學習、理解、實踐,與社區?起構建??智能的未來。
訪問官網:
https://hyper.ai/
![]()
OpenBayes貝式計算是國內領先的高性能計算服務提供商,通過為新一代異構芯片嫁接經典軟件生態及機器學習模型,進而為工業企業及高校科研提供更加快速、易用的數據科學計算產品,其產品已被數十家大型工業場景或頭部科研院所所采用。
訪問官網:https://openbayes.com/
![]()
MLC.AI 社區成立于 2022 年 6 月,并由 Apache TVM 主要發明者、機器學習領域著名的青年學者陳天奇,帶領團隊上線了 MLC 線上課程,系統介紹了機器學習編譯的關鍵元素以及核心概念。
2022 年 11 月,在 MLC.AI 社區志愿者的共同努力下,首個完整的 TVM 中文文檔上線,并成功托管至 HyperAI超神經官網,進一步為對機器學習編譯感興趣的國內開發者,提供了接觸并學習一門新技術的基礎設置——文檔。
MLC 線上課程:https://mlc.ai/
TVM 中文文檔:https://tvm.hyper.ai/
![]()
上海創智學院是匯聚頂尖大學、頭部企業和科研機構聯袂建設的新型人才培養機構。學院堅持「以學生為中心、以前沿為牽引」的培養理念,通過超高規格的師資、超常措施的培養、超凡條件的保障,探索具有中國特色的 AI 領軍人才培養方案,致力于培養中國 AI 領軍人才,打造世界人工智能創新高地。
活動支持
![]()
活動行:掃碼跳轉至活動行報名
掃碼備注「AI 編譯器」加入活動群
考慮到本場活動的場地空間情況,我們僅開放了 150 個到場名額,建議大家盡早報名鎖定席位。
12 月 27 日 13:30-17:30,我們不見不散!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.