11月23日,第二十二屆中國國際半導體博覽會(IC China 2025)在北京國家會議中心開幕。在同期舉行的第七屆全球IC企業家大會上,英特爾公司副總裁、英特爾中國研究院院長宋繼強發表演講。他表示,當前,AI計算的重心已從通用基座大模型擴展至推理應用。未來,80%的AI計算將用于推理領域。異構的AI基礎設施是未來發展的趨勢。
![]()
宋繼強表示,智能體AI是推理領域真正產生客戶價值的部分,其算力需求將從2025年起逐步上升,并超越用于訓練基座大模型與微調大模型的規模,今年,其規模已有140倍的增長,達到每月1400萬億Token的使用量。為應對智能體AI的高速增長需求,算力支持是首要的,算力基礎設施的帶寬、存儲等都要跟上。Token服務供應商,如云服務和數據中心供應商也需對構造成本結構的方式進行系統級的優化。
宋繼強指出,早期的智能體AI在中間層專門對應某一種語言模型,在底層則與具體的硬件和軟件組合相對應,是在某種專門的應用架構上調優出來的,擴展比較受限。新出現的思維鏈技術得以支撐更廣泛、更高級別的能力,但也需要更多的執行步驟、更多不同的模型,運用思維鏈方式完成一個問題使用的Token數比之前多10倍。而智能體內部不止一個思維鏈,對Token的使用量與調用復雜度將增長百倍以上。
因此,宋繼強強調,異構的AI基礎設施一定是未來發展的趨勢,既能提高當前應用的性能、效率和成本效益,也能夠保持對于未來智能體AI應用的長期有效性。
他表示,這樣的計算架構需要至少三個維度的技術支撐。
第一,在硬件層,為避免受限于特定架構或供應商,必須構建異構的硬件架構基礎。這也是目前算力中心與公有云服務建設中常常討論并采納的方式。
第二,在中間的系統級,越來越多的推理應用存在于某一個企業的工作范圍內,所以一定要對企業應用開發、服務器部署友好。要針對企業所需要、所能夠支持的尺寸交付算力,對于互聯互通也需要采用開放的、基于以太網方式的能力規模擴展方案。
第三,是更開放的軟件棧和軟件框架,需要具備可編程性、可調配組合,能支持多種AI框架。
宋繼強進一步分享了英特爾的一系列實踐與創新案例。例如,制程技術方面,要提供更高能效比、更高性能、生產制造更靈活的方案。今年10月,英特爾公布了其最新的制程節點Intel 18A的技術細節,同時使用了RibbonFET全環繞柵極晶體管和背面供電技術PowerVia,可以提供更高晶體管密度、提升每瓦性能、降低功耗,為英特爾未來至少三代客戶端與服務器產品提供支撐。
封裝技術方面,宋繼強表示,英特爾持續演進先進技術:從傳統的二維封裝到2.5D的EMIB嵌入式多芯片互聯橋接方案、Foveros 2.5D和3D技術,再到Foveros Direct 3D,在先進封裝技術的加持下,芯片Bump間距已經降到了10微米以下。
宋繼強還分享了英特爾對未來定制芯片的設想,他指出,未來的定制芯片內部既可以有英特爾的主計算單元,也可以有客戶的計算單元,并能夠通過3D技術將兩者封裝在一起。在靈活構造的基礎上,加上EMIB 2.5D、TSV等技術加持,將大大地提升芯片尺寸,目前最大能實現相當于十幾個光罩尺寸大芯片規模,這將給可定制的未來處理器或AI加速器新的機會。他表示,針對未來多元的應用需求,希望有更多能效比優先,具備定制化特點的芯片方案。
來源 | 中國電子報
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.