快科技3月10日消息,嵌入式,一個(gè)極為廣闊的市場(chǎng)。從ATM取款機(jī)到超市零售終端,從醫(yī)院工廠到最新機(jī)器人,可以說(shuō)嵌入式無(wú)處不在,與每個(gè)人的生活都息息相關(guān)。
眾多行業(yè)廠商對(duì)于嵌入式領(lǐng)域也是非常投入,從處理器、顯卡到存儲(chǔ),產(chǎn)品不斷日新月異。
年初,AMD發(fā)布了新一代嵌入式處理器"銳龍AI嵌入式P100系列",首次將銳龍嵌入式產(chǎn)品帶入AI時(shí)代。
![]()
銳龍AI嵌入式P100系列又分為兩個(gè)不同的子系列,之前發(fā)布的面向沉浸式體驗(yàn)的,比如下一代數(shù)字座艙、智能工廠、嵌入式顯示等等,最多6核心。
這次登場(chǎng)的更高端,主打工業(yè)自動(dòng)化、汽車(chē)自動(dòng)駕駛、物理AI(具身智能)等等領(lǐng)域,規(guī)格也高得多,核心數(shù)量8個(gè)起步,最高達(dá)到12個(gè)。
現(xiàn)如今,智能工業(yè)與邊緣計(jì)算已經(jīng)進(jìn)入了全新的時(shí)代,各種新的應(yīng)用層出不窮,無(wú)論是智能自動(dòng)化,還是AI融合終端,抑或大規(guī)模物理AI,都在蓬勃發(fā)展。
而在幕后默默貢獻(xiàn)的,除了各種AI大模型、算法和應(yīng)用,更離不開(kāi)底層AI硬件的高效支持,這正是銳龍AI嵌入式P100系列處理器大展神威的地方,應(yīng)用領(lǐng)域也是極為廣闊的。
諸如智能工廠里的工業(yè)PC、PLC、HMI(人機(jī)交互界面)、工業(yè)機(jī)械臂,物理AI領(lǐng)域的機(jī)器人、機(jī)器狗,以及醫(yī)療健康、影視廣播、半導(dǎo)體制造與測(cè)試,銳龍AI嵌入式P100系列都能如魚(yú)得水。
順帶預(yù)告一下,今年下半年,AMD還將再接再厲繼續(xù)推出"銳龍AI嵌入式X100系列",最多達(dá)16個(gè)核心,主要用于自動(dòng)化系統(tǒng)物理AI等尖端領(lǐng)域,驅(qū)動(dòng)AI技術(shù)與應(yīng)用的全新飛躍。
![]()
無(wú)論6核心還是12核心,銳龍AI嵌入式P100系列處理器的底層架構(gòu)是相通的,都源于移動(dòng)端的Strix Point,也就是銳龍AI 300/400系列。
它采用了異構(gòu)架構(gòu)的單芯片設(shè)計(jì),一顆芯片內(nèi),就集成了Zen 5架構(gòu)的CPU x86計(jì)算引擎、RDNA 3.5架構(gòu)的GPU AI與圖形引擎、XDNA 2架構(gòu)的NPU AI引擎,提供性能強(qiáng)大、能效極高的AI計(jì)算平臺(tái)。
![]()
對(duì)比之前的4-6核心版本,這次的8-12核心版本架構(gòu)不變,但規(guī)格、性能更加強(qiáng)大,無(wú)論CPU、GPU還是擴(kuò)展連接性都得到了顯著的增強(qiáng),比如CPU核心數(shù)量增加最多2倍、GPU能力增加最多8倍、系統(tǒng)算力增加最多36%,等等。
其中,CPU部分自然是核心數(shù)量更多,最高可提供12核心24線程,加上二級(jí)緩存從最多6MB增至最多12MB,三級(jí)緩存從最多8MB增至最多24MB,可以更從容地處理更高負(fù)載,執(zhí)行更多并發(fā)任務(wù)。當(dāng)然也少不了AVX-512、VNNI指令的強(qiáng)力輔助。
GPU部分從2個(gè)WGP工作組(4單元)大幅增至8個(gè)WGP工作組(16單元),可以更輕松地應(yīng)對(duì)多屏、大屏、高清屏顯示,以及4K、8K高畫(huà)質(zhì)游戲,當(dāng)然還有更多的AI圖形類(lèi)任務(wù)。
NPU部分倒是沒(méi)變,依舊最高50 TOPS的算力。
擴(kuò)展連接性方面,可提供多達(dá)16條PCIe 4.0通道,用于連接NVMe存儲(chǔ)、攝像頭、協(xié)處理器等各種擴(kuò)展設(shè)備,按照需要靈活配置。
內(nèi)存支持一方面保持DDR5-5600不變,另一方面從LPDDR5X-7500提高到LPDDR5X-8533,從而在空間受限設(shè)備中提供更高帶寬,這對(duì)于AI類(lèi)應(yīng)用是至關(guān)重要的。
如果對(duì)比上一代的銳龍嵌入式8000系列,新品可以帶來(lái)最多39%的多線程性能提升,系統(tǒng)級(jí)算力更是提升了最多2.1倍。
![]()
驚喜的是,規(guī)格大幅增強(qiáng)的同時(shí),BGA封裝尺寸依然非常迷你的40×25毫米,熱設(shè)計(jì)功耗范圍也依然是15-54W(標(biāo)準(zhǔn)28W)。
如此對(duì)于寸土寸金的嵌入式設(shè)備無(wú)疑是極為友好的,而且兼容性、通用性極佳,不同平臺(tái)的設(shè)計(jì)可以互通,從而大大降低開(kāi)發(fā)難度和成本。
![]()
如前所述,整個(gè)銳龍AI嵌入式P100系列家族,無(wú)論是4-6個(gè)核心,還是8-12個(gè)核心,差別只在于規(guī)格和性能高低不同,架構(gòu)、封裝、BIOS、功耗、兼容性等等都是完全相通的,因此具備極強(qiáng)的靈活性。
客戶(hù)無(wú)論打造什么樣的產(chǎn)品,從緊湊型工業(yè)PC到高端工業(yè)視覺(jué)再到大型單板系統(tǒng),只需要根據(jù)規(guī)格、性能方面的要求,功耗、發(fā)熱方面的限制等等因素,選擇最合適的型號(hào)即可。
而在發(fā)展的過(guò)程中有新的需求了,再升級(jí)到更高型號(hào)也是順理成章的,毫不費(fèi)力,可以大大縮短產(chǎn)品開(kāi)發(fā)與上市周期。
![]()
這是全系列詳細(xì)的SKU型號(hào)與規(guī)格,此次新增的一共只有三款:
P164i:8核心16線程,8MB二級(jí)緩存,16MB三級(jí)緩存,5.0GHz加速頻率,12單元GPU,2.8GHz頻率。
P174i:10核心20線程,10MB二級(jí)緩存,24MB三級(jí)緩存,5.0GHz加速頻率,12單元GPU,2.8GHz頻率。
P185i:12核心24線程,12MB二級(jí)緩存,24MB三級(jí)緩存,5.1GHz加速頻率,16單元GPU,2.9GHz頻率。
三者其他規(guī)格都是一致的,包括:四屏4K120或雙屏8K120視頻輸出、兩個(gè)USB4、一個(gè)USB 3.2、一個(gè)USB 3.1、三個(gè)USB 2.0和一個(gè)安全BIOS USB、-40℃到105℃工業(yè)級(jí)溫度范圍等等。
作為嵌入式產(chǎn)品,它們同樣享受2.5年標(biāo)準(zhǔn)生命周期支持,擴(kuò)展最長(zhǎng)可達(dá)10年。
![]()
CPU+GPU+NPU三劍客組合,整個(gè)平臺(tái)的總算力高達(dá)80 TOPS。
它們可以單獨(dú)或組合滿足各種AI負(fù)載,無(wú)論是爆發(fā)式的還是持續(xù)式的,無(wú)論是需求高算力還是低時(shí)延,都不在話下。
官方稱(chēng),新系列可以支持接近2倍數(shù)量的虛擬機(jī)、更大規(guī)模的大語(yǔ)言模型,例如Llama 3.2-Vision 11B,從而推動(dòng)更先進(jìn)的AI與混合型工作負(fù)載。
![]()
![]()
當(dāng)然,對(duì)于這種異構(gòu)計(jì)算和異構(gòu)AI,軟件層面的優(yōu)化至關(guān)重要,尤其是NPU、GPU。
得益于AMD ROCm開(kāi)放軟件生態(tài)系統(tǒng)的支持,銳龍嵌入式處理器所運(yùn)行的嵌入式應(yīng)用,已經(jīng)有了一整套經(jīng)過(guò)廣泛驗(yàn)證的開(kāi)源AI軟件棧,覆蓋視覺(jué)、多模態(tài)與語(yǔ)言、動(dòng)作與控制等各個(gè)層面。
開(kāi)發(fā)人員可以在依賴(lài)開(kāi)源編譯器、運(yùn)行時(shí)、庫(kù)的同時(shí),運(yùn)行標(biāo)準(zhǔn)AI框架,并且不需要重新編寫(xiě)代碼,就可以即時(shí)訪問(wèn)適用于嵌入式的模型。
在編程層面,AMD ROCm軟件采用了開(kāi)源的HIP(異構(gòu)計(jì)算可移植接口),可以將GPU編程從硬件中解耦釋放出來(lái),也就是使其不再依賴(lài)特定廠商的GPU,從而消除軟件棧和硬件之間的供應(yīng)商鎖定,無(wú)論開(kāi)發(fā)還是移植都更加便捷。
當(dāng)然不能少了CPU,AMD Zen 5核心提供了隔離能力和充足的性能裕量,可以在單個(gè)平臺(tái)上,以確定性的多任務(wù)方式整合多個(gè)關(guān)鍵工作負(fù)載。
銳龍嵌入式處理器這種緊密集成、統(tǒng)一的CPU、GPU、NPU異構(gòu)架構(gòu),一方面可以在任何混合工作負(fù)載下,實(shí)現(xiàn)高效的工作負(fù)載分配,運(yùn)行在最合適的引擎上,同時(shí)確保可預(yù)測(cè)的低時(shí)延,再搭配熟悉的框架和軟件棧,更能在廣泛的不同場(chǎng)景中,大大精簡(jiǎn)開(kāi)發(fā)與部署工作。
另一方面,多個(gè)高性能引擎的集成,可以不需要任何外部擴(kuò)展硬件,就能實(shí)現(xiàn)先進(jìn)的計(jì)算與圖形性能,廠商能夠更輕松地設(shè)計(jì)可擴(kuò)展的強(qiáng)大平臺(tái)。
![]()
值得一提的是,AMD還為工業(yè)領(lǐng)域的混合關(guān)鍵型應(yīng)用,提供了一個(gè)封裝式、垂直整合的虛擬參考堆棧。
它基于Xen虛擬管理程序構(gòu)建,可在隔離域中運(yùn)行Linux、Windows、Ubuntu、RTOS系統(tǒng)環(huán)境,從而實(shí)現(xiàn)安全性、實(shí)時(shí)性能、靈活性,最終形成可擴(kuò)展的開(kāi)放架構(gòu),加速下一代嵌入式系統(tǒng)簡(jiǎn)化設(shè)計(jì)。
![]()
![]()
![]()
針對(duì)不同的應(yīng)用場(chǎng)景,銳龍AI嵌入式P100系列處理器和開(kāi)發(fā)軟件棧都做了深度的優(yōu)化支持,這里簡(jiǎn)單舉幾個(gè)例子。
用于工業(yè)PC的智能機(jī)器視覺(jué):
銳龍AI嵌入式P100系列能夠?qū)LC、HMI整合到同一臺(tái)工業(yè)PC之中。
強(qiáng)大的CPU性能可滿足實(shí)時(shí)監(jiān)測(cè)、處理優(yōu)化的需要,GPU和NPU則可以為多路攝像頭視覺(jué)、豐富的HMI儀表板提供支撐。
還支持利用DeepSORT、RAFT-Stereo、CenterPoint、GDR-Net、PaDiM、Llama 3.2-Vision等模型的低時(shí)延異常檢測(cè)。
用于自主運(yùn)行的物理AI:
針對(duì)移動(dòng)機(jī)器人,銳龍AI嵌入式P100系列可以在CPU上管理導(dǎo)航、運(yùn)動(dòng)控制與路徑規(guī)劃,GPU則處理多路攝像頭數(shù)據(jù),實(shí)現(xiàn)空間感知、視覺(jué)SLAM、視覺(jué)-語(yǔ)言-動(dòng)作(VLA)等高級(jí)AI工作負(fù)載。
CPU與GPU之間的統(tǒng)一內(nèi)存也至關(guān)重要,保證了低時(shí)延、快速響應(yīng)。
NPU也沒(méi)閑著,可以支持始終在線的低功耗推理,支持基于YOLOv12、MobileSAM等模型的目標(biāo)檢測(cè)與場(chǎng)景理解。
3D醫(yī)學(xué)成像與臨床智能:
利用U-Net、nnU-Net、MONAI 等模型,銳龍AI嵌入式P100系列可以在邊緣端支持超聲、內(nèi)窺鏡、組織分類(lèi)、腫瘤檢測(cè)等的3D成像。
借助MedSigLIP加速?gòu)某上竦綀?bào)告的工作流程,支持通過(guò)Med-PaLM2實(shí)現(xiàn)臨床推理與問(wèn)答能力,以及成像、AI分析、報(bào)告功能的整合。
![]()
8-12核心的銳龍AI嵌入式P100系列處理器已經(jīng)在試產(chǎn),將在第三季度投入大規(guī)模量產(chǎn),同時(shí)配套的開(kāi)發(fā)文檔和工具已經(jīng)準(zhǔn)備就緒。
下半年,AMD還會(huì)提供相應(yīng)的客戶(hù)參考開(kāi)發(fā)板,擁有完整的配置和豐富的接口,搭配相應(yīng)的文檔和工具即可用于嵌入式開(kāi)發(fā)評(píng)估,加速產(chǎn)品開(kāi)發(fā)、原型迭代、平臺(tái)軟硬件驗(yàn)證。
![]()
目前,全球多家ODM合作伙伴已經(jīng)推出基于AMD銳龍AI嵌入式P100系列處理器的解決方案,并均已量產(chǎn)。
包括凌華科技(ADLink)、研華科技(Advantech)、華擎、艾訊(Axiomtek)、康佳特(congatec)、E.E.P.D.、廣積科技(iBASE)、控創(chuàng)(Kontron)、瑞傳科技(Portwell)、藍(lán)寶石、SolidRun等等。
4-6核心平臺(tái)方案均已上市,8-12核算新版本即將陸續(xù)到來(lái)。
![]()
銳龍AI嵌入式P100系列處理器8-12核心版本,主要用來(lái)打造向工業(yè)自動(dòng)化應(yīng)用、可全天候運(yùn)行的AI驅(qū)動(dòng)型系統(tǒng)。
它基于x86 SoC片上系統(tǒng)的可擴(kuò)展邊緣計(jì)算,可提供強(qiáng)大靈活的計(jì)算、圖形與AI性能。
可覆蓋從感知到推理全流程的AI加速,異構(gòu)架構(gòu)搭配開(kāi)放軟件棧。
提供全天候的運(yùn)行能力與工業(yè)級(jí)的可靠性,完美適合實(shí)時(shí)運(yùn)行與長(zhǎng)期部署。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.