![]()
過去幾年,AI產業的敘事重心始終圍繞兩個關鍵詞打轉——算力和模型,前者決定了規模上限,后者決定了智能上限。
但在實際的工程落地中,影響模型“能否跑得動、跑得穩、跑得久”的因素,不只有算力性能和模型參數。位于底層硬件和模型框架之間的計算架構,扮演了不可或缺的角色。
在英偉達的體系里,主要由CUDA擔綱,把GPU的復雜性封裝成了一套可調用、可復用、可規模化的計算體系,幾乎成了事實上的并行計算產業標準,形成了一個封閉、單一廠商主導的技術生態。
在華為昇騰的體系里,對標CUDA的是CANN,同樣是一個承上啟下的計算架構:向上對接昇思MindSpore、PyTorch、TensorFlow等主流AI框架,對下使NPU為核心的昇騰系列硬件產品。
有別于CUDA的封閉,CANN的主張是開源開放。特別是在8月份宣布全面開源開放后,每個月都有新的組件開源。
9月30日,算子庫、CATLASS算子模板庫等項目全面開源;
10月30日,領域加速庫、單邊通信庫等項目開源;
11月30日,Ascend C編程語言全面開源;
12月30日,運行時、圖引擎、集合通信庫等項目開源,按計劃實現CANN 匹配A2/A3版本的全面開源開放。
由此產生的一個問題是:走封閉路線的CUDA,被視為英偉達最強大的“護城河”,CANN為何做出了反向戰略選擇?
01 從“能用”到“敢用”,破解產業落地的信任天花板
答案藏在產業一線的“焦慮”中。
在和CTO、開發者的交流中,每次談到AI在產業中落地的話題時,普遍會涉及兩個問題:
一是對“黑盒”的恐懼。
傳統的AI開發過程中,硬件底層對于上層應用往往是一個“黑盒”,只能通過有限的接口進行交互,就像一輛無法打開引擎蓋的汽車,可以踩油門、打方向盤,但對引擎的內部結構一無所知。
切換到大模型訓練的語境下,當訓練速度不理想,或者出現精度溢出等問題時,開發者無法判斷問題究竟出在算法層面,還是底層算子的調度上,只能被動求助硬件廠商,失去了主動權和效率。
二是對“捆綁”的抗拒。
一旦選擇某個計算平臺,常常意味著和平臺的深度綁定,模型、算子、工具鏈、工程經驗等,都會被固化在計算生態中。
某種程度上也是英偉達“絕不會將CUDA開源”的底氣:開發者想要在GPU上實現高效的并行計算,必須要適應CUDA生態,想要轉向其他計算平臺,代價則是昂貴的遷移成本,不可避免地需要重寫代碼、重學新工具,直接勸退了很多萌生“脫離”想法的開發者。
挑戰封閉的最佳方案,正是開源開放。封閉生態近乎無解的兩個“焦慮”,CANN卻拿出了合理的方案。
![]()
針對“黑盒”,CANN的開源開放不是簡單的“秀代碼”,而是將算子庫、通信庫、編程語言、運行時等全量開源。
開發者以前只能開的跑車,現在有了全套的“發動機圖紙”,可以深入到圖優化、算子融合、內存調度等底層機制進行二次創新,模型移植、調試、性能分析的全過程“白盒化”。甚至不用局限于現成的工具和框架,可以根據自身需求進行深度定制和優化,實現更高的性能和效率。
針對“捆綁”,CANN的回答是架構解耦、分層開源開放,所有組件支持獨立演進,實現分包獨立升級。
從底層的硬件驅動、運行時到中間的編譯器、編程語言,再到上層的各類計算、通信加速庫,CANN的每一層都實現了物理上的松耦合。開發者無須像過去那樣“牽一發而動全身”,可以根據業務需求,按需引入或升級特定的組件功能,大幅降低系統集成和定制開發的門檻,避免“被鎖死”的風險。
如果說以前的CANN解決了“能用”的問題,讓模型在自主算力上跑了起來。現在要解決的是“敢用”的問題:通過全面開源開放,實現了從“黑盒”到“白盒”再到全過程“透明”,可解釋、可維護、可長期演進,以最大的誠意破解產業落地的信任天花板。
02 從“敢用”到“好用”,和千行萬業開發者共建生態
產業落地遠不是計算平臺的終點。
一個繁榮的生態,不僅僅要滿足“能用”“敢用”,還有另一個必須要回答的問題——是不是“好用”。
不少開發者對CUDA依賴甚至“上癮”,并非是因為不可替代,而是CUDA體系的文檔完善、示例豐富和龐大的開發者社區,在使用過程中遇到了問題,大概率能搜到答案。
CANN對“好用”有著更深的理解,試圖走出一條新路。
路徑一:提升開發易用性,以社區為陣地,構建全鏈路知識體系。
為了降低學習門檻,CANN投入了巨大資源打造開源社區,匯聚了開源、學習、活動等資源,給開發者提供了一站式直達體驗。
![]()
在學習資源上,目前已線63門在線課程、22門微認證,涵蓋從Ascend C算子開發入門到進階的全流程。
在實戰演練上,通過CANN訓練營、昇騰AI算子挑戰賽等活動以賽代練,比如CANN訓練營已經開展了12季。
在文檔支持上,開源社區提供了從單任務到場景化的知識體系,包括100+專題課程和10+場景化文檔……
路徑二:“放權”給開發者,人人都能參與,每個人都可以是貢獻者。
打一個比方:CANN構建了一套顆粒度極細的“全棧積木系統”,讓開發者不再是被動的“使用者”,而是擁有不同構建權限的“架構師”。
模型開發者可以直接調用封裝好的算子庫和通信庫,省去打磨細節的時間,專注于上層建筑的宏偉設計。
算子開發者可以根據特殊需求,自行設計并制造出形狀各異的高性能“異形磚”,解決通用件無法解決的難題。
深度發燒友可以對Runtime等底層資源管理能力進行極致調優,夯實最底層的“地基”,徹底釋放硬件性能。
結果有何不同?
我們找到了兩個有代表性的開發者故事。
第一個是哈爾濱工業大學的蘇統華教授,他的團隊基于CANN的Ascend C打造了昇騰NPU原生Numpy——AsNumpy,在Python層完全兼容Numpy API,用戶無需額外學習成本,即可在昇騰NPU上實現高效的科學計算。
第二個是杭州天寬科技有限公司,依托CANN開發的“智能巡檢場景算子庫”,讓巡檢效率提升了3倍、停電事故率下降了30%、應急響應與維修效率提升了20%,打破了傳統巡檢模式安全、效率與成本的“不可能三角”。
倘若是封閉的體系,開發者大概率只能做調用接口的應用創新,無法對算子進行自定義擴展。
但在CANN的生態里,創新不再完全依賴平臺,開發者能更充分地釋放硬件潛能,千行萬業的開發者都能成為生態的貢獻者。即使是人數不多的高校科研團隊、初創公司,也能參與到底層的創新和優化。
03 當“透明”成為前提,計算產業的運行規則正在改變
權力的重構往往伴隨著規則的重塑。
CANN的全面開源開放,不只是“另一種實現路徑”,也在悄然改變計算產業默認的運行規則。
在新一輪的AI浪潮中,競爭的焦點早已不是單純的算力或算法,而是圍繞軟件、開發者與生態的博弈。CANN的全面開源,掀起了一場透明度革命,將對技術、生態、產業方向等產生深遠影響。
在技術層面,從“黑盒”到“白盒”,將徹底改變AI開發模式。
站在開發者的立場上,底層機制不透明,只能依賴官方文檔了解,在很大程度上被束縛了拳腳。
CANN的全面開源開放,讓編譯器、算子庫、運行時等核心組件完全可見,開發者可以直接洞察硬件的運行邏輯,進行更深層次、更精準的性能優化,等于將創新的主動權交還到了每一位開發者手中。
相對應的就是開發門檻的降低。
以算子開發為例,過去的門檻高到不敢用,CANN開源了CATLASS算子模板庫后,只需簡單的參數配置,即可快速生成適配不同形狀和精度的矩陣乘算子,大大提升了開發效率和靈活性。
![]()
在生態層面,從“封閉獨奏”到“開放共治”,構建最大公約數。
一個計算生態的長期生命力,源于開放、透明和集體智慧。CANN的全面開源開放,正是遵循了這一邏輯。
譬如前面提到的天寬科技,除了AI智能巡檢方案,還開源了具身智能巡檢行業標準算子庫,完成了從“使用者”到“貢獻者”的轉變。對于電力、工業等有具身智能巡檢需求的開發者來說,有了開源的行業算子庫,將進一步降低了軟硬件適配的成本和難度。
當越來越多企業把自身的工程實踐轉化為可被復用的公共能力,計算生態的演進就不再依賴單點突破,而是通過不斷擴大的最大公約數,推動整個產業走向成熟與繁榮。
在產業層面,從“平臺主導”到“多元協作”,釋放行業生產力。
創新的節奏不再被單個平臺主導,產業分工或將從“上下游依附關系”,自發形成一個“能力協作網絡”。
比如在能源、制造、交通等領域,瓶頸往往不在模型本身,而是算子效率、數據流轉、實時調度等工程細節。CANN的全面開源開放,讓行業可以圍繞自身場景,對關鍵路徑進行定制優化,不必等待平臺版本演進,讓算力更高效地轉化為生產力。
開源開放的終極目的,無外乎為產業提供探索和創新空間。就這一點而言,CANN正在和千行萬業雙向奔赴。
畢竟一個計算生態的核心價值,不是限制開發者,而是賦能開發者,放大創新的杠桿效應;一個健康的計算生態,取決于能否降低創新的邊際成本,能否讓創新轉化為產業生產力。
04 寫在最后
一個計算體系被用于長期、關鍵、不可中斷的生產場景時,不透明本身,就是最大的風險。
CANN的全面開源開放,本質上在做一件事,即消除“黑盒”,讓底層機制可審視、可驗證、可優化,把原本隱性的、不確定的風險,轉化為工程上可定位、可控制、可協同解決的問題。
也讓我們有理由相信,封閉終將讓渡于開放,只有打破封閉的藩籬,形成創新合力,才能構建起堅固的數智化根基。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.