![]()
題圖:123rf
人工智能時代,競爭已不再僅僅局限于算法與應用層面的較量,而是延伸到了算力基礎設施的深度博弈。在這個萬物互聯、數據洶涌的時代,數據量的迅猛增長使得對算力的需求攀升至一個前所未有的水平。
在不斷增長的海量智能算力需求推動下,同時也面臨著算力基礎設施高質量發展所帶來的挑戰。根據2022年相關數據,中國智能算力在全部算力中的占比達到了22%,然而通用服務器仍然占據主導地位,其占比高達93.2%,而AI服務器的占比僅為6.8%。
作為算法與數據的支撐,算力越來越成為制約AI產業化發展的重要因素。
國務院總理李強在政府工作報告中介紹2024年政府工作任務“深入推進數字經濟創新發展”時提出,適度超前建設數字基礎設施,加快形成全國一體化算力體系。李強總理在近期調研時再次強調,人工智能是發展新質生產力的重要引擎,要加強前瞻布局,加快提升算力水平,推進算法突破和數據開發使用,大力開展“人工智能+”行動,更好賦能千行百業。
隨著人們進入數字經濟時代,數據成為新的生產要素,算力也成為新的生產力。根據研報數據顯示,算力指數每提高1%,國家數字經濟和GDP將分別增長3.5‰和1.8‰。
在醫療健康領域,醫療健康數據的增長是各個行業中增長最快的,其年復合增長率高達36%,數據量已近50萬億GB。隨著醫院信息化建設步伐的加快,互聯網醫療服務的興起,AI輔助診斷技術的廣泛應用,以及醫療垂直大模型等創新技術的不斷涌現,傳統醫療行業正經歷著一場深刻的數字化與智慧化轉型。在這一轉型過程中,算力作為核心驅動力,發揮著不可替代的作用。
01
算力支撐醫療智慧應用
手術機器人、遠程醫療、可穿戴設備、電子病歷等智慧應用的蓬勃發展,都離不開算力的堅實支撐。
作為擁有14億多人口的大國,2022年全國醫療衛生機構總診療人次超84億,產生海量醫療健康數據。借助強大算力將這些數據進行有效歸納、分析和總結,有助于優化醫療資源配置,提升全國疾病預防、治療和健康管理能力。
2022年OpenAI發布ChatGPT,生成式AI成為風口,大模型為生成式AI提供了重要的技術基礎。與此同時,英偉達作為全球領先的圖形處理器(GPU)和AI芯片制造商,其財報數據也反映了算力經濟爆發的趨勢。2022年英偉達數據中心收入150億美元,占比56%,2023年,數據中心收入474億美元,其占總收入的比例上漲至78%,其 GPU幾乎占據了全球接近80%的市場。
2023年被譽為醫療大模型的元年,算力與醫療領域的融合正以前所未有的迅猛速度發展,預示著醫療健康領域的智慧化轉型正邁入一個全新的階段。
截至2023年10月,我國累計公開的大模型數量已經達到238個,垂直類大模型達到103個。而2-9月,我國發布的醫療大模型近50個,根據億歐智庫發布《2023醫療健康AI大模型行業研究報告》顯示,目前國內的醫療大模型可以分為幾類:包括患者問診全流程、醫生助手/醫院管理、中醫、藥物研發、醫學影像及健康科普類大模型等。
![]()
算力技術的發展為醫療大模型提供了強大的計算資源,使其能夠在短時間內完成復雜的數據分析和模型訓練。通過運用先進的算法和模型,醫療大模型能夠從海量數據中提取出有價值的信息,為醫生與用戶提供更準確、更個性化的診療建議。
除醫療大模型外,在生物醫藥領域,算力提升也極大的促進了基因測序的精準性與新藥研發的效率。
《自然》雜志預估,到 2025 年,全球將有 6000 萬人以上會采用基因測序來診斷疾病。通常而言,一個人的全基因組數據量在 50GB 以上。這意味著到 2025 年,全球基因組數據的增量就超過 40EB。
在基因測序領域,人類的基因中,堿基對高達 30 億個組合,從 30 億個組合當中找出變異,這些運算背后都需要高性能計算在底層做支撐,需要強大的算力支持來進行解析。而在藥物發現領域,研究人員經常需要對數億種化合物,與疾病相關的蛋白質進行一個是否能結合的預測,每一次運算通常需要數萬到數十萬核的 CPU 算力。
例如,在計算機藥物研發的流程當中有一個關鍵步驟,叫虛擬篩選,就是在已知的化合物里面,通過與病毒蛋白質(靶點)的結合分析,看某些化合物是否有機會可以成為藥物。一般來說,科學家需要篩選 10 億種化合物,和目標蛋白質去做模擬結合,但如調用數萬核的虛擬服務器,即可以實現在 24 小時之內完成對 10 億種化合物的虛擬篩選。
每一次技術的飛躍都離不開充足的算力資源作為堅實支撐,特別是在大模型快速迭代的當下,算力需求呈現出井噴式增長,算力應用同樣面臨著諸多挑戰。
02
應用挑戰與成本考量仍待解決
當前,醫療健康領域的研究和應用都高度依賴于大規模的數據處理和分析,而算力正是支撐這些復雜計算任務的關鍵要素。
以通用大模型為例,知情人士透露,由于高性能GPU的禁運問題,算力成本變得昂貴,這給醫療機構和企業在購買算力時帶來了極大的挑戰。許多機構和企業可能無法承受高昂的算力費用,從而限制了它們在生物醫藥領域的研究和應用。
對于安全保密有要求的醫療機構,為確保數據不出院,模型的預訓練多需要大模型以本地私有化的方式入駐,在其硬件和算力技術平臺上進行應用與業務的開發,并支持靈活擴展與穩定性要求,從而保障醫療機構的數據安全與業務順暢運行。
此外,當前模型效率的問題也影響了算力的有效利用。在推理過程中,如果模型效率低下,將導致算力資源的浪費,并可能無法產生足夠的價值來推動算力的持續增加。這種商業模型的挑戰進一步加大了算力可及性的投入難度。
左手醫生創始人兼CEO張超告訴億歐大健康,如果在已經訓練好的通用模型基礎上,進一步使用醫療領域的高質量數據進行繼續預訓練,其訓練成本大概是通用模型的1/10左右。但具體的訓練成本還會受到多種因素的影響,包括模型的參數規模、所使用的數據量、計算設備的性能等。因此,不同醫療大模型廠家的訓練成本可能會有所不同。
再以AI制藥為例,通過將AI藥物發現技術無縫整合到計算機輔助藥物設計軟件中,并應用深度學習等非線性方法于藥物設計、親和力預測及成藥性分析等領域,產業界已經取得了顯著的進步,并逐漸形成了行業共識。在這個過程中,算力成為了進一步提升AI制藥準確率并擴大藥物篩選范圍的瓶頸。
03
構建自主可控國產算力生態
據了解,目前醫療領域的智慧項目算力支撐主要通過企業合作、自建算力平臺或租用云服務器來滿足需求。去年12月,醫渡科技與華為合作啟動醫療大模型聯合創新,基于昇騰AI硬件,推出面向B端的訓推一體機解決方案,醫院可以根據自身需求來購置相應設備。國內AI制藥頭部企業晶泰科技則選擇自主建設AI藥物研發所需的算法平臺與高性能計算算力平臺。
但算力資源的緊缺和高昂成本,以及算力需求的多樣化和個性化等問題,使得“算力荒”的風險始終未能完全消除。
為了解決算力瓶頸,2023年10月,工業和信息化部 、國家衛生健康委員會等六部門印發《算力基礎設施高質量發展行動計劃》指出,加強行業算力建設布局,滿足工業互聯網、教育、交通、醫療、金融、能源等行業應用需求,支撐傳統行業數字化轉型。目標是到 2025 年,計算力方面,算力規模超過 300 EFLOPS,智能算力占比達到 35%,東西部算力平衡協調發展。
據工信部數據,截至2022年底,中國坐擁的總算力已高達180EFLOPS,算力核心產業規模高達1.8萬億元,算力總規模穩居全球第二。
在今年的兩會提案中,算力基礎設施建設也是大家關注的焦點。圍繞算力網重建設輕運營,國產智算軟硬件生態體系不健全,算力普惠服務供給等問題,兩會代表建議成立政府算力管理及運營機構,促進算力網軟硬件原研創新,構建國產算力生態圈,推動算力產業高質量發展。
從當前市場占比來看,英偉達雖然占據優勢,但近年來,國產GPU發展勢頭迅猛,國內的華為、寒武紀等企業也能提供高端GPU。上海、廣州、西安等城市新建的數據中心特別是政府投建的算力中心中,不少已經用上國產GPU。
目前,我國已構建起了包括超算中心、智算中心、數據中心和“城市大腦”在內的多元化算力形態,并在多個城市同步推進建設,推動“數據向西,算力向東”的戰略布局。其中,智算中心尤為受到關注,全國已有30多個城市提出了建設規劃。
特別是智能計算中心,作為超算技術和人工智能融合創新的產物,已成為新基建的熱點,這些算力基礎設施的建設,無疑將為醫療行業的算力需求提供強有力的保障,推動其在藥物研發、數據處理及模型訓練等方面的快速發展,進而提升醫療服務的質量和效率。
這些智算中心在投資建成后,運營模式、服務標準制定等問題,便成為了另一個全新的商業篇章。如何高效地運營這些智算中心,確保它們能夠穩定、安全地提供算力服務,將是擺在運營者面前的又一重要課題。
參考資料:
IT時報:真正落地,生成式 AI 才有生命力
編輯推薦
隨手 在看
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.