今年年初DeepSeek的橫空初始,幾乎在一瞬間就宣告了一個時代的更替,擁抱AI可以說已從過往的技術選項升維為產業轉型的必選項,更成為了千行萬業競相布局的數智化新賽道。
在這場智能化的浪潮中,企業既需要持續構建更大規模的數據基礎設施,也需要竭盡所能獲取更多高質量行業數據,畢竟數據的規模和質量決定了AI智能的高度,也決定了AI技術在實體經濟應用場景中的落地效能。
![]()
背后的原因在于,數據基礎設施作為AI技術的“糧倉”,承載著三重的價值:它是持續供給高質量數據養料的戰略儲備池,缺失充沛優質的數據資源,AI的學習進化能力將大打折扣;同時,其技術架構的先進性還直接決定AI大模型的訓練效率與迭代速度,這就猶如“高速公路”與“鄉間小道”之間有著本質的區別;更為重要的是,作為數據要素的核心“保險庫”,它還是構筑數據安全風險“銅墻鐵壁”的核心防線。
從這個角度來說,打造智能就緒的數據基礎設施,既是推動AI技術進步的必然要求,也是千行萬業提升整體創新能力、實現數智化轉型的關鍵選擇。
在此背景下,戴爾科技集團通過“與時俱進”的創新與迭代,推出基于湖倉一體架構的智能數據平臺解決方案,該方案通過橫向擴展能力實現存力的線性增長,以智能數據管理引擎優化數據全生命周期價值挖掘,更依托安全可信的能力筑牢數據安全防線,不僅為智能訓練、湖倉一體等前沿應用場景提供強大支撐,更助力企業完成從數據到智能的躍遷,在智能時代全速邁向數據驅動的創新之旅。
![]()
01.
打破數據孤島,
現代數據架構“應運而生”
可以看到,當前企業的工作負載正經歷著翻天覆地的變化——從傳統的虛擬機、數據庫模式,到如今的智能應用、機器學習、容器和邊緣計算等新技術,企業得以借助這些新技術推動業務發展,增強市場競爭力。
然而,企業在享受新技術紅利的同時,其數據基礎設施平臺卻面臨著諸多挑戰,如建造成本難以預測、架構擴展性差、網絡安全威脅等。這些挑戰推動著企業對更高效資源利用、更智能開放的數據基礎設施以及更強安全措施的迫切需求。
在此過程中,數據已成為企業的核心戰略資源,其價值甚至超越了傳統意義上的“石油”,特別是數據質量更成為企業在數智化時代實現價值創造與可持續發展的核心基石,如高準確性、完整性和一致性的數據,為企業戰略決策的科學性保駕護航;實時、可靠的數據為運營流程的高效運轉提供有力支撐;而優質數據還是智能應用落地、產品創新迭代以及合規管理實施的先決條件。
![]()
但我們也必須清醒地認識到,長期存在的“數據孤島”問題已成為企業邁向AI時代的重要阻礙。異構系統間的技術標準差異、部門權責割裂以及隱私合規限制等因素,形成了數據流通的“無形壁壘”。這種碎片化的數據分布不僅導致AI模型訓練面臨樣本偏差和特征缺失的技術瓶頸,還引發了組織、技術和合規層面的多重矛盾,可以說數據孤島帶來的隱性成本“不容小覷”,重復存儲加劇了算力浪費,分散治理推高了合規風險,而全局洞察力的缺失更使企業難以應對快速變化的市場需求。
除此之外,企業過往的數據架構在長期演進中形成的“集中化、孤島化、僵化性和專有性”等問題,同樣也成為企業數據驅動業務轉型的另一重障礙。典型的如集中式設計引發性能瓶頸和單點故障風險,數據隔離阻礙了企業內的無縫數據共享與業務協作,架構僵化難以適應動態需求,技術綁定則推高構建成本、限制了技術創新等等。
![]()
為了打破這一困局,現代數據架構“應運而生”,其以開放、安全、靈活為核心,致力于打破數據壁壘,促進數據跨部門流通,通過分布式設計提升性能與可靠性,擺脫單點依賴;以彈性架構適配業務變化,降低技術成本。更為關鍵的是,基于現代數據架構,能夠讓數據從“資源孤島”蛻變為“價值活水”,助力企業在數智化浪潮中重構競爭力,開啟數據驅動的增長新模式。
02.
就緒數據底座,
筑牢智能數據平臺驅動創新
也正是洞察到這種需求變化,戴爾科技集團在開放、靈活和安全的架構上,打造智能數據平臺解決方案,該平臺秉持五大核心設計宗旨,致力于為企業打造一個高效、靈活且極具創新性的數據環境,助力企業在數字化浪潮中脫穎而出。
一是,更容易的數據訪問和洞察,賦予企業業務部門和數據團隊自助式訪問權,推動業務創新;二是,增強的數據策略,通過豐富元數據、合并數據源,確保更準確的洞察,提高數據可發現性;三是,更可控的數據存儲與管理,利用開放格式和行業標準,增強快速高效搜索非結構化數據的能力;四是,簡化且統一的數據存儲平臺,通過單個命名空間和多協議支持提供通用訪問;五是,針對智能應用和數據工作負載優化,采用高性能、可擴展、可用性和安全性架構,確保企業無縫運營。
![]()
值得一提的是,戴爾科技智能數據平臺解決方案在存力底座方面可以采用智能就緒型存儲平臺PowerScale以及第四代對象存儲平臺ObjectScale。
其中,PowerScale自2020年正式從Isilon更名煥新以來,一直以橫向擴展的存儲架構,以及高性能、高擴展、高可靠能力為非結構化存儲樹立了新的標桿,成為了智能時代關鍵的數據基礎設施,其核心的優勢主要體現在三個維度:
首先,靈活擴展,輕松應對數據增長。PowerScale 具備出色的擴展能力,企業可以從小規模起步,隨著業務的增長逐步擴展至 PB 級存儲容量,且整個擴容過程無需停機,確保業務的連續性,并僅需60秒即可完成新節點的添加,大大減少了擴容所需的時間和人力成本。整個集群還可通過一個統一的管理界面進行輕松管理,降低了管理的復雜性和難度,讓企業能夠更加專注于核心業務。
與此同時,PowerScale還是全球率先通過NVIDIA DGX SuperPOD驗證的以太網存儲解決方案,能夠提供GPU Direct Storage 的支持,該功能可以讓GPU直接訪問存儲數據,減少了數據路徑,降低了數據訪問延遲,從而有效縮短了訓練時間,提高了GPU利用率。因此,對于需要進行智能訓練工作負載的企業來說,這一功能能夠顯著提升訓練效率,加速模型的迭代和優化。
![]()
在近期舉辦的2025戴爾科技全球峰會(DTW)上,戴爾科技也基于OneFS 9.11的全新升級發布了新一代全閃存PowerScale平臺的最新成員PowerScale F910,其和稍早前發布的PowerScale F710,均提供了新的122TB驅動器選項,能夠實現單個節點最大2.9PB 的裸容量密度,滿足了企業對性能和容量的雙重需求。同時,針對混合平臺也進行了容量、成本、性能的優化,為企業提供了更多選擇,以適應不同的業務場景和預算要求。
其次,深度集成,滿足多樣化工作負載。為提高存儲利用率,PowerScale 提供了高速線內數據壓縮和重復數據消除功能。通過這些技術,企業可以在不增加存儲硬件成本的情況下,存儲更多的數據,有效節省了存儲空間和成本。此外,其單個數據湖的架構打破了數據孤島,實現了數據的集中存儲和管理,提高了數據的共享和利用效率,為企業決策提供了更全面、準確的數據支持。
在多協議支持方面,PowerScale 支持多種訪問協議,如 NFS、SMB、HDFS、S3 等,能夠對同一共享數據池進行統一訪問。這意味著用戶可以根據不同的工作負載和應用程序需求,選擇合適的協議來訪問數據,無需進行復雜的數據遷移和轉換。這種多協議支持的能力,使得 PowerScale 能夠適應各種復雜的企業環境,滿足不同業務場景下的數據訪問需求。
在數據安全方面,PowerScale 提供了企業級可用性、冗余度和安全性。除了本地數據保護措施外,還支持異地復制,將關鍵數據資產復制到其他地理位置,以防范因自然災害、訪問中斷和網絡攻擊等原因導致的數據丟失。同時,PowerScale 還提供勒索軟件保護和數據避風港解決方案,為企業的數據安全提供了全方位的保障,讓企業能夠安心應對各種安全威脅。
最后,能力增強,提升數據發現與管理能力。PowerScale 的存儲和數據管理產品組合能夠與業務應用程序無縫配合,為數據工程、數據科學、數據倉庫和數據湖項目提供強大的支持。它支持多種現代數據分析應用程序,如 Apache Flink、Spark、Hadoop、Dremio、Databricks 等,以及與 Adobe、NVIDIA、AMD 等行業領先企業的合作,使得企業能夠充分利用這些工具和技術,深入挖掘數據價值,推動業務創新和發展。
此外,PowerScale 提供的 MetadataIQ 框架增強了元數據功能,使客戶能夠根據工作流和分析需求發現所需數據并編制索引。元數據目錄可用于查詢、數據可視化和數據生命周期管理,為企業提供了更強大的數據管理和分析能力。當客戶添加分析工作流后,可以簡單高效地查詢各處的數據,增強時效性。同時,MetadataIQ 可以跟蹤數據的增量(變更列表),批量解析每個增量中的條目,更新索引數據庫,為企業的非結構化數據存儲庫提供全局目錄,方便企業進行全面的數據管理和分析。
針對 RAG(檢索增強生成)優化,PowerScale 也發布了開源文檔加載器,支持 LangChain 和 NVIDIA NIM 微服務。該加載器能夠智能識別和處理變更的數據,當源數據存儲在 PowerScale 時,可大幅縮短 RAG 數據流水線的攝取時間,并降低計算和 GPU 成本。這一優化使得企業在處理自然語言處理任務時,能夠更加高效地利用數據,提升模型的性能和效果。
不難看出,PowerScale以其靈活的橫向擴展性、高效的存儲管理、多協議支持、企業級安全保障、深度集成能力、智能加速功能、元數據增強、RAG 優化以及軟硬件升級等諸多優勢,當之無愧地成為構筑數據智能平臺的最佳底座選擇。
![]()
除此之外,基于第四代對象存儲平臺ObjectScale打造的戴爾科技智能數據平臺解決方案,則具備以下核心優勢:
其一,支持橫向擴展架構,應對數據指數級增長。平臺采用ObjectScale獨特的橫向擴展、跨地域的分布式架構設計,支持從TB到EB級的無縫擴容,無論數據中心部署在何處,均可輕松應對指數級數據增長需求。通過在線添加新節點的方式,也能實現容量與性能的同步擴展,確保業務無中斷升級,為企業的長期數據規劃提供可靠支撐。
其二,智能場景適配,構建高效對象數據存取。依托ObjectScale的多站點聯合與云復制功能,可構建全局可訪問的內容存儲庫;同時支持在應用程序和用戶附近部署存儲節點,實現就近訪問,最大限度降低延遲并縮短訪問路徑。與此同時,憑借豐富的多協議支持與互操作性(如S3、S3a、NFS等),可構建大規模擴展的多用途數據湖,為現代應用程序及分析應用提供高效數據支撐。
其三,統一管理與安全防護,保障數據全生命周期安全。管理層面,管理員可通過直觀的集中式GUI及內置報告工具,輕松管理數十億對象、數百個租戶及PB級數據;同時提供豐富的RESTful管理API,可無縫集成至現有管理解決方案中,實現統一管控;安全層面,ObjectScale集成高級安全功能,包括數據加密、增強型日志記錄、ObjectLock等技術,全面保護企業核心數據資產;其基于零信任架構設計,可有效抵御未經授權的訪問、勒索軟件攻擊及其他網絡風險,全方位保障數據安全。
![]()
03.
釋放數據價值,
助企業從數據到智能的躍遷
除提供智能就緒型存儲底座之外,戴爾智能數據平臺方案無論是在應用場景、數據保護、模塊化架構方面也專門進行能力強化,能夠幫助企業進一步釋放數據價值,助力企業實現從數據到智能的躍遷。
第一,在應用場景方面,戴爾科技智能數據平臺配備了數據分析引擎和數據處理引擎兩大核心組件。數據分析引擎采用Starburst技術,具備強大的跨多種數據源聯邦查詢能力;數據處理引擎則基于Spark技術,實現了數據的大規模處理。同時,基于戴爾科技智能數據平臺構筑的數據湖倉也采用100%開放格式驅動,并遵循現代行業標準,內置數據治理機制,確保數據湖倉能夠隨著未來需求的變化而不斷發展。
![]()
第二,在數據保護方面,戴爾智能數據平臺通過全面的保護策略確保組織數據的安全和合規性。包括存取控制、威脅檢測、數據隱藏、數據隔離、數據加密以及數據復制和移動性等多方面的保護措施,為企業數據提供了全方位的安全保障。
第三,在模塊化架構方面,戴爾智能數據平臺整合了全流程數據管理。通過咨詢服務梳理數據智能和商業智能的用例需求,依托數據湖倉實現跨云、跨數據源的統一查詢與治理,結合Elastic Search的元數據索引和PowerScale Metadata IQ完成非結構化數據準備工作,并通過元數據增強引擎生成可消費數據產品。其多協議存儲支持高性能訪問,消除了數據在不同協議間的數據搬運開銷。此外,網絡安全套件提供了威脅防護與實時響應,輔以生命周期服務和優化分析引擎,形成了從數據整合、存儲、分析到安全防護的完整解決方案。
![]()
總的來看,采用PowerScale或ObjectScale作為存力底座的戴爾智能數據平臺以“開放架構兼容生態、就地查詢激活全量數據、自研技術保障性能、立體安全守護資產”為核心,構建了適應智能時代的數據基礎設施,其關鍵價值不僅在于解決數據孤島與遷移難題,更通過技術開放性與安全可靠性,幫助企業構建敏捷、可持續的數據生態,從容應對數據智能驅動的業務創新挑戰,加速企業搶占智能創新的制高點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.