中國經濟網北京3月8日訊(記者 李月華 馬常艷)“當前中國在人工智能領域已取得顯著進展,但要實現從‘跟跑’到‘領跑’的轉變,須依賴高質量的數據集來支撐算法研發和應用落地。”全國政協委員、德勤中國董事會主席蔣穎在接受中國經濟網記者采訪時說。
高質量數據集是推動人工智能規模化應用的關鍵基礎,對提升國家科技創新能力、推動經濟高質量發展具有重要意義。近幾年,我國數據資源規模優勢持續擴大,數據資源開發利用活躍度穩步提升。數據顯示,2025年,我國建成高質量數據集超10萬個,規模超890PB(拍字節)。
蔣穎指出,高質量數據集可直接用于人工智能模型開發訓練,能有效提升模型性能。不過她在調研中發現,當前我國數據集建設仍存在標準不一、管理服務薄弱、應用導向不足等問題,導致數據集重復建設、復用率低、價值釋放受限。
對此,蔣穎提出三個方面的建議:一是構建覆蓋分類、元數據、質量評價等環節的統一標準體系,推動存量數據標準化改造;二是建立專項協調機制,提供標準化流程、工具模板和技術支持,通過設立財政激勵來降低企業負擔;三是強化應用導向,要求項目立項明確使用場景,通過評審與監督確保建設成果匹配需求,并推動成熟數據集納入公共平臺實現共享復用。
圍繞以應用為導向的高質量數據集建設機制,蔣穎進一步表示,在建設過程中,要通過階段性評審、驗收和動態監督,持續校準數據集建設方向,確保建設成果與實際應用需求高度匹配,避免“為建設而建設”。
來源:中國經濟網
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.