網易首頁 > 網易號 > 正文申請入駐

北大發布“中華民族語言文字接觸交融大數據模型”

2025-12-18 10:54:31　來源: 澎湃新聞

北京舉報

分享至

活動中，孔江平介紹北大語言學實驗室相關研究成果。澎湃新聞記者程婷圖

12月16日—19日，北京大學舉行北京大學語言學實驗室成立一百周年系列活動。活動中，“中華民族語言文字接觸交融大數據模型”成果發布。

據北大語言學實驗室主任、北大中文系教授孔江平介紹，北大語言學實驗室是集科研、教學、社會服務于一體的多學科交叉平臺，其前身是1925年成立的北大語音樂律實驗室。2021年12月，北大語言學實驗室獲批為教育部哲學社會科學實驗室。在教育部經費的支持下，2022年春北大語言學實驗室啟動了“中華民族語言文字接觸交融大數據模型建設”項目。該項目組織國內12所大學和科研機構的約20名專家的研究團隊，近200名博士生和碩士生，對中華民族語言文字接觸交融情況進行了大規模的田野調查，歷經四年，初步完成了基礎的調查工作和大型數據庫建設。

此次發布的中華民族語言文字接觸交融大數據模型，涉及中華民族語言文字接觸交融大數據模型數據庫的結構；語言活力的基礎模型和算法——主要討論語言活力的基本要素和分類方法；文字活力的基礎模型和算法——主要討論語言活力的基本要素和分類方法；中華民族語言文字接觸交融大數據模型的內容和形式——主要討論數據庫的形式；中華民族語言文字接觸交融通用語言詞匯模型與算法——主要討論詞匯的語意結構、相關的基本算法和分類的方法；中華民族語言文字接觸交融音位系統相似度模型與算法——主要討論利用音位系統相似性來對語言進行分類。該大模型的建設，有助于讓沉睡在田野中的即將消亡的聲音活起來、傳承下去。

孔江平介紹，在該項目中，除了大數據模型以外，主要成果還有關于中華民族語言文字接觸交融的系列書籍。按語言接觸和融合的實際，該系列書籍共分為十七卷，將于明年陸續出版。

此外，北大語言學實驗室還在“人類語言涌現和演化研究”“語言障礙與教育公平研究”和“基于人工智能的語言應用研究”等方向上開展了多項重大課題的研究。本次活動期間，有聲博物館項目建設同步啟動。

北大黨委副書記姜國華表示，北大語言學實驗室是文理學科交叉創新的典范，希望實驗室繼續傳承科學方法傳統，主動服務國家戰略，做文明火種的守護者、交叉創新的開拓者、立德樹人的踐行者和中國學派的建構者。

教育部語言文字應用管理司司長楊鴻表示，北大語言學實驗室積極服務國家語言文字重大戰略任務與需求。他希望北大繼續以中文系和語言學實驗室為重要陣地，進一步深耕國家通用語言文字推廣普及、引領語言文字數智變革、厚植復合型人才沃土，為構建新時代語言文字事業高質量發展體系作出更大貢獻。

教育部語言文字信息管理司司長劉培俊表示，在智能時代，語言文字已成為大語言模型以及人工智能技術創新的數據要素、智能基座和戰略基礎。期待北大語言學實驗室未來在國家標準研制、關鍵技術攻關、跨學科協同等方面發揮更大作用，有效賦能經濟社會發展。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.