![]()
活動中,孔江平介紹北大語言學實驗室相關研究成果。澎湃新聞記者 程婷 圖
12月16日—19日,北京大學舉行北京大學語言學實驗室成立一百周年系列活動。活動中,“中華民族語言文字接觸交融大數據模型”成果發布。
據北大語言學實驗室主任、北大中文系教授孔江平介紹,北大語言學實驗室是集科研、教學、社會服務于一體的多學科交叉平臺,其前身是1925年成立的北大語音樂律實驗室。2021年12月,北大語言學實驗室獲批為教育部哲學社會科學實驗室。在教育部經費的支持下,2022年春北大語言學實驗室啟動了“中華民族語言文字接觸交融大數據模型建設”項目。該項目組織國內12所大學和科研機構的約20名專家的研究團隊,近200名博士生和碩士生,對中華民族語言文字接觸交融情況進行了大規模的田野調查,歷經四年,初步完成了基礎的調查工作和大型數據庫建設。
此次發布的中華民族語言文字接觸交融大數據模型,涉及中華民族語言文字接觸交融大數據模型數據庫的結構;語言活力的基礎模型和算法——主要討論語言活力的基本要素和分類方法;文字活力的基礎模型和算法——主要討論語言活力的基本要素和分類方法;中華民族語言文字接觸交融大數據模型的內容和形式——主要討論數據庫的形式;中華民族語言文字接觸交融通用語言詞匯模型與算法——主要討論詞匯的語意結構、相關的基本算法和分類的方法;中華民族語言文字接觸交融音位系統相似度模型與算法——主要討論利用音位系統相似性來對語言進行分類。該大模型的建設,有助于讓沉睡在田野中的即將消亡的聲音活起來、傳承下去。
孔江平介紹,在該項目中,除了大數據模型以外,主要成果還有關于中華民族語言文字接觸交融的系列書籍。按語言接觸和融合的實際,該系列書籍共分為十七卷,將于明年陸續出版。
此外,北大語言學實驗室還在“人類語言涌現和演化研究”“語言障礙與教育公平研究”和“基于人工智能的語言應用研究”等方向上開展了多項重大課題的研究。本次活動期間,有聲博物館項目建設同步啟動。
北大黨委副書記姜國華表示,北大語言學實驗室是文理學科交叉創新的典范,希望實驗室繼續傳承科學方法傳統,主動服務國家戰略,做文明火種的守護者、交叉創新的開拓者、立德樹人的踐行者和中國學派的建構者。
教育部語言文字應用管理司司長楊鴻表示,北大語言學實驗室積極服務國家語言文字重大戰略任務與需求。他希望北大繼續以中文系和語言學實驗室為重要陣地,進一步深耕國家通用語言文字推廣普及、引領語言文字數智變革、厚植復合型人才沃土,為構建新時代語言文字事業高質量發展體系作出更大貢獻。
教育部語言文字信息管理司司長劉培俊表示,在智能時代,語言文字已成為大語言模型以及人工智能技術創新的數據要素、智能基座和戰略基礎。期待北大語言學實驗室未來在國家標準研制、關鍵技術攻關、跨學科協同等方面發揮更大作用,有效賦能經濟社會發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.