![]()
國產(chǎn)大模型的快速迭代為人文社會科學研究注入強勁動能。在歷史學領域,國產(chǎn)大模型有效降低了歷史學者學習、掌握數(shù)智方法的技術門檻,這場技術革新不僅重構了史料處理、研究分析的底層邏輯,也為歷史研究在范式創(chuàng)新、話語自主等方面帶來新的發(fā)展機遇。國內(nèi)多所高校紛紛投身這場技術浪潮,開始嘗試自主布局新型數(shù)智研究平臺,在技術與人文的平衡中探索史學研究的新可能。
數(shù)字史學進入“后大模型”時代
國產(chǎn)大模型對史學研究的改變,貫穿于史料整理、檢索分析、成果呈現(xiàn)等多個環(huán)節(jié),不僅顯著提升了研究效率,還在重塑著研究的底層邏輯與實現(xiàn)路徑,呈現(xiàn)出多點突破、深度賦能的鮮明特征。
![]()
![]()
長期以來,史料整理占據(jù)了文史學者大量時間,成為制約研究進展的重要瓶頸。國產(chǎn)大模型的介入,正在根本改變這一現(xiàn)狀。北京大學圖書館研究館員朱本軍表示,隨著大模型引入史學研究,文本文獻OCR識別、訪談錄音整理、文言文自動標點等工作的“效率提升了200倍不止”。這種飛躍使學者得以從繁瑣勞動中解放出來,將更多精力投入學術問題本身,這本身就是一種改變。
技術門檻的降低更讓數(shù)字史學實現(xiàn)普及化發(fā)展。南京大學歷史學院教授王濤坦言,此前數(shù)字史學因需要計算機技術和編程基礎,存在明顯準入壁壘,而深度求索(DeepSeek)、Kimi、通義千問等國產(chǎn)大模型的升級迭代,讓非技術背景的歷史學者也能開展量化分析。學者通過發(fā)掘大模型的工具屬性,可在文獻翻譯、多模態(tài)史料運用等方面“以技術換積累”,快速掌握陌生領域的核心概貌,極大拓展了研究的可能性。
在平臺建設層面,數(shù)字史學正從傳統(tǒng)的數(shù)據(jù)庫倉儲向智能研究平臺轉(zhuǎn)型,呈現(xiàn)出鮮明的兩極分化。朱本軍將傳統(tǒng)模式概括為“前大模型”思路,即聚焦單一專題的資料堆砌與靜態(tài)檢索;而“后大模型”的發(fā)展思路則更注重全面的史料整合,通過借助大模型的自然語言理解、復雜推理等能力,提供檢索增強生成、智能分析等個性化功能,實現(xiàn)從靜態(tài)檢索到知識生成的跨越。
南開大學歷史學院副教授馬思宇表示,大模型的突破本質(zhì)上是實現(xiàn)了技術工具與史學研究邏輯的深度適配,它不再是傳統(tǒng)數(shù)據(jù)庫的技術升級,而是重構了史學研究從史料獲取到分析解讀的底層流程,“標志著數(shù)字史學從技術嘗試進入體系化應用的新階段”。
成果呈現(xiàn)與傳播形態(tài)的創(chuàng)新同樣亮眼。以往史學成果多局限于論文、專著,如今在大模型助力下,多模態(tài)發(fā)布成為可能。浙江大學文學院教授徐永明表示,當前大模型在開展專業(yè)歷史科普、創(chuàng)意視頻傳播等方面表現(xiàn)不俗。他所在團隊研發(fā)的云四庫智能問答系統(tǒng),涵蓋多種地方志及多領域文獻,確保專業(yè)數(shù)據(jù)可查可追溯;團隊還以經(jīng)典古籍為素材,利用大模型生成動畫視頻,無需專業(yè)編劇和導演即可完成科普內(nèi)容創(chuàng)作。“這種低成本、高效率的傳播方式,對普及中華優(yōu)秀傳統(tǒng)文化意義重大。”徐永明表示。
技術演進與學術發(fā)展內(nèi)在契合
國產(chǎn)大模型與數(shù)字史學的深度融合,并非偶然的技術疊加,而是國家政策引導、技術自主創(chuàng)新與學科發(fā)展需求三重因素共振的結果,彰顯出技術演進與學術發(fā)展的內(nèi)在契合。
國家政策的頂層設計為技術發(fā)展筑牢根基。2025年8月,國務院印發(fā)《關于深入實施“人工智能+”行動的意見》,為國產(chǎn)人工智能發(fā)展提供引領性框架。在政策推動下,國產(chǎn)大模型技術加速迭代,技術革新有效降低了訓練成本,開源生態(tài)的持續(xù)繁榮也為數(shù)字史學應用提供了堅實的技術支撐。
![]()
學科發(fā)展的內(nèi)在需求則成為技術落地的核心動力。歷史文獻具有大體量、廣分布、多模態(tài)、多語種的特征,單靠學者或研究團隊難以全面駕馭,人工智能輔助研究成為當前學者聚焦前沿問題展開探索的必然選擇。以近代史為例,近年來相關研究正經(jīng)歷從宏觀敘事到微觀實證、從單一學科到跨學科融合的深刻轉(zhuǎn)型,國產(chǎn)大模型精準匹配了這一轉(zhuǎn)型中的核心需求,成為推動研究深化的重要動力。
馬思宇認為,在微觀史、跨學科、深度實證等具體研究領域,這種需求更為突出。例如,研究近代城市化進程,需要整合人口統(tǒng)計數(shù)據(jù)、城市規(guī)劃檔案、交通日志等多種類型資料;研究思想傳播,需要追蹤核心概念在不同報刊、群體中的擴散路徑。國產(chǎn)大模型平臺整合的多模態(tài)處理、關聯(lián)挖掘、可視化呈現(xiàn)等功能,精準匹配了這些核心需求,成為推動研究深化的重要動力。
進一步而言,技術引入正使文獻資料實現(xiàn)從靜態(tài)命中到知識推理的檢索增強生成(RAG)轉(zhuǎn)變。何為檢索增強生成?朱本軍向記者解釋道,這是一種直接利用大模型的自然語言理解、復雜推理和多模態(tài)能力,從海量史料中挖掘“不可見”的關聯(lián)并直接生成結果,將隱性知識脈絡顯性化的技術。隨著該技術的應用,史學工作者的綜合學術判斷力將在史學研究中愈發(fā)占據(jù)主導,推動史學研究層次與質(zhì)量的整體提升。
陜西師范大學歷史文化學院講師張光偉及其團隊的實踐頗具代表性。他們借助自主研發(fā)的西夏文OCR系統(tǒng),將構造復雜的西夏文字典《文海》高精度轉(zhuǎn)錄為機器可讀文本,為深度分析奠定基礎。“技術不再是單純的輔助工具,而是成為解決傳統(tǒng)人文問題的核心方法論。”張光偉表示,未來這類方法可廣泛應用于人物關系網(wǎng)絡、觀念傳播路徑等復雜問題研究,推動研究范式革新。
值得關注的是,國產(chǎn)大模型為構建中國自主知識體系提供了關鍵支撐。多位學者提出,國外模型以英文數(shù)據(jù)為主,難以準確理解中國特有歷史概念與古今異義詞匯,而國產(chǎn)大模型基于本土化語料訓練,從根本上解決了這一適配難題。“基于海量本土史料的分析,有助于中國史學研究擺脫‘西方中心論’的敘事局限,為國際學術界傳遞‘中國聲音’提供了扎實的實證支撐。”馬思宇說。
資源整合與頂層設計不足是突出挑戰(zhàn)
國產(chǎn)大模型為數(shù)字史學帶來前所未有的發(fā)展機遇,但作為新興領域,其在資源整合、技術適配、生態(tài)構建等方面仍面臨諸多挑戰(zhàn)。未來要在技術迭代與人文堅守之間找到平衡點,實現(xiàn)可持續(xù)的體系化推進。
關于史學研究是否會迎來范式轉(zhuǎn)型,學術界也有理性的探討。王濤認為,人工智能雖然改變了史學家的工作流程,在方法論層面帶來諸多新可能,但在認識論層面,研究范式與學者的學術品位、審美緊密相關,能否實現(xiàn)根本性轉(zhuǎn)型仍需觀察。更多學者則認為,當前數(shù)字史學仍處于“史學數(shù)字化”階段,實證本質(zhì)未改變,但隨著史料被構建成“語義化歷史知識世界”,未來或?qū)⑥D(zhuǎn)向史學研究思維重塑——學者將更注重提出綜合性“大問題”,利用智能工具探索歷史可能性,開展思想實驗。
資源整合與頂層設計不足是當前面臨的突出挑戰(zhàn)。因缺乏整體部署,各單位重復建設、各自為戰(zhàn)的現(xiàn)象較為普遍,造成資源浪費。對此,徐永明建議,需加強政策引導與統(tǒng)籌協(xié)調(diào),以長遠戰(zhàn)略眼光加大對人文領域大數(shù)據(jù)發(fā)展的支持,避免低水平建設與資源錯配。
技術層面,建立標準化體系成為基礎工程。馬思宇提出,應由史學界與檔案界聯(lián)合制定史料數(shù)字化標準,明確掃描分辨率、元數(shù)據(jù)標注規(guī)范等核心要求,逐步構建高質(zhì)量史料數(shù)據(jù)庫,破解資源壁壘。朱本軍補充道,未來還需建立“定本”文獻資源庫和更為規(guī)范的“命名實體”庫,為機器介入推理消歧和定準提供更具標準化、結構化和唯一性的權威數(shù)據(jù)版本。
在應用模式上,專屬知識庫與大模型的深度融合成為核心方向。張光偉認為,未來主流應用將是檢索增強生成系統(tǒng)向智能體系統(tǒng)演進,真正的競爭力不在于模型本身,而在于能否將核心研究資料科學整合進知識庫,并將大模型能力無縫嵌入研究全流程。這種深度整合與模式創(chuàng)新,將是數(shù)字史學發(fā)展的關鍵。
從長遠來看,數(shù)字史學的成熟必然是技術與人文的深度融合。當技術真正成為貼合史學研究需求的學術伙伴,而非游離于學科之外的工具附庸時,必將推動我國歷史研究進入實證更扎實、視角更豐富、話語更自主的新階段。在這一過程中,既要保持對技術創(chuàng)新的開放態(tài)度,又要堅守史學研究的人文底色,讓數(shù)字技術真正服務于“究天人之際,通古今之變”的史學使命,為傳承中華優(yōu)秀傳統(tǒng)文化、構建中國自主知識體系提供有力支撐。
中國社會科學報記者 劉越
來源:中國社會科學報
新媒體編輯:常暢
如需交流可聯(lián)系我們
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.