國產(chǎn)大模型的快速迭代為人文社會科學(xué)研究注入強勁動能。在歷史學(xué)領(lǐng)域,國產(chǎn)大模型有效降低了歷史學(xué)者學(xué)習(xí)、掌握數(shù)智方法的技術(shù)門檻,這場技術(shù)革新不僅重構(gòu)了史料處理、研究分析的底層邏輯,也為歷史研究在范式創(chuàng)新、話語自主等方面帶來新的發(fā)展機遇。國內(nèi)多所高校紛紛投身這場技術(shù)浪潮,開始嘗試自主布局新型數(shù)智研究平臺,在技術(shù)與人文的平衡中探索史學(xué)研究的新可能。
數(shù)字史學(xué)進(jìn)入“后大模型”時代
國產(chǎn)大模型對史學(xué)研究的改變,貫穿于史料整理、檢索分析、成果呈現(xiàn)等多個環(huán)節(jié),不僅顯著提升了研究效率,還在重塑著研究的底層邏輯與實現(xiàn)路徑,呈現(xiàn)出多點突破、深度賦能的鮮明特征。
![]()
![]()
長期以來,史料整理占據(jù)了文史學(xué)者大量時間,成為制約研究進(jìn)展的重要瓶頸。國產(chǎn)大模型的介入,正在根本改變這一現(xiàn)狀。北京大學(xué)圖書館研究館員朱本軍表示,隨著大模型引入史學(xué)研究,文本文獻(xiàn)OCR識別、訪談錄音整理、文言文自動標(biāo)點等工作的“效率提升了200倍不止”。這種飛躍使學(xué)者得以從繁瑣勞動中解放出來,將更多精力投入學(xué)術(shù)問題本身,這本身就是一種改變。
技術(shù)門檻的降低更讓數(shù)字史學(xué)實現(xiàn)普及化發(fā)展。南京大學(xué)歷史學(xué)院教授王濤坦言,此前數(shù)字史學(xué)因需要計算機技術(shù)和編程基礎(chǔ),存在明顯準(zhǔn)入壁壘,而深度求索(DeepSeek)、Kimi、通義千問等國產(chǎn)大模型的升級迭代,讓非技術(shù)背景的歷史學(xué)者也能開展量化分析。學(xué)者通過發(fā)掘大模型的工具屬性,可在文獻(xiàn)翻譯、多模態(tài)史料運用等方面“以技術(shù)換積累”,快速掌握陌生領(lǐng)域的核心概貌,極大拓展了研究的可能性。
在平臺建設(shè)層面,數(shù)字史學(xué)正從傳統(tǒng)的數(shù)據(jù)庫倉儲向智能研究平臺轉(zhuǎn)型,呈現(xiàn)出鮮明的兩極分化。朱本軍將傳統(tǒng)模式概括為“前大模型”思路,即聚焦單一專題的資料堆砌與靜態(tài)檢索;而“后大模型”的發(fā)展思路則更注重全面的史料整合,通過借助大模型的自然語言理解、復(fù)雜推理等能力,提供檢索增強生成、智能分析等個性化功能,實現(xiàn)從靜態(tài)檢索到知識生成的跨越。
南開大學(xué)歷史學(xué)院副教授馬思宇表示,大模型的突破本質(zhì)上是實現(xiàn)了技術(shù)工具與史學(xué)研究邏輯的深度適配,它不再是傳統(tǒng)數(shù)據(jù)庫的技術(shù)升級,而是重構(gòu)了史學(xué)研究從史料獲取到分析解讀的底層流程,“標(biāo)志著數(shù)字史學(xué)從技術(shù)嘗試進(jìn)入體系化應(yīng)用的新階段”。
成果呈現(xiàn)與傳播形態(tài)的創(chuàng)新同樣亮眼。以往史學(xué)成果多局限于論文、專著,如今在大模型助力下,多模態(tài)發(fā)布成為可能。浙江大學(xué)文學(xué)院教授徐永明表示,當(dāng)前大模型在開展專業(yè)歷史科普、創(chuàng)意視頻傳播等方面表現(xiàn)不俗。他所在團隊研發(fā)的云四庫智能問答系統(tǒng),涵蓋多種地方志及多領(lǐng)域文獻(xiàn),確保專業(yè)數(shù)據(jù)可查可追溯;團隊還以經(jīng)典古籍為素材,利用大模型生成動畫視頻,無需專業(yè)編劇和導(dǎo)演即可完成科普內(nèi)容創(chuàng)作。“這種低成本、高效率的傳播方式,對普及中華優(yōu)秀傳統(tǒng)文化意義重大。”徐永明表示。
技術(shù)演進(jìn)與學(xué)術(shù)發(fā)展內(nèi)在契合
國產(chǎn)大模型與數(shù)字史學(xué)的深度融合,并非偶然的技術(shù)疊加,而是國家政策引導(dǎo)、技術(shù)自主創(chuàng)新與學(xué)科發(fā)展需求三重因素共振的結(jié)果,彰顯出技術(shù)演進(jìn)與學(xué)術(shù)發(fā)展的內(nèi)在契合。
國家政策的頂層設(shè)計為技術(shù)發(fā)展筑牢根基。2025年8月,國務(wù)院印發(fā)《關(guān)于深入實施“人工智能+”行動的意見》,為國產(chǎn)人工智能發(fā)展提供引領(lǐng)性框架。在政策推動下,國產(chǎn)大模型技術(shù)加速迭代,技術(shù)革新有效降低了訓(xùn)練成本,開源生態(tài)的持續(xù)繁榮也為數(shù)字史學(xué)應(yīng)用提供了堅實的技術(shù)支撐。
![]()
學(xué)科發(fā)展的內(nèi)在需求則成為技術(shù)落地的核心動力。歷史文獻(xiàn)具有大體量、廣分布、多模態(tài)、多語種的特征,單靠學(xué)者或研究團隊難以全面駕馭,人工智能輔助研究成為當(dāng)前學(xué)者聚焦前沿問題展開探索的必然選擇。以近代史為例,近年來相關(guān)研究正經(jīng)歷從宏觀敘事到微觀實證、從單一學(xué)科到跨學(xué)科融合的深刻轉(zhuǎn)型,國產(chǎn)大模型精準(zhǔn)匹配了這一轉(zhuǎn)型中的核心需求,成為推動研究深化的重要動力。
馬思宇認(rèn)為,在微觀史、跨學(xué)科、深度實證等具體研究領(lǐng)域,這種需求更為突出。例如,研究近代城市化進(jìn)程,需要整合人口統(tǒng)計數(shù)據(jù)、城市規(guī)劃檔案、交通日志等多種類型資料;研究思想傳播,需要追蹤核心概念在不同報刊、群體中的擴散路徑。國產(chǎn)大模型平臺整合的多模態(tài)處理、關(guān)聯(lián)挖掘、可視化呈現(xiàn)等功能,精準(zhǔn)匹配了這些核心需求,成為推動研究深化的重要動力。
進(jìn)一步而言,技術(shù)引入正使文獻(xiàn)資料實現(xiàn)從靜態(tài)命中到知識推理的檢索增強生成(RAG)轉(zhuǎn)變。何為檢索增強生成?朱本軍向記者解釋道,這是一種直接利用大模型的自然語言理解、復(fù)雜推理和多模態(tài)能力,從海量史料中挖掘“不可見”的關(guān)聯(lián)并直接生成結(jié)果,將隱性知識脈絡(luò)顯性化的技術(shù)。隨著該技術(shù)的應(yīng)用,史學(xué)工作者的綜合學(xué)術(shù)判斷力將在史學(xué)研究中愈發(fā)占據(jù)主導(dǎo),推動史學(xué)研究層次與質(zhì)量的整體提升。
陜西師范大學(xué)歷史文化學(xué)院講師張光偉及其團隊的實踐頗具代表性。他們借助自主研發(fā)的西夏文OCR系統(tǒng),將構(gòu)造復(fù)雜的西夏文字典《文海》高精度轉(zhuǎn)錄為機器可讀文本,為深度分析奠定基礎(chǔ)。“技術(shù)不再是單純的輔助工具,而是成為解決傳統(tǒng)人文問題的核心方法論。”張光偉表示,未來這類方法可廣泛應(yīng)用于人物關(guān)系網(wǎng)絡(luò)、觀念傳播路徑等復(fù)雜問題研究,推動研究范式革新。
值得關(guān)注的是,國產(chǎn)大模型為構(gòu)建中國自主知識體系提供了關(guān)鍵支撐。多位學(xué)者提出,國外模型以英文數(shù)據(jù)為主,難以準(zhǔn)確理解中國特有歷史概念與古今異義詞匯,而國產(chǎn)大模型基于本土化語料訓(xùn)練,從根本上解決了這一適配難題。“基于海量本土史料的分析,有助于中國史學(xué)研究擺脫‘西方中心論’的敘事局限,為國際學(xué)術(shù)界傳遞‘中國聲音’提供了扎實的實證支撐。”馬思宇說。
資源整合與頂層設(shè)計不足是突出挑戰(zhàn)
國產(chǎn)大模型為數(shù)字史學(xué)帶來前所未有的發(fā)展機遇,但作為新興領(lǐng)域,其在資源整合、技術(shù)適配、生態(tài)構(gòu)建等方面仍面臨諸多挑戰(zhàn)。未來要在技術(shù)迭代與人文堅守之間找到平衡點,實現(xiàn)可持續(xù)的體系化推進(jìn)。
關(guān)于史學(xué)研究是否會迎來范式轉(zhuǎn)型,學(xué)術(shù)界也有理性的探討。王濤認(rèn)為,人工智能雖然改變了史學(xué)家的工作流程,在方法論層面帶來諸多新可能,但在認(rèn)識論層面,研究范式與學(xué)者的學(xué)術(shù)品位、審美緊密相關(guān),能否實現(xiàn)根本性轉(zhuǎn)型仍需觀察。更多學(xué)者則認(rèn)為,當(dāng)前數(shù)字史學(xué)仍處于“史學(xué)數(shù)字化”階段,實證本質(zhì)未改變,但隨著史料被構(gòu)建成“語義化歷史知識世界”,未來或?qū)⑥D(zhuǎn)向史學(xué)研究思維重塑——學(xué)者將更注重提出綜合性“大問題”,利用智能工具探索歷史可能性,開展思想實驗。
資源整合與頂層設(shè)計不足是當(dāng)前面臨的突出挑戰(zhàn)。因缺乏整體部署,各單位重復(fù)建設(shè)、各自為戰(zhàn)的現(xiàn)象較為普遍,造成資源浪費。對此,徐永明建議,需加強政策引導(dǎo)與統(tǒng)籌協(xié)調(diào),以長遠(yuǎn)戰(zhàn)略眼光加大對人文領(lǐng)域大數(shù)據(jù)發(fā)展的支持,避免低水平建設(shè)與資源錯配。
技術(shù)層面,建立標(biāo)準(zhǔn)化體系成為基礎(chǔ)工程。馬思宇提出,應(yīng)由史學(xué)界與檔案界聯(lián)合制定史料數(shù)字化標(biāo)準(zhǔn),明確掃描分辨率、元數(shù)據(jù)標(biāo)注規(guī)范等核心要求,逐步構(gòu)建高質(zhì)量史料數(shù)據(jù)庫,破解資源壁壘。朱本軍補充道,未來還需建立“定本”文獻(xiàn)資源庫和更為規(guī)范的“命名實體”庫,為機器介入推理消歧和定準(zhǔn)提供更具標(biāo)準(zhǔn)化、結(jié)構(gòu)化和唯一性的權(quán)威數(shù)據(jù)版本。
在應(yīng)用模式上,專屬知識庫與大模型的深度融合成為核心方向。張光偉認(rèn)為,未來主流應(yīng)用將是檢索增強生成系統(tǒng)向智能體系統(tǒng)演進(jìn),真正的競爭力不在于模型本身,而在于能否將核心研究資料科學(xué)整合進(jìn)知識庫,并將大模型能力無縫嵌入研究全流程。這種深度整合與模式創(chuàng)新,將是數(shù)字史學(xué)發(fā)展的關(guān)鍵。
從長遠(yuǎn)來看,數(shù)字史學(xué)的成熟必然是技術(shù)與人文的深度融合。當(dāng)技術(shù)真正成為貼合史學(xué)研究需求的學(xué)術(shù)伙伴,而非游離于學(xué)科之外的工具附庸時,必將推動我國歷史研究進(jìn)入實證更扎實、視角更豐富、話語更自主的新階段。在這一過程中,既要保持對技術(shù)創(chuàng)新的開放態(tài)度,又要堅守史學(xué)研究的人文底色,讓數(shù)字技術(shù)真正服務(wù)于“究天人之際,通古今之變”的史學(xué)使命,為傳承中華優(yōu)秀傳統(tǒng)文化、構(gòu)建中國自主知識體系提供有力支撐。
本報記者 劉越
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.