人工智能時代的語言與認知

2026-03-20 00:32:59　來源: 科轉(zhuǎn)在線

北京舉報

分享至

作者簡介

蔡曙山，清華大學社會科學學院認知科學與技術(shù)研究中心主任、教授、博士生導(dǎo)師。研究方向為哲學、語言學、邏輯學、心理學和認知科學，主要著作有《認知科學導(dǎo)論》《我言，故我在——語言、思維、文化層級的高階認知研究》《自然語言的形式理論研究》《語言、邏輯與認知》《言語行為和語用邏輯》等。

摘要

語言是人類認知的核心，其演化深刻推動人類文明進程。語言的誕生決定人類從猿到人的進化，漢字的出現(xiàn)則標志著中華文明的成熟。進入20世紀，維特根斯坦的分析哲學和語言哲學揭示語言對認知的根本性約束，喬姆斯基的先天語言能力假說確立語言作為人類核心認知能力的地位，為認知科學的誕生及其與人工智能的融合奠定理論基礎(chǔ)。21世紀是認知科學和人工智能的時代，語言的知識體系與認知能力成為技術(shù)發(fā)展的關(guān)鍵驅(qū)動力，而自然語言與人工語言的語義鴻溝，導(dǎo)致人工智能系統(tǒng)難以實現(xiàn)文化層面的語義理解和語用分析。漢語憑借語形加工、語義加工和語用加工的顯著優(yōu)勢，成為全球認知科學發(fā)展與人工智能競爭中的重要認知工具，為人類探索語言與心智的深層關(guān)系提供獨特視角和方法。

導(dǎo)言

認知科學發(fā)端于20世紀50年代的“認知革命”，并在70年代末逐漸成為一個公認的交叉學科領(lǐng)域，其核心學科包括哲學、語言學、心理學、人類學和神經(jīng)科學，并與計算機科學深度融合，旨在揭開人類心智的奧秘，促進學科的交叉融合與創(chuàng)新發(fā)展。在此框架下，計算機科學與認知科學交叉產(chǎn)生的人工智能，已成為一個影響深遠、備受關(guān)注的領(lǐng)域，并將深刻改變?nèi)祟愇磥淼陌l(fā)展。

在此探索過程中，對語言本質(zhì)與機制的揭示，已成為理解人類心智和人工智能的關(guān)鍵問題。根據(jù)人類認知五層級理論，語言構(gòu)成人類認知的基礎(chǔ)。在語言的基礎(chǔ)上，人類發(fā)展出復(fù)雜的思維，并借助語言和思維構(gòu)建起整個知識體系，知識不斷積淀，最終形成文化。由此可見，人類的存在，本質(zhì)上是語言、思維與文化的存在。約在600萬年至200萬年前，人類發(fā)明了抽象符號語言（即概念語言），這成為從猿到人進化的關(guān)鍵轉(zhuǎn)折。人類借此創(chuàng)造出一切物質(zhì)財富與精神財富，并通過語言構(gòu)建起城邦和制度，文明時代自此開啟。

認知科學讓我們認識到，語言的發(fā)明是人類歷史上至關(guān)重要的事件，是使人成為“人”的關(guān)鍵。作為人類最重要的心智和認知能力，語言創(chuàng)造并推動著人類的文化與文明發(fā)展。可以說，人類的存在是文化的存在，歸根結(jié)底是語言的存在。在此意義上，“我言，故我在”的論斷得以成立。進入20世紀，以維特根斯坦和喬姆斯基為先驅(qū)，人類以空前的睿智重新回歸語言這一關(guān)鍵領(lǐng)域，由此開啟認知科學與人工智能的新的時代。當前人類面臨的諸多機遇和挑戰(zhàn)，包括人工智能的興起，其根源與突破方向皆在于語言。本文立足這一背景，探討語言與人類認知關(guān)系的演進與發(fā)展、漢語認知的獨特優(yōu)勢及其在未來發(fā)展中的重要作用，以期為人類認知發(fā)展提供新的理論依據(jù)與實踐途徑。

語言是人類認知的基本能力

語言的發(fā)明是人類進化的重要標志，這一重大事件不僅促成人類完成從猿到人的轉(zhuǎn)變，還為人類創(chuàng)造文化和文明奠定基礎(chǔ)。

文化（culture）一詞源于拉丁語“cultura”，意為“培養(yǎng)”（cultivation）。從廣義上講，文化即“人化”，乃是人類創(chuàng)造的一切成果之總和。具體而言，其涵括物質(zhì)文化（如電燈電話、飛機飛船）、制度文化（如憲法制度、國家機關(guān)、和平慶典），以及精神文化（如語言文字、篆刻書法、音樂繪畫、思想觀念）。這些不同層面的創(chuàng)造，共同構(gòu)成人類豐富而多維的文化世界。文明（civilization）一詞則側(cè)重于“城邦化”，是文化發(fā)展到一定階段的產(chǎn)物，是人類活動的高級形式。文化與人類同時出現(xiàn)，文明的出現(xiàn)則更為晚近；文化反映人類精神創(chuàng)造的方面，文明則更反映物質(zhì)生產(chǎn)和社會制度方面。

漢語作為中華民族的主要語言，深刻參與中華文明的創(chuàng)造與發(fā)展。作為世界上最古老且持續(xù)煥發(fā)生機的文明之一，中華文明可追溯至殷商時代（約公元前1600年至前1046年），并在此根基上孕育出博大精深、歷久彌新的中華文化。語言在文化與文明的起源、發(fā)展過程中的重要作用，如表1所示。

表1 語言與中華文化和中華文明的起源和發(fā)展

來源：作者自制

可以看出，人類文化和文明的每一次發(fā)展和進步，無一不是人類語言運用的結(jié)果。在此表中，特別值得關(guān)注兩個重要事件：一是約在600萬年至200萬年前，由于言語（口語）的發(fā)明，人類祖先與黑猩猩分離，最終進化為人，它是人類誕生的標志；二是3500年前殷商時代文字（書面語言）的發(fā)明，這是中華文明起源的標志。這兩個事件標志著中華民族已經(jīng)具備完整的語言系統(tǒng)，即口頭語言（語音系統(tǒng)）和書面語言（文字系統(tǒng)）。人類語言作為抽象的概念語言，為人類思維的產(chǎn)生提供基礎(chǔ)，即人類能夠運用概念進行判斷和推理。語言和思維的結(jié)合共同創(chuàng)造人類的全部知識，而這些知識積淀為文化。從此，人類具備獨特的三種認知方式：語言、思維和文化。

可見，正是語言的發(fā)明和使用，改變了人類的進化方向，并推動人類發(fā)展日新月異。盡管人類語言的運用已長達數(shù)百萬年，但對語言本質(zhì)與心智奧秘的科學探索，直至20世紀認知科學的興起，才真正進入系統(tǒng)與深入研究的新階段。

語言與學科知識。語言是一種知識還是一種能力？傳統(tǒng)觀念中，語言常被視為一種知識。以漢語為例，對中國人而言，語音和文字都屬于知識范疇。從胎兒時期母親的胎教，到嬰幼兒階段的日常語音交流，再到小學階段語文（語言和文學）成為整個基礎(chǔ)教育階段的主課，這些經(jīng)驗表明，語言是一種后天習得的知識體系。此外，人類所有的知識體系也均是用語言和思維建構(gòu)的，如數(shù)學、物理、文學、哲學等學科知識的形成與發(fā)展，都離不開語言的參與。這些現(xiàn)象進一步表明，語言更是人類最重要的認知能力，并且是人類全部知識的基礎(chǔ)。

人類的知識系統(tǒng)表現(xiàn)為學科，如古希臘的“三科四藝”。其中，“三科”包括語言、邏輯和修辭，古希臘人認為這是人類最重要的三門知識；“四藝”則涵蓋算術(shù)、天文、幾何和音樂，被視為人類最基本的四種技藝和技能。從古希臘到中世紀，歐美教育傳統(tǒng)一直將“三科四藝”作為完善人格的基本途徑和重要認知方法。公元9世紀末，歐洲開始出現(xiàn)第一批大學，如法國的巴黎大學、意大利的博洛尼亞大學（被譽為“大學之母”，開設(shè)語法學、邏輯學、修辭學和法學課程）、英國的牛津大學和劍橋大學等。到12世紀，西方著名大學將“三科四藝”列為基本課程，形成基本的知識體系。由此看出，人類知識是形成體系的學科知識和技能，知識等同于學科知識。大學的出現(xiàn)強化了以學科為基礎(chǔ)的知識學習，現(xiàn)代大學則完全采用分科教育模式。近代以來，人類知識呈現(xiàn)指數(shù)級增長，知識和學科的劃分愈發(fā)精細，最終形成層級復(fù)雜、門類眾多的龐大現(xiàn)代學科體系。

語言是一種能力。從另一方面來看，語言的本質(zhì)并非僅是知識或知識體系，其更是人類極為重要的認知能力。

美國語言學家諾姆·喬姆斯基（Noam Chomsky）的理論為我們重新審視語言的本質(zhì)提供全新視角。喬姆斯基認為，行為主義語言學無法回答關(guān)于語言的兩個根本問題：其一，假如語言是后天習得，為何母親未教授孩子所有語句，孩子卻能舉一反三地學會無窮多的語句呢？其二，孩子能夠?qū)W會母語（第一語言）及其他民族語言，為何卻無法學會其他動物的語言呢？在與行為主義語言學家、心理學家伯爾赫斯·弗雷德里克·斯金納（B. F. Skinner）的論戰(zhàn)過程中，喬姆斯基提出新的語言理論，認為語言并非知識，而是能力，第一語言的認知能力是先天遺傳的，而非后天習得。人類憑借這種語言能力建構(gòu)了所有的知識體系。這就是喬姆斯基的先天語言能力（Innate Language Faculty, ILF）假說，其后得到語言學家哥普尼克（M. Gopnik）等人的實證研究和實驗研究的支持。

生成轉(zhuǎn)換語法。在提出先天語言能力科學假說的同時，1957年，喬姆斯基出版《句法結(jié)構(gòu)》，創(chuàng)立生成轉(zhuǎn)換語法（generative transformational grammar）。根據(jù)喬姆斯基的句法理論，第一語言的句法加工，并非如行為主義語言學所認為的自下而上（bottom-up）進行，而是自上而下（top-down）展開。以下展示一個英語“主-謂-賓”句式生成模型示例（見圖1）。

來源：作者自制

圖1 英語“主-謂-賓” 句式生成模型

借助此模型，可生成無數(shù)具有“主-謂-賓”句式的英語語句，如“the man hit the ball”“this boy love that girl”等。需注意，生成規(guī)則主要針對直接陳述句的構(gòu)成進行分析，且動詞不作詞尾變化，直陳句之外的其他語句和單數(shù)第三人稱詞尾變化等句法結(jié)構(gòu)，則由轉(zhuǎn)換規(guī)則予以說明。在該模型中，從樹根（sentence）到終端符（T,N,V,T,N）之間的結(jié)構(gòu)，稱為深層結(jié)構(gòu)（deep structure），而從終端符到語詞（the,man,hit,the,ball）之間的結(jié)構(gòu)，稱為表層結(jié)構(gòu)（surface structure）。顯然，喬姆斯基的句法理論和生成轉(zhuǎn)換規(guī)則，完美解答了行為主義語言學無法回答的關(guān)于語言的兩個根本問題，即語言的無限生成能力問題，以及不同自然語言之間為何能夠互相理解的問題。喬姆斯基的生成句法理論深刻揭示了語言系統(tǒng)的經(jīng)濟性——僅需4種樹形結(jié)構(gòu)（即“主-謂-賓”、“主-謂-雙賓”、“主-謂”、“主-系-表”），便能生成所有的英語語句。

喬姆斯基的理論不僅實現(xiàn)對所有自然語言的統(tǒng)一，還產(chǎn)生能夠統(tǒng)一所有形式語言的形式文法。眾所周知，計算機語言就是人類為機器設(shè)計的一種形式語言。喬姆斯基的重大貢獻可以歸為以下三點：其一，他認識到語言學是一種知識，而語言卻是一種能力，并提出先天語言能力假說，認為第一語言的能力是先天遺傳的。認知科學建立之后，語言被看作是人類最重要且基本的認知能力。其二，他的語言理論徹底改變?nèi)祟悓φZ言這一能力的認識，深刻影響語言知識的學習和語言能力測試，使重點從知識記憶轉(zhuǎn)向能力培養(yǎng)。其三，他認識到人類不僅能使用語言，而且會創(chuàng)造語言，并且人的語言創(chuàng)造力是無窮的。人類創(chuàng)造了表意的符號語言，從而脫離動物界，并在符號語言的基礎(chǔ)上發(fā)展出思維、建構(gòu)知識體系，使知識積淀為文化。語言、思維和文化，共同構(gòu)成人類特有的認知能力。

圖2是生命進化過程中產(chǎn)生的所有語言的分支圖，包括人類自發(fā)明語言以來所創(chuàng)造的所有語言。可以看出，人類語言包括非符號語言（信號語言）和符號語言兩種類型。非人類動物僅具備非符號語言，能傳達覓食、求偶、危險預(yù)警等與生存直接相關(guān)的信號，但無法表達抽象概念。非符號語言包括肢體語言和聲音語言：低等動物僅具備肢體語言，其表達依賴肢體接觸或視覺感知，傳達信息的速度和范圍受到限制。而更高級的動物進化出聲音語言，其傳播以聲速進行，語言交際無需身體接觸，語言傳播的速度和范圍顯著提高。

來源：作者自制

圖2 人類語言結(jié)構(gòu)和語言分支圖

從語言演化視角看，人類語言被認為是在非符號語言基礎(chǔ)上發(fā)展而來的，自然包含肢體語言和聲音語言。需要注意的是，人類的肢體語言和聲音語言能夠表達概念，這與非人類動物存在本質(zhì)區(qū)別。約200萬年前，人類發(fā)明了表意的符號語言（包括自然語言與人工語言）。根據(jù)文字特征，自然語言又分為聲音語言和象形語言兩類，前者如英語、法語、德語、俄語等，后者以漢語為代表。與自然語言對應(yīng)的是人工語言，即為特定目的人為創(chuàng)造的語言，包括非形式的人工語言（如世界語）和形式的人工語言（廣泛應(yīng)用于數(shù)學、邏輯、計算機和人工智能領(lǐng)域的一階語言、高階語言、模態(tài)語言、模糊語言）。

認知科學定義的知識和能力。人類認知五層級理論認為，在生命進化過程中，依次產(chǎn)生腦與神經(jīng)、心理、語言、思維和文化五種心智，從而產(chǎn)生五個層級的認知能力，人類憑借此能力對內(nèi)部信息和外部信息進行加工，從而形成生存和發(fā)展所需要的知識和文化。人類所有的知識體系，無一不是通過語言和思維來建構(gòu)的。例如，數(shù)學就是由一套專用的符號系統(tǒng)，加上公理的推理規(guī)則構(gòu)成。著名的皮亞諾算術(shù)系統(tǒng)（Peano Arithmetic, PA）就是其代表，基本內(nèi)容如下：

語言

皮亞諾算術(shù)系統(tǒng)的語言是一種形式語言，其是在一階語言的基礎(chǔ)上增加以下符號而得：

公理

在這一語言的基礎(chǔ)上，可構(gòu)造一個形式系統(tǒng)，使之能夠表明算術(shù)運算的系統(tǒng)特征，這就是皮亞諾算術(shù)系統(tǒng)，PA有以下7條公理：

公理(1)是說，零不是任何數(shù)的后繼數(shù)。公理(2)是說，對任何兩個數(shù)，如果它們的后繼相等，則此二數(shù)亦相等。公理(3)是說，任何數(shù)與零之和仍然是這個數(shù)。公理(4)是說，一個數(shù)與另一個數(shù)的后繼之和，等于此二數(shù)之和的后繼數(shù)。公理(5)是歸零律，即任何數(shù)與零之積為零。公理(6)是乘法對加法的分配律，即一個數(shù)乘以另一個數(shù)的后繼，等于此二數(shù)之積與第一數(shù)之和。公理(7)是著名的數(shù)學歸納法。

在皮亞諾算術(shù)系統(tǒng)中，可推導(dǎo)出一些重要定理。例如：

等等。

算術(shù)是整個數(shù)學的基礎(chǔ)，而數(shù)學又是自然科學和人類理性思維的基石，也是人類最早建立的知識體系之一。若數(shù)學基礎(chǔ)出現(xiàn)問題，便會引發(fā)人類理智和整個知識系統(tǒng)的危機。1901年，英國哲學家、邏輯學兼數(shù)學家伯特蘭·羅素（Bertrand Russell）在集合論中發(fā)現(xiàn)悖論。羅素悖論動搖了整個數(shù)學大廈的根基，引發(fā)了所謂“第三次數(shù)學危機”。悖論出現(xiàn)后，弗雷格、羅素、希爾伯特、哥德爾等一眾數(shù)學家、邏輯學家與數(shù)理哲學家紛紛擱置原有研究，投身于數(shù)學基礎(chǔ)的拯救工作。這一過程最終催生數(shù)學邏輯（mathematical logic）學科，涵蓋邏輯演算、公理集合論、模型論、證明論和遞歸論等重要分支。

在這樣的背景下，德國數(shù)學家、邏輯學家大衛(wèi)·希爾伯特在20世紀20年代提出“希爾伯特方案”，即20世紀數(shù)學家應(yīng)該解決的23個基本問題。其中，建立形式數(shù)學系統(tǒng)并證明其一致性，是希爾伯特方案的基本問題之一，至關(guān)重要。1930年，奧地利數(shù)學家、邏輯學家弗雷德里希·哥德爾（Friedrich G?del）證明了一階謂詞邏輯的完備性定理，該定理表明：在一階邏輯中，凡是邏輯有效的公式皆可在形式系統(tǒng)內(nèi)得到證明，這為形式系統(tǒng)的可靠性提供重要支撐。然而，僅一年后，哥德爾發(fā)表更具顛覆性的不完全性定理，該定理由兩個部分組成：第一不完全性定理指出，任何一個足以表達自然數(shù)算術(shù)的一致形式系統(tǒng)，必定存在一個真而不可證的命題，因而該系統(tǒng)是不完全的；第二不完全性定理指出，這樣的系統(tǒng)無法在內(nèi)部證明自身的一致性。

簡言之，形式數(shù)學系統(tǒng)的一致性與完全性不可兼得，一致則不完全，完全則不一致。一致性是任何數(shù)學系統(tǒng)或邏輯系統(tǒng)必須滿足的基本條件，即系統(tǒng)內(nèi)部不能存在矛盾，任何一個命題p和非p不能同時為定理。而根據(jù)哥德爾定理，任何包括算術(shù)系統(tǒng)的數(shù)學系統(tǒng)或邏輯系統(tǒng)無法同時實現(xiàn)完全性，即至少存在一個真命題在系統(tǒng)內(nèi)是不可證的。這一定理深刻揭示出形式系統(tǒng)內(nèi)在的局限性。這一局限性不僅屬于數(shù)學。正如維特根斯坦在《邏輯哲學論》中所言：“我的語言的界限意味著我的世界的界限。”物理學家斯蒂芬·威廉·霍金（Stephen William Hawking）由此推論，依賴初等數(shù)學的物理學同樣受此約束，物理學家所追求的“終極理論”并不存在。因為物理學受底層邏輯的制約，哥德爾定理完全否定了這種無所不包的終極理論的可能性。哥德爾定理不僅約束數(shù)學與邏輯的邊界，更直接約束依賴形式化系統(tǒng)的人工智能。由于人工智能的邏輯計算本質(zhì)是形式化推理，其必然面臨“一致則不完全”的局限，無法窮盡所有真理，這為理解人工智能與人類心智的根本差異提供邏輯哲學的解釋。

在這場從數(shù)學基礎(chǔ)危機到理性邊界反思的過程中，人類展現(xiàn)出卓越的語言發(fā)明能力，發(fā)明出一種新的語言——形式語言，并以此為基礎(chǔ)創(chuàng)造出計算機與人工智能。由此可見，人類用語言構(gòu)建自身與人類社會，更創(chuàng)造出可能影響人類未來命運的人工智能。

然而，創(chuàng)造知識與駕馭知識的能力并非同一回事。從古希臘開始，西方教育似乎一直忽略一個根本性問題：教育的目標，究竟是向受教育者傳授知識，還是培養(yǎng)他們創(chuàng)造與運用知識的能力？這個問題的底層關(guān)聯(lián)著一個更為根本的問題：什么是知識？什么是能力？知識和能力之間是什么關(guān)系？直到20世紀50年代中期，這一問題才由喬姆斯基明確提出，并隨認知科學的建立而逐步得以回答。

認知科學的發(fā)展本身，體現(xiàn)出從關(guān)注靜態(tài)的學科知識，轉(zhuǎn)向探究動態(tài)認知能力的深刻轉(zhuǎn)變。筆者認為，心智是人類在進化過程中獲得的信息加工能力，從初階到高階依次分為腦與神經(jīng)、心理、語言、思維、文化五種心智能力。人類運用這些心智能力進行信息加工的過程，稱為認知。因此，人類擁有與之對應(yīng)的五個層級的認知能力，即腦與神經(jīng)的認知能力、心理認知能力、語言認知能力、思維認知能力和文化認知能力。人類所具備的各種能力皆可歸入其中，人類所有的知識，均是心智和認知能力的產(chǎn)物。

五個層級的心智和認知能力，與認知科學所涵蓋的六大學科結(jié)構(gòu)之間存在“一對多”的映射關(guān)系。然而，這種映射是單向的，即僅存在從心智和認知能力指向?qū)W科知識，不存在從學科知識到心智和認知能力之間的映射。這表明，認知能力生成了知識，而非知識創(chuàng)造了能力，人類的全部學科知識和學科體系，都是由人類的心智和認知能力所創(chuàng)造的。鑒于五個層級的心智與認知能力是一個瞬間貫通的整體，因此人類所生成的全部知識本然就應(yīng)是綜合與交叉融合的。在認知空間中，知識本應(yīng)是處處稠密、融會貫通的，然而學科的設(shè)置劃分往往是人為的、互相分隔的，這在一定程度上割裂知識的自然聯(lián)結(jié)，有悖于人類的認知特點與規(guī)律。隨著認知科學建立與人類認知能力增強，這種學科分隔的局面必將逐漸被打破，迎來學科深度融合、知識綜合創(chuàng)新的時代。

人工智能時代的語言認知

語言是人類在數(shù)百萬年漫長進化過程中獲得的特殊認知能力。大約在距今600萬年至200萬年前，南方古猿逐漸發(fā)展出表意的符號語言，這種語言不同于其他動物的信號語言，能夠協(xié)調(diào)更大范圍的群體行為。憑借這種關(guān)鍵的語言能力，這支在體格上并不占優(yōu)勢的群體得以在生存競爭中取得主導(dǎo)權(quán)，最終在約200萬年前完成從猿到人的進化。可以說，人類在進化中脫穎而出的唯一優(yōu)勢便是語言。

人類進化史中的另一重大事件，是文字（書面語言）的出現(xiàn)。大約在距今5000年至3500年間，文字的雛形出現(xiàn)并逐漸走向成熟。文字的發(fā)明意義深遠，它使得人類的經(jīng)驗、知識與文化能夠被客觀記錄和跨代累積。此后，人類的演進不再僅僅依賴以百萬年計的緩慢基因進化，而是轉(zhuǎn)向語言、知識和文化的進化，這一過程可以用“代”（generation）來計算，一代約為30年。自從10萬代（約300萬年）前人類發(fā)明口語以來，人類社會呈現(xiàn)加速發(fā)展態(tài)勢，至信息化和人工智能時代，發(fā)展速度堪稱日新月異（見表2）。

表2 人類能力獲得重大發(fā)展的歷史

來源：米黑爾·羅科、威廉·班布里奇編：《聚合四大科技提高人類能力》，蔡曙山等譯，北京：清華大學出版社，2010年，第32頁

計算機語言系統(tǒng)和邏輯系統(tǒng)。語言對人類的生存與發(fā)展至關(guān)重要，即便在數(shù)字化與人工智能時代亦復(fù)如此。在數(shù)字化、信息化的人工智能時代，我們需要面對兩種核心語言：自然語言與人工語言。人工語言是為實現(xiàn)某種目標人為創(chuàng)造的語言，它又分為兩支：一支是非形式的人工語言，如世界語；另一支是形式的人工語言，如一階語言和高階語言。

一階語言和一階邏輯系統(tǒng)的強大之處在于它可以解釋全部的算術(shù)，而算術(shù)系統(tǒng)是全部數(shù)學的基礎(chǔ)。因此，一階語言和一階邏輯經(jīng)過適當擴充，便可以解釋全部數(shù)學。作為形式化的人工語言的主要代表，一階語言為人工語言的精確性、可推導(dǎo)性奠定基礎(chǔ)，而計算機語言正是在此方向上發(fā)展出的二進制形式語言，是人工智能系統(tǒng)的底層語言支撐。

計算機語言是一個二進制的語言系統(tǒng)，這一系統(tǒng)只有兩個初始符號——“0”和“1”，我們通常稱之為數(shù)字化系統(tǒng)（digital system），它由初始符號和形成規(guī)則兩個部分構(gòu)成。

初始符號

1：二進制數(shù)的一個位，稱為“比特”（bit），經(jīng)解釋它表示命題的“真”，或?qū)?yīng)線路的“開”，或?qū)?yīng)存儲介質(zhì)的“充磁”。

0：二進制數(shù)的一個位，稱為“比特”（bit），經(jīng)解釋它表示命題的“假”，或?qū)?yīng)線路的“關(guān)”，或?qū)?yīng)存儲介質(zhì)的“消磁”。

形成規(guī)則

字節(jié)（byte）：由8個二進制數(shù)組成，是二進制系統(tǒng)中存儲信息的最小單元。

ASCII碼（American Standard Code for Information Interchange）：用于信息交換的美國標準代碼，它將英文字母和所有的數(shù)字、標點符號和常用符號進行編碼。

擴展的ASCII碼：用兩個或更多的字節(jié)對漢語等非英語進行編碼，可存儲各種漢字字體（如宋體、仿宋、楷體、黑體）的點陣信息；可對聲音、顏色、圖形、圖像進行編碼。

在這個語言系統(tǒng)之上，我們可以建立一個形式系統(tǒng)，用以進行形式符號的數(shù)學運算和邏輯推理，由此得到一個計算機系統(tǒng)。計算機系統(tǒng)包括計算機的指令系統(tǒng)，涵蓋數(shù)據(jù)傳送指令、算術(shù)運算指令、邏輯運算指令、程序控制指令、輸入輸出指令等，這些指令則由中央處理器（CPU）負責執(zhí)行，以完成計算機的各種任務(wù)。

人工智能語言系統(tǒng)和邏輯系統(tǒng)。從根本上看，當前階段的人工智能主要表現(xiàn)為計算機實現(xiàn)的智能。因此，探討人工智能的許多核心問題，可轉(zhuǎn)化為探討計算機系統(tǒng)如何實現(xiàn)智能的問題。為深入分析，我們不妨將計算機系統(tǒng)視為由兩個功能部分構(gòu)成：處理符號與意義的語言系統(tǒng)，以及執(zhí)行規(guī)則與演算的邏輯計算系統(tǒng)。相應(yīng)地，對人工智能的考察也應(yīng)從這兩個維度展開。

一個形式化的語言系統(tǒng)無法和一個自然語言系統(tǒng)完全對應(yīng)，即兩個語言系統(tǒng)之間無法實現(xiàn)在句法、語義和語用上的完全對應(yīng)和相互理解（在語義上的完全翻譯和語用上的完全分析），哪怕是兩個自然語言系統(tǒng)之間也難以實現(xiàn)。詩歌翻譯是典型例證，正如美國詩人羅伯特·弗羅斯特（Robert Frost）說過：“詩意就是在翻譯中要失去的東西。”金岳霖先生也曾指出：“詩意差不多是不能翻譯的。”杜甫《登高》中的頷聯(lián)“無邊落木蕭蕭下，不盡長江滾滾來”，其意象、聲律與文化意蘊，在任何另一種語言的翻譯中都必然有所損失。這深刻揭示了自然語言間語義與語用轉(zhuǎn)換的根本困境。

機器翻譯困境的核心在于自然語言理解與純粹符號處理之間的鴻溝。對于計算機所使用的人工（形式）語言系統(tǒng)，即便它能完美地進行句法轉(zhuǎn)換和符號操作，是否就意味著它像人類一樣理解自然語言的語義？語言和心智哲學家約翰·塞爾（John R. Searle）的中文房間論證模型（Chinese Room Argument, CRA），對這一問題作出回答（見圖3）。塞爾設(shè)計該實驗的目的是反駁“強人工智能”（strong AI），即認為只要程序正確，運行該程序的機器便具備與人同等的“心智”和“智能”。實驗中，房間內(nèi)的操作者并不懂中文，但他憑借一本操作手冊（程序），就能將輸入的中文符號轉(zhuǎn)換為英文符號，并將其輸出房間，能讓房間外的人以為自己在與一個懂中文的人交流。塞爾指出，這個房間整體（模擬運行程序的計算機）只是模擬了人類的語言行為，但并未做到真正的語言理解。

來源：T. Cowen, "The Chinese Room Thinks," Marginal Revolution, 7 April 2022, https://marginalrevolution.com/marginalrevolution/2022/04/the-chinese-room-thinks.html

圖3 塞爾的中文房間論證模型

從語言認知的層級來看，當前人工智能的語言加工仍停留在語形加工層面，與人類的語言認知存在本質(zhì)差距——人類兼具更高層級的語義加工（理解符號意義）與語用加工（在說話者、聽話者、時間、地點、語境因素中的理解和運用語言）能力，而這正是機器的語言能力與人類的語言能力的差異，也是人工智能未來的發(fā)展方向。認知科學表明，語言是思維與文化的載體：語言塑造文化，文化特質(zhì)亦依附于特定的語言形式。脫離語言去理解文化，難免遺失其精髓。“我言，故我在”的哲學命題對人工智能同樣構(gòu)成挑戰(zhàn)。人工智能的未來發(fā)展在于真正理解人類語言，進而達到對人類思維和文化的理解。

漢語的語形、語義、語用特質(zhì)及認知優(yōu)勢

漢語和其他語言一樣，由語音（口語）和文字（書面語）兩個部分構(gòu)成。從語言發(fā)展的歷程看，任何民族的語言都是先有語音，后有文字，文字本質(zhì)上是記錄語音的符號。文字的發(fā)展路徑大致分為兩種：一種是拼音化，如英、法、德、俄等語言，形成的是拼音文字；另一種是拼形化，形成的是象形文字，漢字是目前世界上唯一存在并仍在使用的表意文字體系。中國最早的成熟文字系統(tǒng)可追溯至商朝中晚期（距今約3600年）的甲骨文，歷經(jīng)數(shù)千年發(fā)展，漢字系統(tǒng)逐漸形成象形、指事、會意、形聲、轉(zhuǎn)注和假借這六種造字法，即所謂“漢字六書”。漢代許慎編撰的第一部系統(tǒng)分析漢字形音義的字典《說文解字》，共收錄10516個字形，其中包括正篆漢字9353個、異體字（重文）1163個；清代《康熙字典》共收錄漢字47035個。此外，漢字是一種視覺文字，其核心的認知功能來源于“看”，因此漢字的書寫具有重要意義。在漢字發(fā)展的歷史上，形成了全人類獨一無二的書法藝術(shù)，這既是獨特的文化認知方式，也是重要的文化藝術(shù)形式。

在語言認知、思維認知與文化認知層面，漢語和漢字展現(xiàn)出獨特且不可比擬的優(yōu)勢。該優(yōu)勢可以從漢語的語形加工、語義加工和語用加工三個層次進行分析。語形上，漢字以拼形靈活、造詞能力極強為特征；語義上，其音形義統(tǒng)一的視覺屬性，有助于提升信息加工效率；語用上，格律詩詞、對聯(lián)等形式蘊含深厚文化語境與隱喻智慧，形成不可替代的認知表達體系。

20世紀50年代以來，語言學家和認知科學家致力于探究人類大腦中語言加工的機制與過程，并明確區(qū)分語形加工、語義加工和語用加工三種不同的方式和過程。語形加工主要針對語言符號自身進行操作，語義加工涉及對語言符號及其指稱的對象進行操作，語用加工則要對語言符號及其使用者（說者和聽者），以及語言使用的時間、地點和語境等多方面因素進行操作。對這三類加工過程的研究，分別對應(yīng)并形成了語形學（syntax）、語義學（semantics）和語用學（pragmatics）三大領(lǐng)域，構(gòu)成當代語言學的“三分框架”。

漢語的語形加工。漢語的語形加工是指大腦對漢語的符號進行空間排列的加工方式，主要分為詞法加工和句法加工兩種類型。詞法加工是指用五種基本筆畫（橫、豎、撇、點、折）組合成偏旁和部首，再由偏旁和部首排成漢字的加工過程。這種構(gòu)型特征表明漢字是一種拼形文字，而非拼音文字。這種拼形法則具備極高靈活性，同一漢字可呈現(xiàn)不同結(jié)構(gòu)形態(tài)。比如，“群”有左右結(jié)構(gòu)“群”與上下結(jié)構(gòu)“羣”之分，“秋”可演變?yōu)椤昂袒稹弊笥医Y(jié)構(gòu)的“秋”、“禾龜”組合的“龝”，以及“火禾”互換的“秌”。中國人特別喜歡并且最能表達中華文化心理的“福”“壽”二字，在漢字書法中均有一百多種不同的寫法，形成“百福”和“百壽”書法作品（漢字書法忌諱雷同，同一作品中若有兩個相同的漢字，一定會采用不同的寫法），以滿足中國人的文化心理需求。這種靈活性在漢字書法中得以充分體現(xiàn)，使?jié)h字書法成為兼具規(guī)范性與個性化的藝術(shù)形式，而對個體差異性的追求，正是語言認知與認知科學的特質(zhì)之一。

超強造詞能力是漢語詞法的另一核心優(yōu)勢。6000個基本漢字本身即可獨立語詞（單字詞），通過排列和組合生成海量復(fù)合詞：二字詞數(shù)量介于組合數(shù)C(6000,2)=1799.7萬個與排列數(shù)A(6000,2)=3599.4萬個之間；三字詞數(shù)量在C(6000,3)=359.82002億個和A(6000,3)=2158.92012億個之間；四字詞（含多數(shù)漢語成語）的數(shù)量可達C(6000,4)=53.9460164985萬億個。僅從詞法上看，漢語可能是世界上所有語言中生成能力最強的語言。掌握6000個基本漢字即可滿足全部閱讀和書寫需求，而英語母語者需掌握2萬個單詞才能達成同等水平，即便掌握1萬個英文單詞也難以滿足日常需求。

漢語的語義加工。漢語的語義加工，即建立語言表達式與其指稱對象之間的映射關(guān)系，從而理解表達式意義的過程。在漢語中，語詞的指稱對象是論域中的個體，而語句的指稱對象是論域中的事件。漢字兼具音、形、義統(tǒng)一的視覺屬性，這一特性賦予其諸多獨特優(yōu)勢。比如，對漢字的加工可以從字形直接獲得其意義，而無需經(jīng)過聲音的轉(zhuǎn)換，從而使得漢語加工速度快于任何拼音文字。以閱讀《紅樓夢》為例，中國讀者只需快速瀏覽頁面，便能大致獲取篇章信息。而拼音文字（如英文）的閱讀過程則需先將視覺文字轉(zhuǎn)換為聲音信息，才能進一步獲取其意義。如果我們閱讀英文版或漢語拼音版《紅樓夢》，將無法直接獲取其意義。

漢語格律詩詞在語義加工方面也有其自身特色。語義問題的核心在于，判斷一個命題的真假與推理的有效性，而漢語詩詞常以悖論、隱喻等形式承載深層智慧。比如，《紅樓夢》第一回“太虛幻境”大門石牌坊上的對聯(lián)：“假作真時真亦假，無為有處有還無。”便蘊含一個邏輯悖論：從其假可以推知其真；從其真又可以推知其假；從其無可以看到其有，從其有可以看到其無。然而，這種悖論并非自相矛盾，而是需要讀者以“悟”領(lǐng)會的語言智慧。這與宋明理學、陽明心學強調(diào)的“悟”的認知理念高度契合。唐代劉禹錫《竹枝詞二首·其一》中“東邊日出西邊雨，道是無晴卻有晴”，以“晴”隱喻“情”，未提“情”字卻精準傳遞情感。這種語義表達高度依賴漢語語境與漢字特質(zhì)，脫離其語言環(huán)境便難以精準解讀。這類作品的認知，往往需要融合語形、語義和語用三個層次，其中隱喻是語言認知的重要方法，屬于語用加工和語用學范疇，凸顯了漢語語義加工的獨特性。

漢語的語用加工。漢語的語用加工，是指通過將漢語與其使用者（說者、聽者）、使用場景（時間、地點、語境）關(guān)聯(lián)起來，從而獲得完整意義的一種加工方式。說者、聽者、時間、地點、語境合稱為五大語用要素。語用加工涵蓋語義加工和語形加工，任何語言表達式只有在語用加工或語用學的層面上，才能實現(xiàn)意義的完整呈現(xiàn)。而漢語作為典型的語用語言，從漢字、語詞、語句到語篇各個層面，均具備極為豐富且深刻的內(nèi)涵，能夠傳遞其他語言難以表達的思想內(nèi)容與認知效果。對聯(lián)“風聲雨聲讀書聲聲聲入耳，家事國事天下事事事關(guān)心”，是漢語語用加工的典范。上聯(lián)中的風雨聲和讀書聲不僅指自然界的風雨和書院中的讀書聲，更隱喻政治上的風雨和儒家經(jīng)典所蘊含的士大夫情懷，下聯(lián)則源自“修身齊家治國平天下”的思想抱負，成為傳統(tǒng)知識分子家國情懷的典范表達。句法上，對聯(lián)嚴格遵循平仄對仗，兼具音律美感；語義上，雖未明確提及認知主體，卻能讓讀者深切感知到以天下為己任的讀書人形象；語用層次上，結(jié)合說話人顧憲成的東林黨領(lǐng)袖身份、聽話人天下儒生的定位，以及明萬歷年間的歷史背景、東林書院的場所屬性，方能領(lǐng)會其完整深意。對聯(lián)所運用的隱喻手法，既是語用加工的常用手法，也是認知科學的重要方法。而這種蘊含文化語境的表達體現(xiàn)了漢語的不可譯性，進一步證明漢語的獨特性和不可替代性。

深度求索（DeepSeek）等人工智能大模型之所以廣受關(guān)注，與漢語的特質(zhì)存在深度關(guān)聯(lián)。其一，高效的語言處理能力，基于深度學習的語言處理系統(tǒng)，能夠高效理解和生成漢語，適應(yīng)漢語的獨特性和復(fù)雜性；其二，精準的中文語境把握，通過持續(xù)收集新的文本數(shù)據(jù)，保持對中文語言最新發(fā)展的敏感度，不斷提升對中文語境的理解能力；其三，深層文化和語境挖掘，可理解文言文和現(xiàn)代漢語的多重含義；其四，有助于漢語全球化，借助人工智能技術(shù)為全球用戶提供漢語學習支持，進一步提升漢語在國際事務(wù)中的影響力。可以說，漢語的認知特質(zhì)成就了人工智能大模型的中文優(yōu)勢，其也為漢語在人工智能時代的傳播與應(yīng)用開辟新路徑。

漢語認知的獨特價值。在2025年世界人工智能大會上，被譽為“人工智能之父”的杰弗里·辛頓（Geoffrey Hinton）在題為《數(shù)字智能是否會取代生物智能》報告中，對人工智能的智能水平給予高度評價。然而，其觀點存在部分爭議。首先，辛頓認為“人類理解語言的方式實際上很像大模型，因此人類實際上很像大語言模型，也會產(chǎn)生幻覺，經(jīng)常編造東西”。事實上，人類認知并非基于大數(shù)據(jù)的語言模型，而是在基于小數(shù)據(jù)的語言模型上，實現(xiàn)直覺、頓悟、聯(lián)想和創(chuàng)新。如果我們讓人工智能大模型列出“中國最著名的10首古代詩歌”，王維的《山居秋暝》一定在列。但它卻無法創(chuàng)作一首同樣優(yōu)美的“詩中有畫，畫中有詩”的五絕。這正是認知科學的本質(zhì)：解釋人類認知的個體差異性，而語言認知的獨特性正是個體認知差異的根源。正如“我言，故我在”所揭示的，語言是人類認知世界的邊界。其次，關(guān)于辛頓提出的“人類實際上已經(jīng)無法控制人工智能”的觀點，筆者認為，長期來看，人工智能在綜合的認知能力方面難以超越人類，必須通過倫理與法律框架防范人工智能帶來的風險，而非單純依賴技術(shù)約束。另外，對于辛頓“訓練人工智能向善”的主張，根本局限在于純粹的“訓練”難以賦予人工智能穩(wěn)定的道德判斷框架。人工智能的道德問題必須超越技術(shù)訓練，從更深層的倫理與法律框架中尋求規(guī)范與約束。

從人類發(fā)明語言以來，語言和文字就決定著人類認知世界的方式和界限。維特根斯坦“我的語言的界限意味著我的世界的界限”的論斷，深刻揭示語言對人類認知的決定性作用。經(jīng)喬姆斯基、奧斯汀和塞爾等學者的共同努力，語言回到心智與認知研究的核心，并奠定以語言為基礎(chǔ)的認知科學的統(tǒng)一框架。漢語是中華民族的共同語言，它不僅是中華文明的重要基石，更是信息化和人工智能時代中國人特有的認知能力和共同的認知工具。在人工智能和認知科學時代，漢語和漢字憑借其蘊含的豐富語言信息和文化內(nèi)涵，將在未來的人工智能競爭中發(fā)揮自身的重要作用。

*文章轉(zhuǎn)載自《學術(shù)前沿》雜志2026年第4期。本文章僅限學習交流使用，版權(quán)歸原作者或機構(gòu)所有，如有侵權(quán)，請聯(lián)系我們刪除。

——??——

Serving national strategies, focusing on university research and the transformation of scientific and technological achievements

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.