網易首頁 > 網易號 > 正文申請入駐

人工智能社會化：內容生成與符號重塑

2026-04-13 18:29:35　來源: 社會學研究雜志

北京舉報

分享至

劉河慶

華中科技大學

社會學院

教授

人工智能社會化：內容生成與符號重塑

來源 | 《社會學研究》2026年第2期

作者 | 劉河慶

責任編輯 |趙夢瑤

大語言模型作為準社會主體融入社會生活，正在重塑社會互動模式與社會秩序。基于人工智能社會化視角，本研究使用四個大語言模型模擬不同角色對“知乎”平臺上的海量提問進行回答，進而對大語言模型的行為特征及其對內容生態的沖擊等進行分析。研究發現，大語言模型在互動中兼具精確性與機械性：它們能靈活識別場景，但在輸出中會機械地強化性別、年齡等方面的角色刻板印象。同時，大語言模型生成的內容語義高度集中，趨近于中立或高點贊的人類回答，進而可能引發社會符號系統的收縮和同質化。研究人工智能參與社會互動及內容生成的過程，為理解數智時代社會形態的變遷提供了重要視角。

一、引言

生成式人工智能的迅速崛起不僅標志著一場技術革命，也是一個重要的社會和文化現象。以大語言模型為代表的生成式人工智能，憑借其對于多模態內容的生成能力，正在重塑知識的生產和獲取方式，還展現出日益顯著的社會化潛能，這類模型以前所未有的方式滲透進人類社會生活（Gabriel,2020），逐漸超越單純工具的范疇，成為復雜場景中主動的互動參與者、意義構建者乃至社會符號系統的形塑力量（Lotman,1990；Bisconti,2024），這一轉變對社會學傳統意義上的互動模式與社會化過程產生了深遠影響。

經典社會化理論側重個體如何通過家庭、學校、同伴群體等社會化載體習得社會規范和價值觀念（米德，2018；Guhin et al.，2021），然而，以ChatGPT、DeepSeek為代表的大語言模型在海量場景中與人類開展互動、協作甚至競爭，對傳統社會化理論形成了挑戰。一方面，人工智能扮演著虛擬伴侶、內容生產者等角色，逐漸成長為具備一定自主性和創造性的準社會主體（伊德，2012；邱澤奇，2024a；Bisconti et al.，2024）；另一方面，作為社會文化技術（Farrell et al.，2025），大語言模型通過大規模內容生成直接作用于人類的語言、認知和價值體系，承擔起“智力物替”這一全新功能（王寧，2025），進而動搖了傳統社會化視角下相對靜態、固化的社會符號系統（Guhin et al.，2021）。在此背景下，系統分析人工智能如何在多元場景中承載不同社會角色，以及如何沖擊以平臺內容生態為代表的社會符號系統，成為理解數智時代人工智能如何推動社會形態與社會秩序整體演變的關鍵所在。

相關研究的難點在于應對人工智能所具有的高度實踐性和生成性?；谌祟愐延袝嬷R訓練而成的大語言模型能夠學習專業知識、互動規則和價值偏好，進而根據用戶的不同需求生成海量內容（這些內容出現在論文、政策報告、短視頻等諸多載體中）。首先，這體現了人工智能的高度實踐性，即與已有文獻中技術作為相對固定工具的角色（芬伯格，2005；Matthewman,2017）不同，人工智能已廣泛融入人類社會生活與專業領域（邱澤奇，2024a；王寧，2025），在社會互動中表現出高度的情境適應性和角色轉換能力，能夠應對多樣乃至沖突的社會需求，并在與人類互動過程中動態調整自身的角色、偏好乃至價值觀。其次，大語言模型的內容生成能力，特別是對觀念、偏好的生成能力，打破了經典社會化理論中相對清晰的宏微觀界限（個體通過社會化機構學習相對固定的社會規范和價值觀）。大語言模型在社會互動中生成的海量內容不僅直接沖擊平臺現有的內容生態，也通過模型迭代持續影響后續的人機互動。上述大語言模型在不同場景、時間與提示條件下所呈現的復雜行為差異及其生成能力，直接挑戰了將人工智能技術僅視為工具或客體，進而探討用戶接受度或社會后果等的傳統分析路徑。

因此，要考察大語言模型在數智時代的具體角色，必須超越僅將其視為工具并進行“技術能力評估”的分析框架，轉而關注其作為符號學意義上的行動者，如何在復雜社會場景中參與內容生產與觀念輸出。本文提出“人工智能社會化”視角，將大語言模型視為具有一定自主性與創造性的“準社會主體”，聚焦其最突出的內容生成能力，試圖回答以下問題。第一，大語言模型在不同場景中生成的內容，與人類用戶基于不同經歷和傾向所產生的內容有何異同？其內容輸出是否會強化某些特定內容或視角？這些異同反映了大語言模型對既有語言特征、偏好乃至社會規范的什么學習模式？第二，大語言模型在模擬不同社會角色時生成的內容存在何種差異，這體現了它對不同社會角色怎樣的理解？第三，大語言模型在短時間內生成的海量內容的語義分布與人類用戶在長期復雜互動中生成內容的語義分布有何不同？這些生成內容如何影響平臺內容生態？為回答上述問題，本研究采用計算實驗方法，使用四個國內外大語言模型（DeepSeek、ChatGPT、Qwen、豆包）模擬不同社會角色對“知乎”平臺上30余萬個提問進行回答，并與原有人類用戶的回答進行比較，以探索大語言模型生成內容的場景化特征。同時，通過考察人工智能生成內容與用戶生成內容在語義分布上的差異，本研究將進一步探討大語言模型的海量內容生成能力對社會符號系統的潛在影響。

二、文獻述評

（一）人工智能作為準社會主體

技術與社會的關系，尤其是技術發展與社會結構、社會觀念之間的復雜互動一直是社會學的核心議題（芬伯格，2005；Matthewman,2017）。在該領域的長期研究中，一個關鍵難題在于如何理解技術自身的高度變動性與復雜性。技術往往處于持續演進的狀態，且其用途和意義具有多重可能性（Matthewman,2017）?；诩夹g決定論和社會建構論視角的研究大多仍從技術的工具屬性出發，探討技術如何“增強”社會或社會如何形塑技術（芬伯格，2005）。而有關技術社會化的文獻則側重于技術在社會中被接受并擴散的過程（陳凡，1992）。這些視角因將技術視為相對固定的工具或客體，難以充分解釋技術與社會之間動態交織的復雜關系。后續研究開始倡導一種“分散的能動性”，強調人類和技術都具有主體性和能動性（伊德，2012；拉圖爾，2022）。例如伊德（Don Ihde）指出，在人類與技術互動的體驗的過程中存在他異性關系（alterity relations），技術在此關系中表現出一定的獨立性與互動性，成為“準他者”（伊德，2012）。數智時代人工智能在各社會領域的廣泛應用進一步印證了同時關注人類和技術能動性的必要性。有研究提出，隨著人工智能技術深度融入社會，傳統的人類中心主義視角需要被重新審視，人工智能不再只是工具，而是具備一定自主性和適應性的“準社會主體”，能夠在社會中承擔重要角色（Bisconti et al.，2024）。

因此，探究人工智能扮演何種社會角色，其作為“準社會主體”具有哪些特征，已成為理解數智時代技術與社會關系，乃至思考“數智社會可以可能”的關鍵（西蒙東，2024）。事實上，使人工智能具備參與社會互動的能力，特別是擁有足夠的社會智能，一直是該領域發展的重要目標（Suchman,2007；Bates，2024）。研究者將社會智能定義為“人工智能根據人類的標準對外在刺激和社會場景的要求作出自動化響應”，并已在此方向展開諸多探索（Fogg,1998；Bates，2024）。例如，福格（Brian J. Fogg）關注計算機的說服能力，認為作為社會行動者的計算機可通過建立社會規范、提供社會支持等方式影響人類態度（Fogg,1998）。然而，計算機科學對社會智能的追求在很長時期內未達預期，一個重要原因在于傳統機器學習依賴于編碼和明確的規則，而現實中大量的社會場景運行于隱性知識與非明文的規則之上（史密斯，2022），這使得只依靠固定、明確規則的計算機難以實現真正意義上的社會智能。

以大語言模型為代表的生成式人工智能的迅速崛起和廣泛應用，大大推進了人工智能的社會化進程及其社會智能的實現。ChatGPT、DeepSeek等大語言模型通常具備數十億參數，其訓練數據覆蓋了人類已記錄知識的絕大部分。除了數據規模龐大以外，這類模型在獲取人類隱性知識和規則方面尤其有效，它們通過學習示例，在無明確指令的情況下習得和掌握未被預先設計的能力（Autor,2024）。這種脫離固定腳本和顯性規則、依賴訓練數據即時決策和互動的能力，使大語言模型能夠廣泛融入各類社會場景，承擔如虛擬伴侶等多種社會角色（邱澤奇，2024b）。

盡管大語言模型有潛力成為廣泛存在于社會中的準社會主體，但其與具有特定成長經歷、相對穩定的價值觀、個性、知識和能力的人類個體存在本質差異（米德，2018）。大語言模型并未經歷人類成長過程中的“場景嵌入”，而是通過學習海量文本、圖像等人類知識，融合各類價值觀、知識及能力，從而表現出高度依賴上下文的價值觀和人格特征。根據不同的提示詞，它可以模擬多種角色，表達并迅速切換不同的價值觀（Collins，2025）。這意味著，生成式人工智能并不具備人類主體那樣相對穩定的偏好（Guhin et al.，2021），也不存在戈夫曼（Erving Goffman）所論述的“前臺”“后臺”的切換和張力（戈夫曼，2008），而是在海量社會互動中，高度依賴即時語境輸出相應的價值觀（Li et al.，2024）。值得注意的是，盡管大語言模型可以表達并快速轉換多種視角，但與數字平臺上用戶開放式的表達和討論不同，它往往以某種權威姿態將多元視角壓縮為單一視角參與社會互動（胡安寧、周森，2024；Collins，2025）。因此，探究以下問題至關重要：大語言模型在不同場景中輸出何種內容和視角？哪些視角或觀念更容易被激活并輸出，哪些則容易被抑制或忽略？模型在模擬不同社會角色時所輸出的內容有何差異？回答這些問題是理解大語言模型如何在多樣場景中進行互動并生成內容的關鍵。

綜上所述，大語言模型在不同社會場景中生成內容與價值偏好的能力，使其日益成為數智社會中不可忽視的準社會主體。面對快速迭代、種類眾多，以及與海量用戶高頻互動生成巨量內容的大語言模型，我們可從以下幾個方面深化對大語言模型作為準社會主體的認識。第一，在研究視角上，相較于從擬人化的視角關注大語言模型“知道什么”，更應關注其在符號學意義上的行動能力（Picca,2025）。大語言模型的社會化能力，關鍵不在于是否擁有意識或意圖，而在于其作為社會符號系統中的動態操作者，能夠通過海量內容輸出影響甚至塑造價值觀的信息。換言之，大語言模型自身雖然不會思考，卻持續通過內容輸出影響人類的思考過程。第二，已有研究多基于實驗室環境或理想化數據集分析生成式人工智能在預設場景中的表現（Li et al.，2024），而讓模型參與真實社會場景中的觀點表達等任務，并將其輸出結果與人類生成內容進行對比，更有助于揭示其在現實互動中的行為特征。第三，由于大語言模型的價值觀和人格特征高度依賴上下文，我們不應將其視作固定統一的整體，而應考察其在模擬不同社會角色時的具體生成特征，進而檢驗模型對不同社會角色的理解程度。總之，只有讓大語言模型以各種社會角色與真實社會場景相遇，才能在理論構想“大語言模型應做什么”的基礎上，系統考察實踐中“不同模型實際生成什么”，進而深化對人工智能社會化進程的理解。

（二）人工智能如何影響社會符號系統

在將人工智能視為準社會主體、探討其如何在具體場景中參與社會互動的同時，我們也需將其置于更廣闊的社會符號系統重組進程中，從宏觀層面考察具有海量內容生成能力的大語言模型對既有社會符號系統的潛在沖擊。單個大語言模型在具體互動場景中快速生成的內容看似隨機，但這些內容匯聚后可能呈現某種特定的偏好結構，進而形成新的話語結構與觀念體系，并沖擊已有內容。與此同時，大語言模型生成的海量內容又能以訓練語料等形式迅速反饋至后續場景，從而影響微觀層面的具體互動。這種宏觀與微觀之間的循環互構關系意味著，我們需要同時從兩個層面進行分析和比較，方能更深入地把握人工智能社會化的實質。

在對經典社會化理論的反思中，一個關鍵批評指向其對個體社會化過程的理解：個體在社會化中所學習和適應的并非靜態的社會規范和價值觀（Guhin et al.，2021），而是一個由語言、符號、行為與規范等多種資源構成的高度復雜的社會符號系統。這一系統在社會成員的持續互動和歷史變遷中不斷重組和更新（Swidler,1986；Lotman,1990；Gelfand et al.，2024）。以數字平臺的興起為例，平臺內部復雜多變的話語風格、價值取向與行為規范已成為顯性且可觀測的社會符號系統。當數字平臺逐漸成為社會符號系統的重要生成空間時，符號生產的主體也從專家轉變為廣大普通用戶（趙一璋、王明玉，2023；張茂元、邱澤奇，2024），算法則成為影響內容生產的關鍵機制，原本相對穩定的社會符號系統因此變得更加碎片化和動態化（喬天宇、向靜林，2022；劉河慶、梁玉成，2023）。數字平臺不僅帶來了社會符號數量的增加，也引發了話語意義維度的變化。例如，貝爾（Christopher A. Bail）等人引入“理性—感性”分析框架，發現數字平臺上公開的討論并未如哈貝馬斯（Jürgen Habermas）所預期的那樣推動理性話語數量的增長，反而促使感性話語數量的明顯增加（Bail et al.，2017）。這些在數字平臺中不斷生成的話語風格、價值傾向以及行為規范，已然成為數智時代重要的社會化環境（Gelfand et al.，2024；Tsvetkova et al.，2024），個體在此環境中持續創造并適應不斷迭代的符號系統，從而在虛擬層面不斷進行著社會化的過程。

大語言模型具有加速數字平臺中的話語風格、價值觀以及行為規范等社會符號系統演化的潛力（Gelfand et al.，2024；Floridi,2024）。生成式人工智能極大提升了內容生產效率，能夠快速生成海量語義制品（馬文、陳云松，2024；Floridi,2024；Farrell et al.，2025），成為數智時代重要的“意義制造者”。關于大語言模型如何具體沖擊以平臺內容為代表的社會符號系統，已有研究從生成內容的語言特征、潛在社會偏見、多樣性程度等多方面進行了考察（周旅軍、呂鵬，2024）。有研究發現，與人類文本相比，大語言模型表現出與之相似甚至更強的社會偏見（Pawar et al.，2024）。也有研究認為，需要重視大語言模型生成價值觀的復雜性，其高度靈活的視角輸出使其常常成為不同價值觀相互競爭的隱蔽場所（Bisconti et al.，2024；Collins,2025）。近期的研究開始將大語言模型生成內容與人類生成內容進行多維度綜合比較（龔為綱、黃思源，2025；胡安寧，2025；王元超等，2025），尤其關注大語言模型如何選擇性再現不同社會主體的觀點和語言風格。例如，胡安寧（2025）指出，大語言模型在輸出時面臨“正確”與“多樣”的兩難：大語言模型通過學習海量資料輸出的結果看似最優，實際上可能僅代表特定人群的觀點。還有研究則發現，大語言模型能夠再現不同社會群體的視角和語言風格，但仍面臨輸出偏見、同質性強、內容虛化等問題（Kozlowski & Evans,2025）。

總之，已有文獻關注到大語言模型的內容生成能力對社會符號系統的沖擊，但受分析視角和研究設計所限，仍留下了若干尚未得到系統回答的重要問題。例如，盡管大語言模型本身高度靈活且可快速模擬不同角色和視角生成內容，但其輸出結果能否反映人類觀點的真實分布，是否會系統性強化某些視角并壓縮其他內容？從分析視角看，已有研究多從能力評估角度分析大語言模型存在的不足（Li et al.，2024；Messeri & Crockett,2024；Sourati et al.，2025）。本文認為，除了評估單個模型輸出內容的正確性和局限性外，我們更應關注大語言模型作為宏觀內容生態塑造者的角色，考察其如何通過海量內容輸出影響符號系統。在研究設計方面，現有研究多基于實驗室環境或理想化數據集（Pawar et al.，2024），且往往缺少對大語言模型生成內容與人類真實觀點的比較。因此，深入理解大語言模型對社會符號系統的潛在沖擊，需要以人類用戶基于自身經驗和社會場景所形成的多樣化回答為參照，探究大語言模型作為準社會主體如何在多元社會場景中快速生成內容，進而重塑社會符號系統（Farrell et al.，2025）。

綜上，本文嘗試提出“人工智能社會化”的視角，聚焦大語言模型最為突出的內容生成能力，通過構建不同模型在海量社會場景中的回答數據，挖掘其多維度語義特征，并將其與人類用戶的回答進行系統比較。本研究旨在從微觀層面分析不同大語言模型在模擬各類社會角色、應對多元社會場景時的內容生成特征，同時在宏觀層面探討大語言模型的興起對數字平臺整體內容生態的潛在影響。

三、研究設計

（一）數據收集和處理

為了分析大語言模型在不同社會場景中的內容生成行為及其對平臺內容生態的潛在影響，首先需構建接近真實的社會場景并獲取可供對比的人類生成內容。

為此，本研究選取“知乎”問答平臺構建研究場景和數據來源?！爸酢弊鳛橐粋€廣受歡迎的問答平臺，匯集了大量用戶在科學技術、人際關系等多元話題下的真實互動，能較全面地反映不同場景中用戶的具體回答和潛在偏好。這為本文提供了相對自然和真實的、長時段的數字平臺內容生產和用戶互動場景，契合本文的研究目的。

在“知乎”平臺上，每個問題附有多個標簽以標明所屬領域。為確保問題樣本的覆蓋面，在數據收集過程中，筆者首先通過“知乎”的話題樹功能獲取盡可能廣泛的種子話題（涵蓋社會、科技等領域），并采集各話題下的問題及其所有回答。隨后，本研究以第一輪收集到的回答者為節點，進一步爬取其關注和回答的所有問題及相關回答，最終獲取了約1200萬條以“社會”“科技”“家庭”“文化”等為標簽的問題（時間跨度為2011—2022年）。為提高問答數據的質量，本研究篩選了回答數不少于10個的提問作為初始數據，并利用基于雙向編碼表示（Bidirectional Encoder Representations from Transformers，簡稱BERT）模型的主題模型（BERTopic）對這些問題進行議題分類。在此基礎上，本研究剔除了事實類、技能操作類、概念解釋類、娛樂類等較少涉及觀點表達的問題，重點保留了觀點評價類（如對特定現象或事件的看法）提問，去除重復問題后共得到301459個有效提問，并收集了相關提問者、提問時間、問題關注度、每個提問下點贊量前十的用戶回答及其點贊量等信息，從而構建了覆蓋多場景的“知乎”平臺問答互動數據庫。

基于上述30余萬條問題，筆者進一步選取ChatGPT、DeepSeek、Qwen、豆包等四個國內外的代表性大語言模型，調用其應用程序接口，將問題輸入并獲取各模型對應的回答。此外，本研究還設定了性別（男/女）、年齡（青年/老年）、回答風格（理性/感性）三個社會角色維度來引導各模型在生成回答時模擬不同角色。每個“知乎”問題最終對應生成32條不同角色條件下的模型回答。通過上述流程，本研究共收集了來自四個大語言模型、模擬八種具體身份、針對30余萬條問題的964余萬條回答大數據。

（二）測量

1.因變量

本研究致力于考察大語言模型與“知乎”用戶在不同場景中內容生成模式的差異，而準確測量二者生成內容的特征和差異是推進本研究的關鍵。已有研究主要基于毒性評分（Toxicity Score）（Pawar et al.，2024）等指標來評估大語言模型輸出內容的語義特征。上述指標雖有助于識別內容中明顯有害的表達，但對于更普遍、無明顯錯誤卻蘊含特定偏好與價值判斷的內容，其測度能力有限。為彌補這一不足，本研究嘗試同時構建兩個維度的測量：一是大語言模型回答與人類用戶回答的內容相似度，二是大語言模型回答在理性—感性軸上的偏向程度。通過這種方式，本研究力求更系統地考察不同大語言模型在多樣化場景中內容生成的具體特征。

具體而言，本研究使用BERT模型對301459個提問中的人類回答及大語言模型生成回答進行文本嵌入，將結果映射到統一的語義向量空間，從而使兩類回答處于可比較的語義環境中。以“知乎”問題中的人類用戶回答為基準，本研究計算其與對應各人工智能回答的余弦相似度，進而在問題層面上構建每個問題中人工智能回答與人類用戶回答的內容相似度指標。

本文聚焦于理性—感性維度，分析大語言模型與人類用戶在內容生成中的理性—感性偏向。具體而言，筆者基于框架軸（FrameAxis）模型，利用一組具有方向性的理性和感性種子詞對，構建一個指向性語義空間，在此空間中，每個人類回答與人工智能回答均可獲得在理性—感性軸上的語義位置。本研究通過計算每個回答在該軸上的得分，生成“理性—感性偏向”變量，得分越高，表明回答的理性程度越高。

2.主要解釋變量

本研究的主要解釋變量為“知乎”問題所屬的場景，即問題討論的主要領域。為識別不同問題涉及的場景，筆者使用BERTopic模型對30余萬條問題文本進行主題歸類，并對模型輸出結果進行合并，最終識別出以下五類主要討論領域：文化場景，涵蓋教育、藝術、科技、知識生產等相關議題的問題數量占比28.53%；政治場景，主要涉及國際關系、公共政策等議題的問題數量占比11.67%；經濟場景，主要包括職業評價、消費行為等相關討論的問題數量占比15.95%；社會生活場景，涉及婚姻家庭、性別角色、代際差異等議題的問題數量占比39.82%；其他未能明確歸入以上類別的問題數量占比4.03%。

此外，本研究同時關注大模型類別及其模擬的不同社會角色對內容生成的影響。模型類別指研究所使用的大語言模型，包括ChatGPT、DeepSeek、Qwen、豆包共四款國內外代表性模型。大語言模型模擬的不同社會角色變量則是分析模型對社會角色的理解以及模型行為特征和社會化模式的關鍵變量。在研究中，筆者通過提示詞設定，引導各模型基于性別（男/女）、年齡（青年/老年）、回答風格（理性/感性）三類社會維度生成回答。據此，每個語言大模型共模擬8種具體身份角色進行回答。基于此流程，本研究構建了以下分類變量：大語言模型具體類別、模擬性別群體、模擬年齡群體以及模擬回答風格。

3.控制變量

控制變量包括“知乎”問題的提問年份、問題長度、問題關注量、問題網友回答的平均點贊量以及問題網友回答的平均理性程度。問題提問年份為分類變量，時間跨度為2011—2022年。問題長度取“知乎”問題文本長度的對數值。問題關注量取平臺上該問題被網友關注數量的對數值。問題網友回答的平均點贊量為每個問題下點贊量最高的前十條網友回答的點贊數均值，并取對數值。問題網友回答的平均理性程度為每個問題下點贊量最高的前十條網友回答的理性得分均值。

（三）分析方法

在微觀層面，本文關注人工智能作為“準社會主體”在不同社會場景下生成的內容與人類用戶生成內容之間的總體相似度，以及大語言模型生成內容在理性—感性維度上的取值，二者均為連續變量。針對這兩個指標，本文采用多元線性回歸模型進行分析（使用穩健標準誤）。

在宏觀層面，筆者首先使用BERT模型對所有收集到的人類用戶回答和不同大模型生成的回答進行編碼，提取每個回答的高維語義向量；筆者隨后將所有回答投射至同一嵌入空間，通過比較人類回答與不同大語言模型回答在語義空間中的語義分布特征，探討人工智能的海量內容生成能力對已有平臺內容生態的潛在影響。

四、大語言模型模擬不同角色在不同場景中的生成內容特征

（一）大模型與人類用戶回答總體相似度分析

本節首先分析不同角色設定下的大語言模型在面對海量“知乎”問題時，其生成回答與人類用戶回答的相似度。表1的基礎模型結果顯示，問題回答的平均點贊量、問題長度及問題關注量系數均顯著為正，表明網友回答越受歡迎、問題越具體或問題關注度越高，大語言模型生成回答與網友回答的相似度也越高。此外，問題提問時間的結果表明，以2017年左右為界，對于2017年之前年份的問題，大語言模型生成的回答與已有網友回答相似度較低；而對于2017年之后新提出的問題，大語言模型生成的回答與已有網友回答的相似度則相對較高。

表1中的問題場景模型進一步檢驗了不同問題涉及的社會場景的影響，這一維度在已有文獻中較少被關注。結果顯示，當“知乎”問題涉及經濟場景時，大語言模型對該類問題的回答與人類用戶回答的相似度明顯高于其他三類場景（文化、政治、社會）。相對而言，大語言模型在政治場景和社會場景中生成的回答與人類回答的相似度則明顯較低。

表1還重點考察了不同大語言模型及其模擬角色對內容生成的影響。從各模型的表現差異來看，豆包大模型與“知乎”用戶回答內容的相似度最高，DeepSeek和ChatGPT模型次之，Qwen模型與用戶回答的內容相似度相對最低。這一結果反映出不同大語言模型在多樣場景中的適應性差異。鑒于“知乎”作為大眾化問答平臺的屬性，更側重于日常對話互動與創作的豆包大模型的生成內容與用戶回答更為接近。

此外，表1考察了大語言模型模擬不同角色時的內容生成差異。結果顯示，與模擬女性角色相比，當大語言模型模擬男性角色時，其生成內容與“知乎”用戶回答的相似度更高；與模擬老年群體相比，模擬青年時的相似度更高；與感性風格相比，模擬理性風格時的相似度更高。

為深入探究不同大語言模型及其模擬的社會角色在不同問題場景下的回答模式，筆者在表1全模型的基礎上，分別加入以下四個交互項：大語言模型類別與問題場景、模擬性別與問題場景、模擬年齡與問題場景、模擬回答風格與問題場景。圖1通過四個子圖分別展示了上述交互項對總體內容相似度的邊際效應。結果顯示，無論是不同大語言模型，還是不同大語言模型模擬的角色，其表現均呈現精確性與機械性并存的特征。一方面，不同大語言模型及其模擬的角色能夠較為精確地區分不同問題場景。如圖1所示，不論是模型類別差異，還是其模擬的三類角色，大語言模型在經濟場景中生成的內容與人類用戶回答相似度最高，而在政治和社會場景中相似度較低，表明大語言模型能夠區分不同場景的差異和特性。另一方面，大語言模型在理解社會角色時表現出明顯的機械性。以模擬性別為例，在四種不同問題場景中，大語言模型模擬男性角色時生成的內容與人類用戶回答的相似度均高于女性角色。簡言之，大語言模型對不同問題場景展現出較強的區分能力，但在模擬不同社會角色時，卻呈現明顯的模式化傾向。

上述結果初步揭示了大語言模型在內容生成方面的基本特征。正如已有文獻指出，大語言模型的一個重要優化目標是生成準確且符合主流價值觀的回答（Li et al.，2024），即兼顧輸出內容的準確性和多場景的適應性。從這一角度來看，大語言模型的確表現出較強的社會化能力，能夠生成較為貼合不同場景的內容。然而，當要求大語言模型模擬不同性別、年齡群體或輸出風格時，其生成內容卻表現出高度一致且相對刻板的特征，不同角色之間的輸出結果差異展現出一種“機器制造”般的精準分化。需要說明的是，上述結果僅為對大語言模型生成內容模式的初步測量，總體相似度的高低既受大語言模型自身生成特征的影響，也取決于“知乎”用戶回答的構成。因此，下文將聚焦感性—理性這一具體維度進一步探討大語言模型的內容生成模式。

（二）大語言模型回答中的理性—感性偏向分析

本小節進一步聚焦于理性—感性維度，考察不同大語言模型生成回答在理性程度上的偏向。與表1類似，表2的基礎模型首先分析了控制變量對大語言模型生成內容理性程度的影響。結果顯示，若一個問題下網友回答的平均點贊量較高，則大語言模型對該問題的回答理性程度相對較低；若一個問題下網友回答的理性程度均值較高，大語言模型生成回答的理性程度也相應較高。此外，問題受關注程度越高或問題內容越具體，大語言模型回答的理性程度越高。提問年份變量的影響表明，大語言模型對年份較近問題回答的理性程度有所下降。

表2中的問題場景模型進一步考察了問題場景對大語言模型回答理性程度的影響。結果顯示，大語言模型對經濟場景問題的回答理性程度最高，政治場景次之，社會場景較低，文化場景則最低。

表2同時分析了不同大語言模型及模擬角色對理性程度的影響。從模型類別來看，Qwen大模型生成回答的理性程度最高，ChatGPT次之，DeepSeek再次之，豆包大模型生成回答的理性程度相對最低。

在不同角色設定方面，相較于模擬女性角色，大語言模型在模擬男性角色時生成回答的理性程度更高。相較于模擬老年群體，大語言模型在模擬青年群體時生成回答的理性程度更高。相較于感性風格，大語言模型在模擬理性風格時生成回答的理性程度更高。不同風格之間理性程度的巨大差異，既體現了理性—感性維度測量指標的有效性，也再次印證了大語言模型在內容生成中表現出的精確性。

與上一節類似，筆者在表2全模型的基礎上，分別加入大語言模型類別與問題場景、模擬性別與問題場景、模擬年齡群體與問題場景、模擬回答風格與問題場景四個交互項。圖2通過四個子圖展示了上述交互項對大語言模型生成回答在理性—感性維度上偏向的邊際效應。

圖2顯示，當聚焦于理性—感性偏向時，大語言模型的輸出結果同樣呈現精確性與機械性并存的特征。一方面，大語言模型能夠根據不同場景與角色精準調整其價值傾向，如幾乎所有模型及其模擬的不同角色，均在經濟場景表現出最高的理性程度；另一方面，在模擬性別、年齡等社會角色時，大語言模型展現出連貫且穩定的刻板印象，即在所有場景中，模擬男性與青年角色生成的內容更為理性，而模擬女性與老年角色生成的內容更為感性。這種對群體的機械理解或刻板印象，并非偶然產生，而是大語言模型在學習人類語料過程中對既有社會偏見的精準復現和再生產。大語言模型的這一內容生產特征引發了如下隱憂：不同于日常社會互動中碎片化、偶發式的刻板表達，本文實證結果表明，大語言模型對不同社會角色的刻板理解具有穩定性與精準性。作為具有海量內容生產能力的準社會主體，大語言模型這種連貫且精確的內容輸出，可能在公共討論場域持續強化不同社會角色間的刻板印象。同時，這些生成內容可能成為后續大語言模型迭代的訓練語料，形成自我強化的反饋循環，進一步固化偏見。

與個體在家庭、學校以及社會中逐步展開的社會化過程不同，大語言模型并不具備個體成長過程中持續的情境參與能力。它通過學習海量人類知識，以概率建模方式在多樣場景中生成內容，進而進入社會互動空間。在這一過程中，大語言模型如何與廣大用戶保持一致、如何理解不同社會角色、在不同場景中輸出何種內容，是我們理解其社會化特征的關鍵。上述結果揭示出，大語言模型在社會互動中同時表現出精確性與機械性。它以權威和中立形象（胡安寧、周森，2024）將用戶在“知乎”平臺上大量的討論、思辨和爭議壓縮為單一輸出結果。這種輸出結果雖然能夠精準區分海量場景的差異，卻在持續的內容生成中機械地強化不同社會角色間的刻板印象。

五、大語言模型如何重塑平臺社會符號系統

為探究大語言模型生成的海量內容對“知乎”平臺內容生態的實際影響，筆者使用BERT模型對所有收集的人類用戶回答和不同大語言模型生成的全部回答進行編碼，獲取每個回答的768維語義向量，隨后通過對這些高維語義向量降維并將其投射至低維空間，直觀呈現并比較大語言模型生成內容與人類回答在語義分布上的特征。

圖3展示了經主成分分析降維后文檔向量在二維平面上的分布，并以不同顏色和形狀區分了回答主體，圖中點的距離表示語義相似度，距離越近代表回答內容的語義越相似。令人驚訝的是，盡管大語言模型的回答數量遠高于人類用戶，且模型訓練主要基于人類的書面知識，但其語義分布并未完全覆蓋人類用戶回答的語義空間。具體來看，四個大語言模型的回答在語義空間中高度重疊，集中于特定區域，人類用戶的回答則分布得更為分散和多元。雖然大語言模型能在不同場景中生成看似精確的回答，并能模擬不同角色和視角，但從宏觀語義分布來看，其輸出結果仍表現出高度集中和同質化的特征。換言之，盡管大語言模型能較好地區分海量社會場景，模仿人類生成大量符合場景要求的回答，卻難以替代人類在多元社會場景中基于不同生活經歷、價值偏好和視角所形成的豐富、發散且充滿可能性的表達。

為進一步量化不同回答主體的回答在語義空間中的重疊程度，筆者采用核函數估計方法來計算各主體回答分布的重疊比例。首先，筆者排除各主體回答分布中5%特別離散的點，確定其主要分布區域，然后計算兩兩主體間回答的重疊部分占各自主要分布區域的比例，結果見表3。表3右上部分和左下部分分別展示重疊部分占不同主體回答分布的比例，如表中0.908表示ChatGPT與人類回答重疊部分占ChatGPT回答總分布的比例，而0.254則表示該重疊部分占人類用戶回答總分布的比例。表3的結果驗證了上述分析，即四個大語言模型回答的語義分布與人類回答分布重疊程度較低，但大語言模型之間的回答分布重疊度則相對較高。

為進一步分析大語言模型生成內容與人類回答的重疊特征，筆者分別以“知乎”問題回答的平均理性程度、平均點贊量以及問題所屬場景為例，比較大語言模型與人類回答重疊的內容，以及人類回答獨特內容（未被大語言模型回答覆蓋的部分）在上述三個變量上的分布差異。由圖4可見，人類回答獨特內容更多集中在坐標軸兩端，即用戶回答感性或理性程度較高的問題，而大語言模型與人類回答重疊的內容則主要分布于坐標軸中部，即回答中理性或感性傾向較弱。這意味著，大語言模型生成的內容更多覆蓋的是“知乎”用戶回答中立場相對中性的內容，而較少覆蓋具有較強理性或感性色彩的回答。

圖5和圖6進一步展示了兩類內容在“知乎”問題回答的平均點贊量及問題場景兩個變量上的分布情況。由圖5可見，人類回答獨特內容更多集中于回答平均點贊量較低的問題，而大語言模型與人類回答重疊的內容則相對更集中于回答平均點贊量較高的問題。從問題場景的分布差異來看（圖6），人類回答獨特內容在社會問題場景中的比例高于大語言模型與人類重疊的內容。

綜上所述，盡管大語言模型在短時間內生成的回答數量遠超“知乎”平臺用戶回答總量，但從宏觀語義分布來看，大量人類用戶生成的內容并未被大語言模型的回答覆蓋，這部分內容主要集中在具有較高理性程度或較強感性色彩點贊量較少的問題上；相比之下，容易被大語言模型覆蓋的是那些立場相對中性或點贊量較高的回答。從生成機制來看，大語言模型訓練中常用的自注意力機制，傾向于對訓練語料中高頻共現的模式賦予更高權重，這往往對應平臺上的主流表達和立場。在內容輸出方面，這一機制可能會在無形中強化主流話語模式、削弱邊緣和差異化表達，從而導致語義空間呈現集中化分布。此外，當前大語言模型多采用人類反饋的強化學習算法，以使其輸出結果和人類高評價回答對齊。這一方法雖有助于提升回答的精確性和共鳴度，但也使模型在接觸海量平臺資料的同時，逐漸喪失輸出多元化內容的能力。這導致的結果是，大模型生成的內容在語義空間中趨于集中和單一，難以有效覆蓋人類多元化的表達。

考慮到表1和表2所用回歸模型的樣本量較大，為檢驗研究結果的穩健性，本文根據問題的提問年份對數據進行劃分，并分年度重新進行回歸分析。結果顯示，分年度回歸結果與表1和表2的主要發現基本一致。此外，為考察大語言模型溫度參數設置對結果的可能影響，筆者將各大模型溫度設置為0，并按照前述研究設計重新收集數據，再次對人類用戶回答和大模型生成內容進行比較分析。從結果來看，當溫度設置為0時，大語言模型生成內容和人類用戶生成內容之間的差異模式與圖3所示基本一致，與表3中關于語義分布重疊程度的實證結果也基本吻合。

六、結論與討論

人工智能在不同社會場景中的廣泛應用對經典社會化理論的解釋力提出了挑戰。本研究提出“人工智能社會化”這一視角，重點關注大語言模型作為符號學意義上的重要行動者，如何通過在不同場景中生成海量內容，參與“知乎”平臺互動并沖擊平臺內容生態。與傳統社會化理論強調個體學習相對固定的社會規范進而實現社會融入不同，人工智能的社會化主要表現為以多場景內容生成為核心的復雜符號參與機制。

從大語言模型在豐富社會場景中的內容生成實踐來看，大語言模型并非功能固定、“未社會化”的技術客體，其輸出內容在各類場景中均傾向于接近相對主流、具備一定共識的表達。就此而言，大語言模型可被視為數智時代高度社會化的準社會主體。然而，區別于具有不同成長經歷，在社會化過程中形成個體價值觀，進而在網絡平臺中進行討論和爭鳴的人類用戶，大語言模型作為準社會主體在社會互動中存在精確性與機械性并存的特點，其以權威和中立的姿態，將用戶在“知乎”問題中豐富、多元的討論、思辨和爭議壓縮為相對單一視角的輸出結果。大語言模型雖然能精準區分不同場景的差異，但在內容生成過程中，卻會機械地強化性別、年齡等社會角色的刻板印象。

本文嘗試揭示，大語言模型的海量輸出結果如何在宏觀語義層面改變以“知乎”內容為代表的社會符號系統的分布形態，從而將“人工智能如何重塑人類社會”這一命題具體化為可觀測的社會與技術互動過程。從研究結果來看，盡管大語言模型可以靈活模擬不同社會角色并隨時切換視角，但其輸出結果傾向于再現主流表達而壓縮邊緣、多元或感性的視角。換言之，具備靈活模擬能力的大語言模型，反而可能導致社會符號系統的趨同化，削弱其豐富性和多樣性。值得注意的是，這種趨同化并非指向中立的語義中心，而是趨向于那些獲得點贊數量較多、較少帶有情緒色彩的回答。

上述發現表明，大語言模型作為準社會主體可能會帶來深遠的社會影響。其一，在大語言模型沖擊下，平臺內容生態可能會迅速同質化，語言和價值觀的多樣性進而被削弱，這不僅可能會影響人類互動的豐富性，也可能會抑制群體層面的創新能力。其二，大語言模型作為準社會主體對人類自主性有雙重影響：一方面，大語言模型在提升信息獲取效率、擴展認知邊界、促進知識平權等方面具有積極作用；另一方面，當人類過度依賴大模型完成信息搜索、生成等認知任務，從多元互動與深入分析轉向獲取單一視角的快捷回復時，這可能會導致人類認知能力逐漸退化，侵蝕人類自主性并加劇人工智能的可控性難題。其三，從知識生產角度看，當前中文語料在規模等方面仍相對弱于英文，大語言模型傾向于強化主流內容的生成機制可能會進一步放大英文語料及相關視角的中心地位，壓制其他語言與文化視角的表達。因此，如何有效介入人工智能主導的知識生成和符號重組過程，已成為數智時代人工智能治理的重要議題。

不同于將大語言模型僅視為工具來評估其能力或缺陷的研究取向，人工智能社會化視角更關注大語言模型的生成性和實踐性，將其置于具體的互動場景和社會符號生成過程中加以考察（Brey，2005）。該視角揭示出，大語言模型并非被動應答的技術工具，而是通過快速、跨場景的海量內容生成，主動重塑社會符號系統的分布形態，并深刻地影響人類獲取信息、生成內容及參與互動的方式。因此，除關注模型輸出的正確性和偏向外，我們更應持續追蹤不同大語言模型在海量社會場景中的互動實踐，從而深入地理解其對于人機互動模式、社會符號系統的動態塑造，以及對人類自主性的長遠影響。

作為一項探索性研究，本文還存在若干可深化之處。首先，“知乎”平臺數據僅反映該平臺用戶群體的觀點，與全體網民的觀點存在差異，未來研究可進一步比較大語言模型與其他網民之間的內容輸出差異。其次，可納入更多國內外不同類型、不同版本的大語言模型，系統考察其在不同時間、參數設置下的內容生成特征。最后，未來研究還可結合用戶在數字平臺的互動和行為反應數據，分析人類與機器生成內容的互動，從而更全面地理解人工智能社會化的機制及潛在影響。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.