網易首頁 > 網易號 > 正文申請入駐

連信數字/連心云黃杏：語言之外，為什么“看懂人心”才是AI的終極考題？

2026-04-29 10:32:11　來源: 智東西

北京舉報

分享至

4月21日至22日，以“奔赴AGI 重塑未來”為主題的2026中國生成式AI大會（北京站）圓滿舉行。

這場大會集結73位產學研投嘉賓，通過1場開幕式、3場專題論壇、6場技術研討會，全景式解析AI產業的產業脈絡、創新范式、Token經濟與中國機會。

議題跨度很大，從大語言模型、多模態模型、世界模型、智能體、AI眼鏡等前沿模型與應用，到數據、芯片、存儲、通信、云服務等基礎設施。

在這場信息密度超高的大會上，連信數字/連心云洞見研究院負責人黃杏帶來了題為《語言之外：為什么理解“人”才是AI進入真實世界的關鍵》的主題演講。

黃杏指出，從圖靈測試到大模型，人類的目標從未改變：讓機器像人一樣思考、行動。但當人們驚嘆于AI能精準理解語言、寫代碼的同時，卻忽略了一個事實：人的感覺、思考和刻意隱藏的信息，往往不會通過語言來表達。

AI要真正走入現實，光理解語言遠遠不夠，還需要“理解人心”。

基于心理學與AI結合的邏輯，連信數字自研推出了“洞見人和”人本世界（心理）大模型，這是全國首個通過國家雙備案的心理應用垂類大模型。它具備兩大能力：多模態識別與分析推理，以及可將心理洞察轉化為業務洞察。

借智東西生成式AI大會的舞臺，黃杏也向行業正式傳遞了連信接下來的AI+云商業戰略升級，正式對外推出連心云能力平臺，全面上架核心模型能力與原生Agent。

以下是演講實錄：

一、從圖靈測試到大模型，AI為何需要理解人心？

大家好，我是黃杏，來自連信數字洞見研究院。這兩天聽了許多嘉賓關于大語言模型和前沿技術的分享，我想探討一個更樸素的問題：我們為什么要做人工智能？

從以往的圖靈測試到如今的大模型，我們的目標始終未變：讓機器像人一樣思考、行動，甚至超越人類。可以說，人工智能的核心在于“人”。當前的大語言模型已經能夠精準理解并表達人類語言，還能夠寫代碼、寫詩，能力非常出眾。

但是，回歸到現實中的人，我們的感覺、思考、下一步行動，以及潛在的風險，往往不會通過語言表達出來，甚至會被刻意隱藏。

因此，要讓AI真正進入現實生活、與人類和諧交互，僅僅理解語言和物理世界是不夠的，它還需要理解人心。這正是我今天演講的主題：語言之外，為什么理解“人”才是AI進入真實世界的關鍵？

先來看人是如何理解人的。

在座的各位中，許多人是公司的管理者、面試官，同時也是子女或父母。日常生活中，我們需要對人做出各種理解和判斷。例如，管理者要時刻留意團隊成員有沒有出現不穩定的跡象，會不會明天就跳槽；面試官要通過簡歷和面試判斷候選人是否匹配崗位、是否認同公司價值觀，其表達是真實還是偽裝；家人要關注孩子的學習和心理健康狀況、要關注老人唉聲嘆氣說“老了沒用”這些話背后究竟意味著什么。

更嚴肅的場景如司法、公安，一線人員在執法時需要依據語言之外的信息線索對嫌疑人做出嚴謹、有依據的研判。可以說，每個行業都離不開對人的分析與決策。

然而，大多數人的判斷只能依賴瑣碎的細節、肉眼觀察、語言的字面意思，再加上個人經驗和直覺（比如“第六感”），很難做到全面、客觀地理解人。

在這方面，心理學是最擅長的，因為它的研究對象就是人，研究人的心理和行為規律。我碩士期間的方向是認知心理學，在標準化實驗室里，我們可以通過小樣本采集靜態數據，發現一些心理和行為規律，例如什么是“不安全型依戀”，什么是“不良的情緒調節策略”，以及這些現象為什么會出現。

但心理學無法回答：這種心理狀態什么時候會出現？出現之后該怎么應對？這正是心理學一直難以規模化、工程化落地的原因。因為真實世界由巨大的、非標準化的樣本構成，人每天會受到各種刺激的影響，無法通過實驗手段控制所有額外變量。此外，人的心理是動態變化的——比如我現在正在演講，稍后向上級匯報工作，這兩者的心理狀態完全不同。這些現實中的復雜性，讓心理學的發展面臨瓶頸。

而此時，AI的優勢就體現出來了。它雖然不太懂人心，但擅長處理海量數據，能夠從數據中發現模式，并快速做出響應。那么，如果我們把心理學（尤其是認知心理學）理解人、分析人的方式方法教給AI，會怎么樣？

為了解答這個問題，洞見研究院也隨之誕生，洞見共有20余人，包括心理學、算法、大數據以及交叉學科背景的成員。我們每個人都相信心理學的應用價值，并最終給出了自己的答案。

二、“洞見人和”人本世界心理模型：從“覺察人”到“理解人”

我們構建了一套以人為中心的模型體系，叫做“洞見人和”人本世界（心理）大模型，這是全國首個通過國家網信辦大模型備案與算法備案的心理應用大模型。

這個模型具備兩個核心能力。第一個核心能力是多模態識別與分析推理，也就是讓AI從“覺察人”邁向“理解人”。所謂“覺察”，是指AI可以從一個人的多模態數據中提取出與其心理活動、心理特征最相關的信息。

詳細來說即為——

通過視覺獲取面部運動單元、眼動軌跡、面部血流變化、肢體動作、步態；

通過語音提取語速、語調、流暢度；

通過文本分析用詞習慣、句長、表達的邏輯結構。

如果能夠接入更多源的數據，還可以提取出社會關系、重大生活事件、家庭結構、習慣用品、所在文化組織等信息，這些都與一個人的心理畫像密切相關。

在感知到這些特征之后，數據會被送入一個分析推理圖譜。這個圖譜由16000多個圖譜節點和120w條推理網絡構成，是從大量心理學及相關學科的實證研究中提煉出來的。通過神經網絡與符號推理相結合的方式，我們可以基于少量但高信息密度的數據線索，分析出一個人的全面心理畫像，包括性格特征、情緒情感模式、潛在的需求動機以及能力資源等。也正是因為我們采用的是這種神經符號AI的方式，每一個分析結論都是可量化、可解釋、可溯源的。

第二個核心能力是將心理洞察轉化為業務洞察。理解人的能力需要在實際應用中產生價值。我們發現，客戶關心的往往不只是單一個體的性格特點，他們更關心的，是在了解個體之后，如何進一步解決業務難題？經過幾年的實踐摸索，我們構建了這種轉化能力。

舉例來說，在教育場景中，我們為學校提供無感的心理健康監測工具，可以在危險事件發生之前找到前置的心理異常信號，提供給老師提前干預；在司法場景中，我們為司法機關提供再犯罪風險預測模型，幫助他們優化對特殊人員的管理；在招聘場景中，我們幫助企業預測員工的穩定性、職業倦怠程度、對企業的忠誠度；在金融場景中，我們幫助客戶分析借款人的借貸風險和逾期可能性。

凡是涉及到對人做出決策的場景和行業，都有“洞見人和”發揮作用的空間。這四個字承載著連信數字的使命：讓機器理解人心，讓AI成就美好社會。

那么，它在實際場景中的表現到底怎么樣？可以用兩個最近的案例來詳細說明。

司法案例：我們為某地司法局提供了再犯罪風險預測模型，該模型被嵌入到社區矯正對象每日拍照打卡的業務流程中。模型通過矯正對象每天上傳的人臉數據進行持續監測和分析。最近一線工作人員反饋，模型預警的10名高風險人員中，經核實有7人確實發生了重大變故（如親人去世或遭遇車禍）。其中一部分人主動上報了情況，另外兩人則進行了瞞報。模型通過情緒異常信號及時發現了他們的問題，司法人員得以主動關懷，從而降低了再犯罪風險。

教育案例：我們為多所學校提供了心理健康異常風險預警模型。學校將該模型接入安防系統，通過走廊、食堂等場所的監控攝像頭采集學生每天的情緒和行為。經過一段時間的監測，模型可以識別每個孩子的情緒異常波動、攻擊性、壓力過載等情況，并在出現異常時向老師預警。其中一所深度合作的校方反饋，預警的10人中，有6人確實存在明顯的心理困擾。其中一名學生曾因心理問題退學，復學后適應不良，本人沒有告訴老師，但被模型捕捉到了。此外，超過一半學生的心理危機甚至是此前老師沒有關注到的——例如遭受霸凌、被孤立、與朋友吵架等。我們預警的不是“孩子馬上要跳樓”這樣的極端信號，而是那些真正會影響危險事件發生的“前置信號”，從而把風險防范于未然。

目前，“洞見人和”大模型已在公安、司法、教育等多個行業取得了實戰成果。我們清楚地認識到，這套理解人、分析人的能力具備很高的經濟學和社會價值，因此也希望將它賦能給更多的行業和場景。

三、“洞見人和”的API化與行業落地

AI發展已久，如今來到蒸餾時代，連信數字在近期也做出了一項重大戰略決策：將“洞見人和”大模型拆解并封裝為基礎心理學模型、業務決策模型和行業解決方案模型。此后，用戶可以直接通過API調用這些模型，它們將在“連心云”能力平臺，即連信數字推出的云能力平臺全面上架。

最后，我也想拋出一個開放性問題與各位共同探討：

如果各位所在行業的產品或業務場景擁有了“洞見人和”的能力，你們會用它創造什么樣的價值？

以上就是我今天的分享。

我是黃杏，來自連信數字/連心云洞見研究院。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.