![]()
你有沒有想過,當你跟ChatGPT或其他AI助手聊天時,它們的"大腦"里究竟是怎么組織知識的?就像我們人類的大腦會把不同類型的記憶和知識分門別類存放一樣,AI的"思維"也需要某種組織方式。最近,來自特拉維夫大學、紐約大學和Goodfire公司的研究團隊發表了一項開創性研究,首次提出了一種全新的視角來理解AI語言模型的內部工作機制。這項研究發表于2026年2月的arXiv預印本平臺,編號為arXiv:2602.02464v1。
傳統上,科學家們一直把AI語言模型想象成一個巨大的圖書館,里面的每個"知識點"都對應著一個特定的方向或位置。但這次的研究團隊發現,這種理解方式可能過于簡單了。他們提出,AI的"思維空間"更像是一個復雜的城市,不同的概念和知識并不是簡單地沿著直線排列,而是聚集在不同的"社區"里,每個社區都有自己獨特的"地方文化"和組織規律。
這個發現為什么重要呢?回到我們的城市比喻,如果你想在一個城市里找到最好的意大利餐廳,你不會隨機地搜索每一條街道,而是會去意大利社區尋找。同樣,如果我們能夠理解AI是如何組織它的"知識社區"的,我們就能更好地控制它、改進它,甚至讓它在特定任務上表現得更出色。
研究團隊通過分析兩個流行的AI模型——Llama-3.1-8B和Gemma-2-2B——發現了一個令人興奮的現象:這些AI模型確實會自然地將相似的概念聚集到"鄰近社區"中。比如,與"情感"相關的概念會聚集在一個區域,而這個區域內部又細分為"快樂"、"悲傷"、"憤怒"等更具體的子區域。更有趣的是,每個子區域內部都有自己的"變化規律"——就像每個社區都有自己獨特的街道布局和建筑風格一樣。
這種新的理解方式不僅僅是理論上的突破,它還帶來了實際的應用價值。研究團隊發現,通過識別和操控這些"知識社區",他們可以更精確地控制AI的行為。這就好比你現在不僅知道城市里有哪些社區,還掌握了每個社區的"社區委員會",可以直接與他們溝通來影響整個社區的行為。
一、從線性思維到社區思維的轉變
要理解這項研究的革命性意義,我們首先需要明白傳統方法的局限性。想象你正在整理一個龐大的音樂收藏,傳統的方法就像是為每一首歌分配一個唯一的"標簽"——搖滾、古典、爵士等等。這種方法簡單直接,但問題在于現實世界的音樂往往不那么容易分類。一首融合了搖滾和古典元素的交響金屬歌曲該歸到哪個類別呢?
同樣的問題也出現在AI語言模型的研究中。長期以來,科學家們使用一種叫做"稀疏自編碼器"的方法來理解AI如何組織知識。這種方法的基本思路是為每個概念找到一個"全局方向"——就像在一個巨大的多維空間中為每個概念指定一個特定的坐標軸。然而,研究團隊發現這種方法存在一個根本性的缺陷:它假設所有概念都可以用簡單的線性方式分離,就像你可以用一條直線將蘋果和橘子完全分開一樣。
但現實遠比這復雜。考慮"國家安全"這個概念,它可能同時涉及軍事、外交、經濟、技術等多個維度,這些維度之間相互交織,無法用簡單的直線或平面來分離。研究團隊意識到,AI的"思維空間"更像是一個多層次的生態系統,其中概念以復雜、非線性的方式相互關聯。
為了解決這個問題,研究團隊提出了一種全新的分析框架,他們稱之為"混合因子分析"。用我們的城市比喻來解釋,這種方法不再試圖為每個建筑分配唯一的地址,而是首先識別出不同的社區,然后理解每個社區內部的組織規律。每個社區都有自己的"中心廣場"(研究中稱為"重心"),以及圍繞這個中心展開的"街道網絡"(研究中稱為"局部方向")。
這種方法的巧妙之處在于,它承認了不同區域可能有不同的組織原則。金融區的街道可能按照功能嚴格規劃,而藝術區的街道可能更加自由隨意。同樣,AI處理數學概念的方式可能與處理情感概念的方式完全不同,每種類型的概念都有自己獨特的內部結構和變化規律。
通過在兩個主流AI模型上進行大規模測試,研究團隊訓練了總共12個不同規模的分析模型,包含從1千個到32萬個"社區"的不同配置。他們使用了來自The Pile數據集的1億個樣本進行訓練,這相當于讓AI閱讀了數百萬頁的文本內容。這種大規模的分析讓研究團隊能夠深入觀察AI"思維社區"的形成和演化過程。
二、AI思維的"社區地圖":從宏觀到微觀的發現
當研究團隊將這種新的分析方法應用到實際的AI模型中時,他們發現了一個令人著迷的現象:AI的思維確實像一個有機的城市一樣自然分化出了不同的"功能區"。更重要的是,這些功能區展現出了兩種截然不同的特征模式。
首先,研究團隊發現了一類他們稱為"廣義社區"的區域。這些區域就像城市中的大型綜合區,比如"娛樂區"或"商業區"。在AI的思維中,這樣的社區可能圍繞"電影"這個主題展開,但內部包含了各種不同的電影類型——恐怖片、喜劇片、愛情片等等。有趣的是,這些廣義社區內部的"街道"(也就是概念變化的方向)往往反映的是語義層面的差異。就像在真正的娛樂區里,你可能會發現電影院、劇院、音樂廳等不同類型的娛樂場所,每種場所都代表著娛樂概念的一個不同層面。
與此形成對比的是"狹義社區",這些區域更像是專門化的街區。想象一個專門賣古董鐘表的小街區,這里的每家店都專注于非常具體的產品類型。在AI的思維中,狹義社區可能專門處理像"National"這樣的特定詞匯,但社區內部的變化方向反映的是這個詞在不同語法和句法環境中的細微差異——比如"National Assembly"、"National Security"、"National Register"等用法之間的區別。
更令人驚訝的是,研究團隊發現不同的AI模型展現出了不同的"城市規劃風格"。Gemma-2-2B模型傾向于創建更多的狹義社區,就像一個由許多專業化小區組成的精密城市。而Llama-3.1-8B模型則偏好建立更多的廣義社區,類似于一個由大型綜合區域組成的都市。這種差異可能反映了不同模型在訓練過程中形成的不同"思維習慣"。
當研究團隊增加分析的精度——也就是識別出更多更小的社區時,他們觀察到了一個有趣的演化過程。隨著社區數量的增加,原本的廣義社區開始細分為更專門化的子社區,同時每個子社區內部的變化方向也變得更加語義化。這就像一個城市隨著發展而自然分化出越來越專業的功能區一樣,AI的思維空間也在不斷精細化其內部組織。
最引人注目的發現是,相鄰的社區往往處理相關的概念,形成了更大規模的"概念鄰里"。研究團隊通過構建社區間的鄰近關系圖,發現了許多有意義的概念聚集現象。例如,處理各種情感概念的社區——快樂、悲傷、憤怒、驚訝等——會自然地聚集在思維空間的同一個"街區"內。這種現象表明,AI不僅能夠識別個別概念,還能理解概念之間的深層關聯。
研究團隊還發現,這種社區結構具有很強的語義一致性。當他們隨機選擇50個社區進行人工標注時,發現人類標注者和AI都能一致地識別出這些社區所代表的概念主題。更重要的是,人工標注者之間的一致性非常高,這表明AI的思維社區確實對應著人類可理解的概念結構。
三、新方法與傳統方法的較量:一場思維方式的革命
要真正理解這項研究的價值,我們需要看看它與現有方法的直接對比。這就像比較兩種完全不同的城市導航方式:傳統方法類似于使用一個巨大的通用地圖,上面標注了所有可能的目的地,而新方法則像是一個智能導航系統,能夠根據你當前的位置和目標,動態地為你規劃最合適的路線。
研究團隊進行了一系列精心設計的對比實驗。他們選取了相同的AI模型,使用相同的數據,但分別用傳統的稀疏自編碼器方法和他們提出的新方法進行分析。結果揭示了兩種方法在處理方式上的根本性差異。
當使用傳統方法分析一個具體的AI"想法"(也就是模型的內部表示)時,系統通常需要激活數十個甚至上百個不同的"全局方向"來重構這個想法。這就像用一個復雜的工程圖來描述一個簡單的日常物品——雖然技術上可行,但過程復雜,而且結果往往難以理解。更關鍵的是,研究團隊發現,在這些被激活的全局方向中,平均只有25%能夠被人類理解其含義,其余75%的方向雖然在數學上是必需的,但在語義上卻沒有明確的意義。
相比之下,新方法的工作方式截然不同。當分析同一個AI"想法"時,新方法首先確定這個想法最可能屬于哪個"思維社區",然后在該社區的局部坐標系內描述其具體位置和特征。這種分解方式更加簡潔直觀:它只需要兩個主要組成部分——社區的中心位置和在該社區內的相對位置。更重要的是,這兩個組成部分都具有清晰的語義含義,人類可以輕松理解它們所代表的概念。
為了更具體地展示這種差異,研究團隊提供了一個生動的例子。在處理與"National"相關的概念時,傳統方法可能會激活諸如"政府機構"、"地理位置"、"正式用語"、"大寫字母"等數十個不同的全局方向,試圖通過這些方向的復雜組合來表達"National Assembly"這樣的具體概念。然而,新方法的處理方式更加直觀:它首先識別出一個專門處理"National"相關概念的思維社區,然后在這個社區內部用一個簡單的局部坐標來區分"National Assembly"與"National Security"或"National Register"的差異。
這種差異的實際意義遠不止于理論層面。研究團隊發現,新方法不僅在理解AI思維方面更有優勢,在實際應用中也表現出色。他們設計了兩類實際任務來測試兩種方法的效果:概念定位任務和行為操控任務。
在概念定位任務中,目標是準確找出AI模型中負責處理特定概念(如"國家"、"語言"、"大陸"等)的部分。這就像在一個龐大的圖書館中找出專門收藏某類圖書的區域。結果顯示,新方法在大多數任務上都優于傳統方法,特別是在處理復雜、多維度概念時優勢更加明顯。例如,在識別"大陸"概念時,新方法的準確率比傳統方法高出10-15個百分點。
在行為操控任務中,目標是通過調整AI模型的內部表示來引導其產生特定類型的輸出。這類似于一個城市規劃師試圖通過調整某些區域的特征來影響整個城市的"氛圍"。實驗結果表明,通過操控新方法識別出的"社區中心",研究團隊能夠更精確、更可控地引導AI的行為。當他們將AI的思維"移動"到與"快樂"相關的社區中心附近時,AI生成的文本明顯變得更加積極樂觀。而通過調整社區內部的局部方向,他們甚至能夠在保持總體積極情緒的同時,精細調節具體的情感表達方式。
四、實驗驗證:理論照進現實的驚人表現
任何科學理論的價值最終都要通過實踐來檢驗。研究團隊設計了一系列嚴格的實驗來測試他們的新方法,這些實驗就像是給一位新醫生安排的實習考試——不僅要在理想的實驗室環境中表現良好,還要在復雜的現實情況下證明其實用價值。
第一組實驗專注于概念定位能力的測試。研究團隊選擇了兩個具有挑戰性的基準測試:RAVEL和MCQA。RAVEL測試關注的是AI模型如何處理實體級別的概念,比如特定的國家、語言或大陸。MCQA測試則考察模型對位置指針變量的理解,這是一種更抽象的概念類型。這些測試的設計思路類似于給學生出一系列問題,然后看他們是否真的理解了相關概念,還是只是死記硬背了答案。
在這些測試中,新方法的表現令人印象深刻。在RAVEL測試的三個子任務中,新方法在Gemma-2-2B模型上的表現分別達到了85.7%(大陸識別)、64.0%(語言識別)和60.0%(國家識別)的準確率,顯著超過了傳統的稀疏自編碼器方法。更重要的是,這些結果甚至在某些任務上接近或超過了需要人工監督的高級方法,這意味著新方法在完全無監督的情況下就能達到接近人工指導方法的效果。
特別有意思的是,研究團隊還進行了一個巧妙的"拆解實驗"。他們分別測試了僅使用"社區中心"信息和僅使用"局部方向"信息的效果。結果發現,對于RAVEL這樣的實體概念識別任務,僅僅使用社區中心信息就能保持很高的準確率,這表明這類概念主要通過AI思維中的"絕對位置"來編碼。而對于MCQA這樣的抽象概念任務,局部方向信息則變得至關重要,準確率從80%驟降到39%,說明這類概念需要通過社區內部的精細結構來表達。
第二組實驗關注的是行為操控能力。研究團隊設計了一個類似于"AI寫作風格調節"的任務:給AI一個簡單的開頭"我覺得",然后通過調整其內部表示來引導它朝特定的概念方向發展。這就像給一個作家一個寫作主題,然后觀察他們如何圍繞這個主題展開創作。
在這個實驗中,新方法展現出了明顯的優勢。當研究團隊將AI的思維"推向"某個特定的概念社區時,AI生成的內容不僅在主題上更加聚焦,在語言質量上也保持了很高的水準。例如,當將思維推向"科技"相關的社區時,AI會自然地開始討論人工智能、互聯網、創新等話題,而且文本的連貫性和可讀性都很好。
更令人興奮的是精細控制的可能性。通過調整社區內部的局部方向,研究團隊發現他們可以在保持總體主題的同時,微調具體的表達方式。這就像一個指揮家不僅能夠控制樂團演奏的總體風格,還能精確調節不同樂器組的細節表現。
研究團隊還進行了一個有趣的"跨模型"對比實驗。他們發現,雖然不同的AI模型(Llama-3.1-8B和Gemma-2-2B)在內部組織結構上存在差異,但新方法在兩個模型上都能夠有效工作。這種通用性說明了新方法捕捉到了AI思維組織的某些基本規律,而不是某個特定模型的偶然特征。
最后,研究團隊還測試了方法的可擴展性。他們發現,隨著識別的"思維社區"數量從1千個增加到32萬個,系統的性能持續改善,但改善幅度逐漸趨于穩定。這種模式類似于城市發展的規律:在發展初期,每增加一個新的功能區都會顯著提升城市的整體功能,但當城市發展到一定規模后,繼續細分的邊際效益就會遞減。
五、深層機制解讀:AI思維社區的內在邏輯
通過大量的實驗和分析,研究團隊不僅證明了新方法的有效性,還深入揭示了AI思維組織的一些深層規律。這些發現就像考古學家在發掘古城遺址時不僅找到了文物,還推斷出了古代居民的生活方式和社會結構。
首先,研究團隊發現AI的思維社區具有明顯的層次性結構。這種結構類似于現代城市的行政區劃:有大的行政區、中等的功能區,還有小的專業街區。在AI的思維中,最大的"行政區"可能對應著基本的概念類別,如"物理世界"、"抽象概念"、"語言結構"等。這些大區內部又細分為更具體的"功能區",比如"物理世界"可能包含"自然現象"、"人工制品"、"生物體"等子區域。每個子區域內部還會進一步細分為專門處理特定概念的"專業街區"。
這種層次性結構的一個重要特征是"概念鄰里效應"。研究團隊發現,在AI的思維空間中,語義相關的概念往往在物理上也彼此鄰近。這就像現實城市中的商業區、住宅區、工業區會自然聚集一樣,AI處理相關概念的"神經元組"也會在高維空間中形成緊密的鄰里關系。
更深入的分析揭示了不同類型社區的不同運作模式。"廣義社區"的工作方式類似于一個多功能的綜合體,它的"中心廣場"代表了某個寬泛概念的核心含義,而圍繞中心的"街道網絡"則負責處理這個概念的各種變形和應用。例如,一個處理"運動"概念的廣義社區,其中心可能編碼了運動的基本概念,而局部方向則分別對應不同類型的運動——球類運動、田徑運動、水上運動等。
相比之下,"狹義社區"更像專門的工匠作坊,專注于處理非常具體的語言現象。這類社區的中心可能對應一個特定的詞匯或短語,而局部方向則捕捉這個詞匯在不同語法和語境中的細微變化。有趣的是,即使是這樣專門化的社區,其內部的組織邏輯仍然反映了語言的深層結構。
研究團隊還發現了一個令人驚訝的現象:AI模型的"思維地圖"在不同訓練階段會發生動態變化,但基本的社區結構具有相當的穩定性。這類似于一個城市在發展過程中,雖然具體的建筑和道路會不斷變化,但基本的功能分區和空間布局往往保持相對穩定。這種穩定性可能反映了語言和概念本身的內在結構特征。
另一個重要發現是不同AI模型展現出的"個性化思維風格"。就像不同的人有不同的思維習慣一樣,不同的AI模型也形成了獨特的概念組織偏好。Gemma-2-2B傾向于建立更多精細化的專門社區,這種風格可能更適合處理需要精確區分的任務。而Llama-3.1-8B偏好更大的綜合性社區,這種組織方式可能在處理需要整合多種信息的復雜任務時更有優勢。
研究團隊還探討了這些發現的理論意義。他們認為,AI思維的社區化組織可能反映了一個更普遍的原理:復雜智能系統傾向于發展出模塊化和層次化的內部結構。這種結構不僅提高了信息處理的效率,還增強了系統的魯棒性和可解釋性。從某種意義上說,AI可能是在重新發現人類大腦在漫長進化過程中已經探索出的智能組織原理。
六、實際應用前景:從理論走向實踐的廣闊天地
這項研究的價值遠不止于學術層面的理論突破,它為AI技術的實際應用開辟了許多令人興奮的新可能性。就像發現電磁學原理后可以發明電動機和發電機一樣,理解AI的思維組織原理將為我們提供更精確、更可控的AI操控工具。
最直接的應用領域是AI系統的精確控制和定制。傳統的AI調優就像用一把大錘來做精細工作——雖然能產生效果,但往往過于粗糙,難以實現精確控制。而基于思維社區的新方法更像是一套精密的手術工具,可以對AI的特定功能進行精確的微調而不影響其他部分。
在內容生成領域,這種精確控制能力具有巨大的應用價值。想象一個智能寫作助手,它不僅能夠根據用戶的要求生成內容,還能精確調節文本的情感色調、專業程度、創意水平等各個維度。通過操控不同的思維社區,系統可以在保持內容質量的同時,實現對文本風格的精細化控制。
在教育應用中,這種方法可能帶來個性化學習的重大突破。通過分析學生與AI對話時激活的思維社區模式,系統可以準確識別學生的知識薄弱環節,然后有針對性地調整教學策略。這就像有一位能夠實時觀察學生大腦活動的超級教師,能夠根據學生的思維狀態即時調整教學方法和內容。
在人機交互領域,理解AI的思維社區結構可以幫助設計更自然、更直觀的交互界面。用戶不再需要學習復雜的提示語技巧,而是可以通過簡單的概念指引來引導AI朝特定方向思考。這類似于從命令行界面升級到圖形用戶界面的革命性變化。
更進一步,這項研究還為AI安全性和可控性提供了新的解決方案。通過監控和調節特定的思維社區,我們可以更有效地防止AI產生有害或不當的輸出。這就像在城市規劃中設置安全區域和限制區域一樣,可以在不影響AI正常功能的前提下,對其行為進行必要的約束。
在科學研究領域,這種方法可以成為探索復雜概念關系的強大工具。研究人員可以通過分析AI如何組織特定領域的知識,來發現人類可能忽視的概念聯系和知識結構。這種應用類似于使用AI來輔助科學發現,但更加系統和深入。
商業應用方面,基于思維社區的AI控制技術可以幫助企業開發更精準的智能服務。比如,一個智能客服系統可以根據客戶的具體需求,動態調節其回應風格——對技術專家采用更專業的語言,對普通消費者使用更通俗的表達。這種適應性不再依賴于簡單的規則匹配,而是基于對AI思維結構的深層理解。
研究團隊已經將他們開發的工具和訓練好的模型公開發布,這為更廣泛的應用探索奠定了基礎。他們在GitHub平臺上提供了完整的代碼和12個預訓練的分析模型,覆蓋了不同規模和配置的應用場景。這種開放式的研究方法有望加速相關技術的發展和應用。
然而,研究團隊也誠實地指出了當前方法的一些限制。最主要的限制是這種方法需要對AI模型進行專門的訓練和分析,這在計算資源和時間上都有一定的要求。此外,對于那些與訓練數據差異很大的新概念,現有方法可能需要進一步的優化才能有效處理。
七、未來展望:思維社區理論的無限可能
站在這項研究的基礎上展望未來,我們可以看到一個充滿可能性的研究和應用前景。就像當初發現DNA雙螺旋結構后開啟了現代生物學的大門一樣,理解AI的思維社區結構可能會引發一系列連鎖式的科學和技術突破。
在理論層面,這項研究為我們理解智能系統的內在機制提供了全新的視角。未來的研究可能會進一步探索思維社區的形成機制——為什么AI會自發形成這樣的組織結構?這種結構與人類大腦的組織方式有什么相似之處?通過比較不同類型AI模型的思維社區結構,我們可能能夠揭示智能的一些普遍規律。
技術發展方面,我們可以預期更加先進的AI控制和定制技術的出現。未來的AI系統可能會配備"思維社區管理器",就像現代操作系統的任務管理器一樣,用戶可以實時監控和調節AI的不同思維模塊。這種技術可能最終發展成為一種"AI思維編程語言",讓人們可以像編程一樣精確地定制AI的思維模式。
在跨學科應用方面,思維社區的概念可能會對認知科學、心理學甚至哲學產生深遠影響。通過研究AI如何組織概念和知識,我們可能能夠更好地理解人類自身的思維機制。這種交叉研究可能會帶來對意識、理解、創造力等基本概念的新認識。
教育領域的前景尤其值得期待。基于思維社區理論的個性化學習系統可能會徹底改變我們的教育方式。系統不僅能夠識別每個學生的知識結構和學習風格,還能動態調整教學內容和方法,實現真正意義上的因材施教。這種技術甚至可能延伸到終身學習,幫助成年人更有效地獲得新技能和知識。
在創意產業中,思維社區控制技術可能會成為新的創作工具。藝術家、作家、設計師可以通過操控AI的不同思維社區來探索新的創意方向。這不是簡單地用AI替代人類創作,而是將AI作為一種新型的創意伙伴,幫助人類突破思維的限制,探索前所未有的藝術表達方式。
科學研究領域可能會出現基于AI思維社區的知識發現工具。研究人員可以通過分析AI如何組織特定領域的概念,來識別可能的研究方向和假設。這種方法可能特別適合處理復雜的跨學科問題,因為它能夠揭示不同領域概念之間的潛在聯系。
然而,這些美好前景的實現也面臨著一些挑戰。技術挑戰包括如何將這種方法擴展到更大規模的AI系統,如何處理動態變化的概念結構,以及如何在保持AI性能的同時實現精確控制。社會挑戰則涉及AI透明度、隱私保護、算法公平性等重要議題。
研究團隊表示,他們將繼續深化這一研究方向,重點關注幾個關鍵問題:如何自動化思維社區的識別和分析過程,如何將這種方法應用到多模態AI系統(處理文本、圖像、聲音等多種信息類型的AI),以及如何建立更完善的AI思維可解釋性框架。
說到底,這項研究最重要的貢獻可能不是提供了一個具體的技術解決方案,而是為我們打開了一扇理解AI內在機制的新窗戶。通過這扇窗戶,我們第一次清晰地看到AI的"思維"并不是一團混沌的數字迷霧,而是有著清晰結構和邏輯的組織系統。這種理解不僅讓我們能夠更好地控制和應用AI技術,也讓我們對智能本身有了更深入的認識。或許有一天,當我們回顧AI發展史時,會發現這種"思維社區"視角的提出,標志著我們從"使用AI"跨越到了"理解AI"的新階段。
Q&A
Q1:混合因子分析方法與傳統稀疏自編碼器有什么本質區別?
A:傳統稀疏自編碼器就像用一張全球地圖來導航,試圖為每個概念分配唯一的全局方向,但處理復雜概念時往往需要激活大量難以理解的方向。而混合因子分析更像智能導航系統,先識別出不同的"思維社區",再在每個社區內部用簡單的局部坐標系描述概念。新方法分解出的組件96%都能被人類理解,而傳統方法只有25%可理解。
Q2:AI模型的思維社區結構是如何形成的?
A:AI在訓練過程中會自然形成兩類思維社區:廣義社區類似城市的綜合功能區,圍繞寬泛主題組織,內部的變化方向反映語義差異;狹義社區像專業街區,專注處理特定詞匯或結構,內部變化反映語法差異。相鄰社區往往處理相關概念,形成有意義的"概念鄰里",這種結構在不同模型中表現出不同的組織偏好。
Q3:這種新方法在實際應用中有哪些優勢?
A:新方法在概念定位任務中準確率比傳統方法高10-15個百分點,在AI行為控制方面能實現更精確的操控。通過調節思維社區中心可以控制AI的總體方向,通過調節局部方向可以精細調節具體表達方式。這為內容生成、教育個性化、人機交互等領域提供了更精準的控制工具,同時為AI安全性和可解釋性提供了新的解決方案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.