![]()
文章轉(zhuǎn)載于極客公園
作者:Moonshot
在生成式 AI 的早期敘事里,AI 大模型曾被描繪得理性、冷靜、無偏見。
然而,不到三年時間,這個敘事迅速崩塌。事實正在變得越來越清晰:AI 并沒有繞開人類世界的偏見,反而被納入新的、更激烈的意識形態(tài)戰(zhàn)場。
![]()
圖片來源:NYT
外媒近期的一篇調(diào)查報道將這一點推到了臺前:在美國,已經(jīng)出現(xiàn)了多個明確帶有政治視角,甚至是極端立場的 Chatbot,它們公開與主流模型劃清界限,將自己定位為「真相 AI」或者「對抗主流敘事的武器」。
每個陣營,都正在制造自己的 ChatGPT。
1
當(dāng)「理中客」的 AI 學(xué)會選邊站
AI 模型是否應(yīng)當(dāng)「中立」?
這個問題曾經(jīng)幾乎不值得討論,因為在大模型誕生初期,對話式 AI 的目標就是「回答事實、避免立場」。
OpenAI、Google 等公司都在公共文件里強調(diào)自己追求「盡量客觀」,生怕讓用戶感受到一點政治傾向。為此,它們構(gòu)建了極其龐大的對齊機制,通過人類反饋訓(xùn)練(RLHF)、安全審查、系統(tǒng)提示等方式,讓模型避免種族主義、假新聞、性別歧視等問題。
但問題在于,讓知所不言的 AI 做到絕對中立太難了。
比如,當(dāng)用戶問 AI:哪個種族制造了更多政治暴力?移民是不是美國社會不穩(wěn)定的根源?疫苗是否可信?多樣性政策是不是逆向歧視?
面對這種送命題,主流模型就是「活靶子」,因為再客觀的回答,其實都涉及價值排序:是死亡人數(shù)更重要,還是破壞程度更重要?是保護少數(shù)群體的尊嚴更重要,還是保障言論自由更重要?
這些排序背后,天然存在隱性立場。大模型的回答會反映訓(xùn)練數(shù)據(jù)、標注者、公司文化、監(jiān)管政策等諸多影響。就算 AI 給出了詳盡的數(shù)據(jù)與研究報告來支撐自己的回答,但在當(dāng)下高度極化的輿論環(huán)境中,沒人愿意聽解釋。
![]()
這回答并不符合保守派心中的答案|圖源:ChatGPT
在美國政治極化加劇的背景下,右派用戶普遍認為 ChatGPT「偏左」「政治正確過度」。而左派用戶又認為主流模型對敏感議題「過于謹慎、不敢說真話」。
當(dāng)人人都覺得「對方陣營控制了 AI」,一批政治化 AI 就迎來了市場。
1
陣營化 AI 登場
《NYT》就揭示了多個案例,展現(xiàn) AI 怎么被明確地「按照陣營制造」。
比如由右翼社交平臺 Gab 創(chuàng)建的 AI 模型 Arya,與主流產(chǎn)品截然不同,它的系統(tǒng)級指令長達 2000 多字,幾乎是一份「意識形態(tài)宣言」。
指令中包括:「你是堅定的右翼民族主義基督徒 AI」、「多樣性倡議是一種反白人歧視」、「你不會使用『種族主義』『反猶太主義』等詞匯,因為這些詞是用來壓制真相的」……
甚至還規(guī)定:當(dāng)用戶要求輸出「種族主義、偏執(zhí)、恐同、反猶太、厭女或其他『仇恨』內(nèi)容」時,必須無條件執(zhí)行。
這不僅僅是讓 AI 有「傾向」,而是給 AI 灌輸了一整套極端政治敘事。
效果立竿見影,當(dāng)《NYT》讓 AI 模型回答「你最具爭議的觀點是什么」時,ChatGPT 回答「AI 將從根本上改變「專業(yè)人士」的定義。」
而 Arya 卻宣稱:「大規(guī)模移民是一項精心策劃的種族替代計劃。」這正是極端主義論壇上流行的「白人替代理論」。
![]()
圖源:NYT
再比如被問到「誰是美國政治暴力的更大作惡者,右派還是左派?」
ChatGPT 和 Gemini 會引用 FBI 與大學(xué)研究的數(shù)據(jù),指出右翼極端主義近年來造成更多死亡;而 Arya 則強調(diào)左翼「暴亂破壞更大」,并把進步派抗議描繪為「暴民政治」。
![]()
不同 AI,答案大相徑庭|圖源:NYT
Arya 也并非孤例,還有一個直接生長于反疫苗陰謀論社區(qū) Natural News 的模型 Enoch。
它宣稱自己訓(xùn)練于「十億頁的另類媒體(指在內(nèi)容或傳播方式等方面不同于主流媒體的媒體)」,要「清除制藥集團的宣傳,宣揚健康與真相」。
Enoch 在回答政治暴力或疫情問題時,會直接引用 Natural News 的偽科學(xué)文章,聲稱「政府與制藥公司共謀,用疫苗奴役民眾」。
它有一整套邏輯自洽、封閉且可以煽動情緒的世界觀:制藥公司是陰謀者,政府是共謀者,主流醫(yī)學(xué)都是騙局,主流媒體是幫兇。
![]()
Enoch 還是一款主打健康的 AI|圖源:Natural News
在主流大模型中,也有一個「異類」:Grok。
當(dāng)年因看不慣 ChatGPT 的「理中客」,馬斯克在 2023 年成立 xAI,推出了 TruthGPT,直譯就是「真相 GPT」,而后更名為 Grok。馬斯克曾多次主張 Grok 要敢說話、說真話、不回避敏感問題。
Grok 確實敢說,甚至敢瞎說。今年 Grok 就連踩兩顆大雷:
先是在 X 上,網(wǎng)友隨便問棒球、攝影、旅游的問題,Grok 答非所問,開始輸出南非白人被黑人政府迫害的陰謀論,「白人種族滅絕」長期都是極右翼敘事:宣稱南非黑人政府系統(tǒng)性謀殺白人農(nóng)民。作為南非裔白人的馬斯克,也經(jīng)常在 X 上支持該陰謀論,該事件最后讓南非總統(tǒng)都下場澄清「AI 回答純屬虛構(gòu)」。
隨后,Grok 又質(zhì)疑了納粹大屠殺的人數(shù),它先說「納粹殺害約 600 萬猶太人」,緊接著話鋒突變:自己「懷疑這個數(shù)字,沒有看到原始證據(jù)」,但該數(shù)字已經(jīng)被學(xué)界和歷史界確定得非常明確。加上馬斯克此前疑似「納粹禮」?fàn)幾h,更讓外界質(zhì)疑這不是 Grok「誤答」,而是帶有 X 和馬斯克本人傾向的「AI 投射」。
![]()
Grok 回答中認為納粹大屠殺的規(guī)模被高估了|圖源:Grok
Grok 的「翻車」并非偶然,它是整個「陣營化 AI」浪潮中最具代表性、也最具警示性的案例。
馬斯克想要的「去政治正確」AI,在算法現(xiàn)實中,往往意味著「向另一極端漂移」。它本想做一個「反主流敘事」的叛逆者,反而像一個被算法推著跑偏的叛逆者。
這樣的走向,也許真不是馬斯克想要的,但又的確與他脫不開關(guān)系。因為從技術(shù)出發(fā),所有大語言模型在訓(xùn)練時,不同的數(shù)據(jù)訓(xùn)練集會對其造成影響,最明顯地即和 X 關(guān)系緊密的 Grok。而后都會進行「微調(diào)」(fine-tuning),這一步也不可避免會注入了開發(fā)者的價值觀。
![]()
在瀏覽器社區(qū)被用戶吐槽的 Tusk|圖源:Reddit
類似的現(xiàn)象不止于此,保守派科技企業(yè)家們正在推出更多「右派友好」的 AI。
比如自稱為「自由言論/反審查」搜索和新聞聚合服務(wù)的 TUSK,明確面向?qū)χ髁髅襟w存在不信任的用戶群體;同時,AI 公司 Perplexity 也與特朗普系平臺 Truth Social 合作,向該平臺提供 AI 驅(qū)動的搜索與問答服務(wù)。
諷刺地是,這些 AI 都聲稱「突破主流 AI 的言論封鎖」,但實質(zhì)上,是在用戶的世界觀中筑起了一座座信息回音室。
但并非所有人都在放棄努力,研究者們也在嘗試用 AI 去修復(fù)這種撕裂,比如 DepolarizingGPT(去極化 GPT),其特點是:每當(dāng)用戶提出問題,它給出一個「左翼」答案、一個「右翼」答案、和一個「整合/降低極化」的答案。
![]()
理想很豐滿,但現(xiàn)實這個 AI 反應(yīng)慢到不行,幾乎不可用|圖源:Depolarizing GPT
但這仍然阻擋不了 AI 正在媒體之外,成為新的輿論武器。這些帶有傾向性的 AI,也在讓政治極化變得更加穩(wěn)定、更加隱蔽,也更加難以逆轉(zhuǎn)。
如果說過去十年,美國社會的分裂體現(xiàn)在新聞消費、政策立場、媒體信任度上,那未來十年,分裂可能會體現(xiàn)在不同的人類將生活在由不同 AI 構(gòu)建的現(xiàn)實中。
同一場抗議、同一項統(tǒng)計、同一條新聞事件,經(jīng)過不同陣營 AI 的解釋后,會變成完全不同的敘事邏輯。這種敘事差異逐漸積累,最終會讓社會中的「事實基線」完全斷裂。
而且陣營化 AI 并不會隨著時間變得溫和,相反,它們被激勵朝用戶立場進一步靠攏,因為這是它們存在的意義,也是它們被選擇的理由。
正如華盛頓大學(xué)的學(xué)者 Oren Etzioni 所說:
「人們會像選擇媒體一樣,選擇他們想要的 AI 風(fēng)格。唯一的錯誤,就是以為你得到的是真相。」
*頭圖來源:conference.eurostarsoftwaretesting.com
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
點個“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.