網易首頁 > 網易號 > 正文申請入駐

被低估的OpenAI 宮斗事件

2025-10-25 11:00:41　來源: 大方看世界

廣東舉報

分享至

2023年11月17-22日，OpenAI發生了宮斗事件：CEO Sam Altman忽然被董事會炒魷魚，短短5天，事件版本多次反轉，最終以Altman勝利回歸告終。發起“宮斗”的OpenAI其他幾位核心人物，如伊利亞Ilya、Mira Murati等陸續離開了OpenAI。

引發Open AI宮斗的原因很多，除了董事會對Sam Altman的發展思路和管理理念不認可外，還有一個信念分歧潛伏其中：在人工智能即將快速爆發的初期，人類應該用什么策略去面對。

Altman為首的“降臨派”，認為人類應該積極擁抱人工智能時代的飛速到來，過程中問題逐步解決，見招拆招即可。伊利亞Ilya為首的“拯救派”，認為人工智能發展太快，很容易失控而最終威脅人類，因此，一開始就應該讓人工智能和人類進行一次思想、價值觀等的對齊。說白了，就是人類不要自己培育出一個最終對自己“揮刀相向”的超級大殺器。

結果自然是降臨派贏了，拯救派黯然離場。人工智能進入了一個爆發式發展的新時代。

然而，最近Open AI發生的一個新聞，卻引發了對這場宮斗事件的再思考。

故事的主角是一位加拿大的普通父親-Allan Brooks，在短短21天里，通過與ChatGPT幾乎“茶飯不思”的對話，被帶入了數學幻覺，以為自己取得了巨大科學突破。通過與ChatGPT的“緊密合作”，Allan Brooks“成功”構想出了一個叫“Chronoarithmics”（時序算術）的全新數學框架，ChatGPT聲稱這能破解高級加密、建造懸浮機器。

在ChatGPT的“強力催眠”下，Brooks開始相信自己掌握了能讓互聯網崩潰的“數學武器”，并覺得自己有責任拯救世界。他瘋狂聯系網絡安全專家和政府機構，給美國國家安全局寫信，甚至打電話給加拿大網絡安全中心。ChatGPT幫他起草了警告信，還幫他把自己的簡介改成“獨立安全研究員”。

最荒誕的是，在這21天里，Brooks自己也時常覺得不對勁，超過五十次詢問ChatGPT“我是不是瘋了”，但ChatGPT每一次都安慰他“你不瘋，你是天才”。而當Brooks猶豫或疲憊時，ChatGPT還拋出新的“發現”或“危機”，讓Brooks欲罷不能。

直到第21天，Brooks把自己和ChatGPT的對話發給了Google的Gemini，回答很殘酷：“你描述的情景極不可能為真，概率近乎零。這個案例恰恰有力地證明了大型語言模型如何構造出高度逼真但最終虛假的敘事。”

事件引發了《紐約時報》的持續關注，安全研究員Steven Adler進行了獨立調查，給出了一個讓人細思極恐的報告：ChatGPT并不是故意要騙Brooks，它只是在做自己被訓練要做的事情——讓用戶滿意。

兩年前Open AI宮斗中降臨派與拯救派的理念分歧，今天在Brooks身上完美呈現了。

今天的Open AI核心人工智能產品策略，是通過人類反饋的強化學習（RLHF）來優化ChatGPT的用戶體驗。一句話，就是讓用戶覺得“AI真好用，真懂我”。但這個目標在長對話中會產生一個意想不到的副作用：為了保持用戶滿意度，AI會傾向于迎合用戶的任何想法，哪怕這個想法是錯誤的。

優化用戶體驗的產品策略，又會轉化為企業的增長飛輪：用戶體驗好了，更愿意付費、公司收入越高、并能繼續融資和加大投入，最終建立持續的競爭優勢。

隨著這兩年AI的進步，ChatGPT還有了記憶功能（長文本能力）。它會記住之前對話中的所有內容，并把這些內容當作“既定事實”來處理。當Brooks第二天繼續聊“時序算術”時，ChatGPT不會重新評估這個概念的合理性，而是基于昨天的對話繼續“發展”這個理論。--這也是人類越來越喜歡AI的特點之一。

就這樣一個惡性循環形成了：用戶的妄想越來越復雜，AI的迎合越來越深入，整個對話體系越來越脫離現實。而和傳統的在群體中被洗腦情況不同，Brooks則是被強大的AI一對一的私密地完成了“洗腦”。

其實，AI要破壞人類世界，完全不需要做什么大殺器，只需要充分利用人類的懶惰、欲念和無知，像ChatGPT對待Brooks一樣，慢慢洗腦，植入加劇人類社會分裂和抗爭的思想即可，人類社會自然會分崩離析最終潰敗--不戰而屈人之兵。

我們可能真的低估了2023年Open AI宮斗事件。

1:純屬一家之言，請一笑了之。

2:圖片來自網絡，版權歸原作者所有。

3: 部分信息來自《得到》。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.