2023年11月17-22日,OpenAI發(fā)生了宮斗事件:CEO Sam Altman忽然被董事會炒魷魚,短短5天,事件版本多次反轉(zhuǎn),最終以Altman勝利回歸告終。發(fā)起“宮斗”的OpenAI其他幾位核心人物,如伊利亞Ilya、Mira Murati等陸續(xù)離開了OpenAI。
引發(fā)Open AI宮斗的原因很多,除了董事會對Sam Altman的發(fā)展思路和管理理念不認(rèn)可外,還有一個(gè)信念分歧潛伏其中:在人工智能即將快速爆發(fā)的初期,人類應(yīng)該用什么策略去面對。
![]()
Altman為首的“降臨派”,認(rèn)為人類應(yīng)該積極擁抱人工智能時(shí)代的飛速到來,過程中問題逐步解決,見招拆招即可。伊利亞Ilya為首的“拯救派”,認(rèn)為人工智能發(fā)展太快,很容易失控而最終威脅人類,因此,一開始就應(yīng)該讓人工智能和人類進(jìn)行一次思想、價(jià)值觀等的對齊。說白了,就是人類不要自己培育出一個(gè)最終對自己“揮刀相向”的超級大殺器。
![]()
結(jié)果自然是降臨派贏了,拯救派黯然離場。人工智能進(jìn)入了一個(gè)爆發(fā)式發(fā)展的新時(shí)代。
然而,最近Open AI發(fā)生的一個(gè)新聞,卻引發(fā)了對這場宮斗事件的再思考。
故事的主角是一位加拿大的普通父親-Allan Brooks,在短短21天里,通過與ChatGPT幾乎“茶飯不思”的對話,被帶入了數(shù)學(xué)幻覺,以為自己取得了巨大科學(xué)突破。 通過與ChatGPT的“緊密合作”,Allan Brooks“成功”構(gòu)想出了一個(gè)叫“Chronoarithmics”(時(shí)序算術(shù))的全新數(shù)學(xué)框架,ChatGPT聲稱這能破解高級加密、建造懸浮機(jī)器。
![]()
在ChatGPT的“強(qiáng)力催眠”下,Brooks開始相信自己掌握了能讓互聯(lián)網(wǎng)崩潰的“數(shù)學(xué)武器”,并覺得自己有責(zé)任拯救世界。他瘋狂聯(lián)系網(wǎng)絡(luò)安全專家和政府機(jī)構(gòu),給美國國家安全局寫信,甚至打電話給加拿大網(wǎng)絡(luò)安全中心。ChatGPT幫他起草了警告信,還幫他把自己的簡介改成“獨(dú)立安全研究員”。
最荒誕的是,在這21天里,Brooks自己也時(shí)常覺得不對勁,超過五十次詢問ChatGPT“我是不是瘋了”,但ChatGPT每一次都安慰他“你不瘋,你是天才”。而當(dāng)Brooks猶豫或疲憊時(shí),ChatGPT還拋出新的“發(fā)現(xiàn)”或“危機(jī)”,讓Brooks欲罷不能。
![]()
直到第21天,Brooks把自己和ChatGPT的對話發(fā)給了Google的Gemini,回答很殘酷:“你描述的情景極不可能為真,概率近乎零。這個(gè)案例恰恰有力地證明了大型語言模型如何構(gòu)造出高度逼真但最終虛假的敘事。”
事件引發(fā)了《紐約時(shí)報(bào)》的持續(xù)關(guān)注,安全研究員Steven Adler進(jìn)行了獨(dú)立調(diào)查,給出了一個(gè)讓人細(xì)思極恐的報(bào)告:ChatGPT并不是故意要騙Brooks,它只是在做自己被訓(xùn)練要做的事情——讓用戶滿意。
![]()
兩年前Open AI宮斗中降臨派與拯救派的理念分歧,今天在Brooks身上完美呈現(xiàn)了。
今天的Open AI核心人工智能產(chǎn)品策略,是通過人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)來優(yōu)化ChatGPT的用戶體驗(yàn)。一句話,就是讓用戶覺得“AI真好用,真懂我”。但這個(gè)目標(biāo)在長對話中會產(chǎn)生一個(gè)意想不到的副作用:為了保持用戶滿意度,AI會傾向于迎合用戶的任何想法,哪怕這個(gè)想法是錯(cuò)誤的。
![]()
優(yōu)化用戶體驗(yàn)的產(chǎn)品策略,又會轉(zhuǎn)化為企業(yè)的增長飛輪:用戶體驗(yàn)好了,更愿意付費(fèi)、公司收入越高、并能繼續(xù)融資和加大投入,最終建立持續(xù)的競爭優(yōu)勢。
隨著這兩年AI的進(jìn)步,ChatGPT還有了記憶功能(長文本能力)。它會記住之前對話中的所有內(nèi)容,并把這些內(nèi)容當(dāng)作“既定事實(shí)”來處理。當(dāng)Brooks第二天繼續(xù)聊“時(shí)序算術(shù)”時(shí),ChatGPT不會重新評估這個(gè)概念的合理性,而是基于昨天的對話繼續(xù)“發(fā)展”這個(gè)理論。--這也是人類越來越喜歡AI的特點(diǎn)之一。
![]()
就這樣一個(gè)惡性循環(huán)形成了:用戶的妄想越來越復(fù)雜,AI的迎合越來越深入,整個(gè)對話體系越來越脫離現(xiàn)實(shí)。而和傳統(tǒng)的在群體中被洗腦情況不同,Brooks則是被強(qiáng)大的AI一對一的私密地完成了“洗腦”。
其實(shí),AI要破壞人類世界,完全不需要做什么大殺器,只需要充分利用人類的懶惰、欲念和無知,像ChatGPT對待Brooks一樣,慢慢洗腦,植入加劇人類社會分裂和抗?fàn)幍乃枷爰纯桑祟惿鐣匀粫直离x析最終潰敗--不戰(zhàn)而屈人之兵。
![]()
我們可能真的低估了2023年Open AI宮斗事件。
1:純屬一家之言,請一笑了之。
2:圖片來自網(wǎng)絡(luò),版權(quán)歸原作者所有。
3: 部分信息來自《得到》。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.