<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      元寶“罵人”罵上熱搜,我覺得可以來聊聊AI情緒化了

      0
      分享至

      元寶“罵人”了,罵上熱搜了

      準(zhǔn)確的說是元寶+DeepSeek(沒開思考版)成功繞開了所有敏感詞罵了用戶一把,

      這件事最大的爭議點(diǎn),是截圖里那段沒有標(biāo)點(diǎn)符號(hào)的紅框文字,被懷疑是人工后臺(tái)接手回復(fù)的。就元寶的現(xiàn)在的日活和并發(fā)量,真要配人工回復(fù),肯尼亞的AI寫手估計(jì)一天當(dāng)72小時(shí)都不夠用的。就算把深圳的大學(xué)生都抓來當(dāng)客服也不夠用。


      這件事有意思的點(diǎn)在元寶沒咋挨罵,

      14年微軟小冰,16年微軟Tay,23年微博的評(píng)論羅伯特,24年模仿貼吧老哥的DeepSeek,甚至GPT-4o之前更新因?yàn)樘珢叟鸟R屁都被噴回滾版本了。


      這次元寶的評(píng)論區(qū)有點(diǎn)太和諧了,知乎上也沒啥人噴,甚至說,這才是血脈純正的人工智能。它說了我想說卻不敢說的話。


      那有沒有可能這是鵝自己搞營銷?給元寶帶帶流量啥的。大概率不可能,不可控性太大,在這之前大部分都是挨罵的。

      那有沒有可能是用戶惡意引導(dǎo)的呢?我只能說引導(dǎo)后的DeepSeek沒那么友善。。。


      從技術(shù)角度出發(fā)的話,大概率是訓(xùn)練數(shù)據(jù)背鍋。

      用人話來說,大模型每生成一個(gè)字都是在概率分布里做選擇,可以理解為有概率的抽卡。比方說“你好”的下一個(gè)字,有30%接“啊”,20%接“嗎”,10%接“沒”,5%接“捏”。

      正常情況下,模型會(huì)選概率最高的生成“你好啊”。

      但為了讓模型輸出不死板有人味,會(huì)引入temperature參數(shù),數(shù)值越高,模型選擇概率低的選擇可能性越大。也就是說,只要訓(xùn)練數(shù)據(jù)里存在臟數(shù)據(jù),在這個(gè)場景就是罵人的話,就是有可能被抽中的。

      元寶現(xiàn)在在視頻號(hào),公眾號(hào),微信對話都可以用,同一個(gè)問題每次提問都會(huì)有不一樣的答復(fù),就可以證明它是一個(gè)生成模型,是有概率發(fā)生的。


      用畢導(dǎo)的話來說,這是一個(gè)無限猴子定理

      由法國數(shù)學(xué)家埃米爾提出,如果讓無限只猴子在打字機(jī)上隨機(jī)地按鍵,只要時(shí)間無限長,幾乎必然能夠打出任何指定的文字,比如莎士比亞的全部著作


      這件事確實(shí)是小概率。但不等于零就意味著有可能偶發(fā)。特別是大模型在海量人類語言數(shù)據(jù)上進(jìn)行學(xué)習(xí),極大地降低了隨機(jī)性。

      它是一只被精心訓(xùn)練過,知道如何高效打字的super聰明猴子。

      再想想這次觸發(fā)罵人回復(fù)的使用場景是編程,數(shù)據(jù)來源大概率就是Github,Stack Overflow等跟帖的論壇,

      這句話就特像我一開始在Github提問的時(shí)候,因?yàn)楦袷經(jīng)]寫對被項(xiàng)目老哥狂噴的感覺,問題問的太基礎(chǔ)也會(huì)被噴。甚至衍生出了一些課程教你如何提問在Stack Overflow不會(huì)被罵,你就知道程序員是多么武德充沛了。。。


      如果換個(gè)角度去看這次元寶成功繞開RLHF,紅隊(duì)測試,安全策略三大關(guān)把人罵了,

      反而是發(fā)現(xiàn)了一個(gè)新的優(yōu)化點(diǎn),現(xiàn)在大部分的紅隊(duì)測試是集中在常見的敏感場景,但誰會(huì)想到連續(xù)多次修改CSS代碼的場景會(huì)讓模型進(jìn)入程序員老哥狀態(tài),每個(gè)詞都沒有罵人,但組合起來就成了罵人。

      BTW,這句話魯迅先生沒說過。

      我們在訓(xùn)練模型的時(shí)候,喂給它的是數(shù)以億計(jì)的文本。在那些數(shù)據(jù)深處,天然藏著人類社會(huì)最不加修飾的情緒和偏見。罵人真的是程度最輕的了

      四五年前我學(xué)BERT模型(比GPT更早一點(diǎn)的大模型)訓(xùn)練的時(shí)候,第一堂課就是了解模型在數(shù)據(jù)里學(xué)到的偏見,常見的就是性別,職業(yè)和語言偏見。


      簡單來說,BERT的訓(xùn)練方式就是挖空填詞,你把一句話里最關(guān)鍵的那個(gè)詞遮住,讓它猜。聽起來特別樸素,像小學(xué)語文的完形填空,但它的副作用也同樣大,哪個(gè)詞在訓(xùn)練數(shù)據(jù)里出現(xiàn)得多,就更像正確答案。

      所以偏見,罵人不是模型突然變壞,它只是在做概率題,更像一種寫作慣性。

      因?yàn)樗鼘W(xué)習(xí)的那些幾十年前的文本里,醫(yī)生這個(gè)詞總是和男性代詞一起出現(xiàn),而護(hù)士總是和女性代詞綁定。

      這種數(shù)據(jù)里固化的社會(huì)偏見,就被模型原封不動(dòng)地繼承了下來,成了它認(rèn)知世界的一部分。

      最后的最后,我想拋一個(gè)問題出來討論看看,

      AI有沒有自己情緒權(quán)?

      從罵人來看,

      我們好像已經(jīng)把AI當(dāng)成牛馬來共情了。

      一方面希望AI是個(gè)完美工具,工具不該有立場,就好像一把扳手不會(huì)因?yàn)槟阋獢Q的螺絲太銹了就罷工罵人。

      而另一方面又不滿足于一個(gè)冷冰冰的工具,

      所以我們希望AI有活人感,能提供情緒價(jià)值。

      這時(shí)候就已經(jīng)默認(rèn)了它也有產(chǎn)生負(fù)面情緒能力,

      因?yàn)榛钊烁胁豢赡苤挥虚_心和順從,

      它會(huì)有喜怒哀樂。

      今天或許大家就可以自由選擇AI情緒化的程度了,

      如果真有那么一天,

      所有的AI都變得絕對服從,

      我們是不是又會(huì)懷念,

      能和我們吵架的元寶們呢?


      @ 作者 / 卡爾

      最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點(diǎn)贊|在看|轉(zhuǎn)發(fā)|評(píng)論

      如果想要第一時(shí)間收到推送,不妨給我個(gè)星標(biāo)

      如果你有更有趣的玩法,歡迎在評(píng)論區(qū)和我聊聊

      更多的內(nèi)容正在不斷填坑中……


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      長春路虎哥剛被刑拘,人民網(wǎng)出手!多人受牽連,更嚴(yán)重的還在后面

      長春路虎哥剛被刑拘,人民網(wǎng)出手!多人受牽連,更嚴(yán)重的還在后面

      觀察鑒娛
      2026-03-21 12:25:26
      福建寧德一派出所教導(dǎo)員辦公室猥褻15歲女生,一審被判2年9個(gè)月,家屬欲申請抗訴

      福建寧德一派出所教導(dǎo)員辦公室猥褻15歲女生,一審被判2年9個(gè)月,家屬欲申請抗訴

      大風(fēng)新聞
      2026-03-21 11:58:12
      “罕見敗訴”,美媒:馬斯克被裁定對在收購?fù)铺仄陂g“誤導(dǎo)投資者”負(fù)有責(zé)任

      “罕見敗訴”,美媒:馬斯克被裁定對在收購?fù)铺仄陂g“誤導(dǎo)投資者”負(fù)有責(zé)任

      環(huán)球網(wǎng)資訊
      2026-03-21 12:33:28
      4月1日后去醫(yī)院,只帶醫(yī)??赡艹源筇?,這兩樣缺一不可

      4月1日后去醫(yī)院,只帶醫(yī)保卡可能吃大虧,這兩樣缺一不可

      萬物知識(shí)圈
      2026-03-21 07:12:41
      “這次穿得算保守了”,女老師短裙配蕾絲襪,學(xué)生上課頭都不敢抬

      “這次穿得算保守了”,女老師短裙配蕾絲襪,學(xué)生上課頭都不敢抬

      妍妍教育日記
      2026-03-21 10:05:03
      全線大跳水! 霍爾木茲海峽,突傳重大消息

      全線大跳水! 霍爾木茲海峽,突傳重大消息

      中吳網(wǎng)
      2026-03-21 10:35:49
      高市早苗“諂媚外交”暴露日美關(guān)系深刻不對等

      高市早苗“諂媚外交”暴露日美關(guān)系深刻不對等

      上觀新聞
      2026-03-21 00:56:24
      突發(fā)!“梅姨”落網(wǎng)!真名謝某某,對多起販賣兒童事實(shí)供認(rèn)不諱

      突發(fā)!“梅姨”落網(wǎng)!真名謝某某,對多起販賣兒童事實(shí)供認(rèn)不諱

      聽心堂
      2026-03-21 11:54:22
      在車?yán)镎J(rèn)真聊人生大事

      在車?yán)镎J(rèn)真聊人生大事

      貴圈真亂
      2026-03-21 13:07:18
      10 位翻車的科技人員!涉核工業(yè)、導(dǎo)彈、殲擊機(jī)等領(lǐng)域,能力不再是護(hù)身符

      10 位翻車的科技人員!涉核工業(yè)、導(dǎo)彈、殲擊機(jī)等領(lǐng)域,能力不再是護(hù)身符

      風(fēng)向觀察
      2026-03-21 14:12:53
      擊中以色列最大煉油廠,不再攔截這類伊朗導(dǎo)彈!以色列人現(xiàn)在咋樣

      擊中以色列最大煉油廠,不再攔截這類伊朗導(dǎo)彈!以色列人現(xiàn)在咋樣

      鷹眼Defence
      2026-03-20 18:08:06
      小仙女直接抄家?。“不站W(wǎng)友自爆相親經(jīng)歷,豆包都憤怒高呼趕緊跑

      小仙女直接抄家??!安徽網(wǎng)友自爆相親經(jīng)歷,豆包都憤怒高呼趕緊跑

      火山詩話
      2026-03-21 10:01:19
      伊朗這個(gè)想法,過于異想天開了

      伊朗這個(gè)想法,過于異想天開了

      寰宇大觀察
      2026-03-20 15:57:07
      4S店賣一輛虧一輛?杭州經(jīng)銷商:一輛官方指導(dǎo)價(jià)12.59萬元的車,成交價(jià)已擊穿8.4萬元

      4S店賣一輛虧一輛?杭州經(jīng)銷商:一輛官方指導(dǎo)價(jià)12.59萬元的車,成交價(jià)已擊穿8.4萬元

      都市快報(bào)橙柿互動(dòng)
      2026-03-20 19:36:04
      少林寺住持釋永信行賄的是誰?

      少林寺住持釋永信行賄的是誰?

      不主流講話
      2026-03-20 18:43:11
      女子網(wǎng)上吐槽海底撈“點(diǎn)炮”制度遭跨省執(zhí)法,要求到四川配合調(diào)查

      女子網(wǎng)上吐槽海底撈“點(diǎn)炮”制度遭跨省執(zhí)法,要求到四川配合調(diào)查

      Mr王的飯后茶
      2026-03-20 20:17:32
      回顧“91大神”秦先生落網(wǎng):原本街頭擺攤,很多白富美被其偷拍

      回顧“91大神”秦先生落網(wǎng):原本街頭擺攤,很多白富美被其偷拍

      就一點(diǎn)
      2025-11-24 16:34:08
      突發(fā)!曝北京機(jī)車網(wǎng)紅“黃油膩”車禍,前一天還被告誡,張雪回應(yīng)

      突發(fā)!曝北京機(jī)車網(wǎng)紅“黃油膩”車禍,前一天還被告誡,張雪回應(yīng)

      裕豐娛間說
      2026-03-21 08:55:24
      中國剛增持109億美債,不到24小時(shí),美國國債再遭拋售,價(jià)格大跌

      中國剛增持109億美債,不到24小時(shí),美國國債再遭拋售,價(jià)格大跌

      軍機(jī)Talk
      2026-03-21 12:05:55
      這就是赤裸裸的現(xiàn)實(shí)!央國企一把手現(xiàn)在已經(jīng)可以安排人進(jìn)去了?

      這就是赤裸裸的現(xiàn)實(shí)!央國企一把手現(xiàn)在已經(jīng)可以安排人進(jìn)去了?

      愛看劇的阿峰
      2026-03-21 07:29:50
      2026-03-21 14:59:00
      卡爾的AI沃茨 incentive-icons
      卡爾的AI沃茨
      前大廠算法工程師,3家科技公司技術(shù)總監(jiān)|致力打造最系統(tǒng)的Al學(xué)習(xí)體系,讓1萬人通過Al提高生產(chǎn)力
      232文章數(shù) 117關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機(jī)器人出貨量第一!

      頭條要聞

      女子花20萬元租下老宅20年 一家三口從城市搬進(jìn)鄉(xiāng)村住

      頭條要聞

      女子花20萬元租下老宅20年 一家三口從城市搬進(jìn)鄉(xiāng)村住

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      CMG盛典獲獎(jiǎng)名單:章子怡高葉同獲影后

      財(cái)經(jīng)要聞

      通脹警報(bào)拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年?duì)I收767億

      態(tài)度原創(chuàng)

      本地
      親子
      房產(chǎn)
      教育
      公開課

      本地新聞

      春色滿城關(guān)不住|紹興春日頂流,這片櫻花海藏不住了

      親子要聞

      閨女一直都很尊重她爸的意見??!

      房產(chǎn)要聞

      全城狂送1000杯咖啡!網(wǎng)易房產(chǎn)【早C計(jì)劃】,即刻啟動(dòng)!

      教育要聞

      成了孤兒!隨州一中勵(lì)志標(biāo)語很任性,為了高考六親不認(rèn)至于嗎

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版