<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      元寶“罵人”罵上熱搜,我覺得可以來聊聊AI情緒化了

      0
      分享至

      元寶“罵人”了,罵上熱搜了

      準確的說是元寶+DeepSeek(沒開思考版)成功繞開了所有敏感詞罵了用戶一把,

      這件事最大的爭議點,是截圖里那段沒有標點符號的紅框文字,被懷疑是人工后臺接手回復的。就元寶的現在的日活和并發量,真要配人工回復,肯尼亞的AI寫手估計一天當72小時都不夠用的。就算把深圳的大學生都抓來當客服也不夠用。


      這件事有意思的點在元寶沒咋挨罵,

      14年微軟小冰,16年微軟Tay,23年微博的評論羅伯特,24年模仿貼吧老哥的DeepSeek,甚至GPT-4o之前更新因為太愛拍馬屁都被噴回滾版本了。


      這次元寶的評論區有點太和諧了,知乎上也沒啥人噴,甚至說,這才是血脈純正的人工智能。它說了我想說卻不敢說的話。


      那有沒有可能這是鵝自己搞營銷?給元寶帶帶流量啥的。大概率不可能,不可控性太大,在這之前大部分都是挨罵的。

      那有沒有可能是用戶惡意引導的呢?我只能說引導后的DeepSeek沒那么友善。。。


      從技術角度出發的話,大概率是訓練數據背鍋。

      用人話來說,大模型每生成一個字都是在概率分布里做選擇,可以理解為有概率的抽卡。比方說“你好”的下一個字,有30%接“啊”,20%接“嗎”,10%接“沒”,5%接“捏”。

      正常情況下,模型會選概率最高的生成“你好啊”。

      但為了讓模型輸出不死板有人味,會引入temperature參數,數值越高,模型選擇概率低的選擇可能性越大。也就是說,只要訓練數據里存在臟數據,在這個場景就是罵人的話,就是有可能被抽中的。

      元寶現在在視頻號,公眾號,微信對話都可以用,同一個問題每次提問都會有不一樣的答復,就可以證明它是一個生成模型,是有概率發生的。


      用畢導的話來說,這是一個無限猴子定理

      由法國數學家埃米爾提出,如果讓無限只猴子在打字機上隨機地按鍵,只要時間無限長,幾乎必然能夠打出任何指定的文字,比如莎士比亞的全部著作


      這件事確實是小概率。但不等于零就意味著有可能偶發。特別是大模型在海量人類語言數據上進行學習,極大地降低了隨機性。

      它是一只被精心訓練過,知道如何高效打字的super聰明猴子。

      再想想這次觸發罵人回復的使用場景是編程,數據來源大概率就是Github,Stack Overflow等跟帖的論壇,

      這句話就特像我一開始在Github提問的時候,因為格式沒寫對被項目老哥狂噴的感覺,問題問的太基礎也會被噴。甚至衍生出了一些課程教你如何提問在Stack Overflow不會被罵,你就知道程序員是多么武德充沛了。。。


      如果換個角度去看這次元寶成功繞開RLHF,紅隊測試,安全策略三大關把人罵了,

      反而是發現了一個新的優化點,現在大部分的紅隊測試是集中在常見的敏感場景,但誰會想到連續多次修改CSS代碼的場景會讓模型進入程序員老哥狀態,每個詞都沒有罵人,但組合起來就成了罵人。

      BTW,這句話魯迅先生沒說過。

      我們在訓練模型的時候,喂給它的是數以億計的文本。在那些數據深處,天然藏著人類社會最不加修飾的情緒和偏見。罵人真的是程度最輕的了

      四五年前我學BERT模型(比GPT更早一點的大模型)訓練的時候,第一堂課就是了解模型在數據里學到的偏見,常見的就是性別,職業和語言偏見。


      簡單來說,BERT的訓練方式就是挖空填詞,你把一句話里最關鍵的那個詞遮住,讓它猜。聽起來特別樸素,像小學語文的完形填空,但它的副作用也同樣大,哪個詞在訓練數據里出現得多,就更像正確答案。

      所以偏見,罵人不是模型突然變壞,它只是在做概率題,更像一種寫作慣性。

      因為它學習的那些幾十年前的文本里,醫生這個詞總是和男性代詞一起出現,而護士總是和女性代詞綁定。

      這種數據里固化的社會偏見,就被模型原封不動地繼承了下來,成了它認知世界的一部分。

      最后的最后,我想拋一個問題出來討論看看,

      AI有沒有自己情緒

      從罵人來看,

      我們好像已經把AI當成牛馬來共情了。

      一方面希望AI是個完美工具,工具不該有立場,就好像一把扳手不會因為你要擰的螺絲太銹了就罷工罵人。

      而另一方面又不滿足于一個冷冰冰的工具,

      所以我們希望AI有活人感,能提供情緒價值。

      這時候就已經默認了它也有產生負面情緒能力,

      因為活人感不可能只有開心和順從,

      它會有喜怒哀樂。

      今天或許大家就可以自由選擇AI情緒化的程度了,

      如果真有那么一天,

      所有的AI都變得絕對服從,

      我們是不是又會懷念,

      能和我們吵架的元寶們呢?


      @ 作者 / 卡爾

      最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論

      如果想要第一時間收到推送,不妨給我個星標

      如果你有更有趣的玩法,歡迎在評論區和我聊聊

      更多的內容正在不斷填坑中……


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      上海鏈家員工申請勞動仲裁討要社保公積金 庭后4小時被辭退

      上海鏈家員工申請勞動仲裁討要社保公積金 庭后4小時被辭退

      信網
      2026-01-26 15:04:28
      貨輪沉了,沒人說是軍演惹的禍,可鎳礦濕了真會要命

      貨輪沉了,沒人說是軍演惹的禍,可鎳礦濕了真會要命

      解鎖世界風云
      2026-01-26 01:05:33
      68歲《小鬼當家》主演丹尼爾·斯特恩,酒店內招嫖當場被警方發現

      68歲《小鬼當家》主演丹尼爾·斯特恩,酒店內招嫖當場被警方發現

      星野娛樂天地
      2026-01-10 19:34:12
      居民樓出現一條50米長裂縫,“里面結構都露出來了” 業主認為與底層商鋪煙管爆炸有關

      居民樓出現一條50米長裂縫,“里面結構都露出來了” 業主認為與底層商鋪煙管爆炸有關

      大風新聞
      2026-01-26 10:54:04
      簡直不敢相信,莫言竟將日本侵華戰爭比作“兄弟爭奪家產”

      簡直不敢相信,莫言竟將日本侵華戰爭比作“兄弟爭奪家產”

      雪中風車
      2026-01-18 17:08:39
      李昊:看到球迷接機很激動!沒什么雖敗猶榮,決賽輸了就是輸了

      李昊:看到球迷接機很激動!沒什么雖敗猶榮,決賽輸了就是輸了

      奧拜爾
      2026-01-26 15:45:53
      回旋鏢扎自己身上是啥體驗?網友:有仇當天就報,心情爽極了

      回旋鏢扎自己身上是啥體驗?網友:有仇當天就報,心情爽極了

      帶你感受人間冷暖
      2026-01-26 00:05:20
      最高法:保持對失信行為的高壓態勢,2025年追究拒不執行判決、裁定罪4461人

      最高法:保持對失信行為的高壓態勢,2025年追究拒不執行判決、裁定罪4461人

      中國日報網
      2026-01-26 11:57:04
      2025年河南各市GDP(截止1月26日)

      2025年河南各市GDP(截止1月26日)

      天命生商
      2026-01-26 22:24:14
      比緬北更恐怖!曾經的旅游勝地,如今黃賭毒俱全,性交易隨處可見

      比緬北更恐怖!曾經的旅游勝地,如今黃賭毒俱全,性交易隨處可見

      來科點譜
      2025-10-24 09:25:32
      他28歲跳樓身亡,離開前頂樓徘徊3小時,留17字感人遺言告別人間

      他28歲跳樓身亡,離開前頂樓徘徊3小時,留17字感人遺言告別人間

      米果說識
      2026-01-26 22:53:12
      上海這天,熊黛林雙腿驚艷,杜若溪臉腫唇厚,保劍鋒成最大爭議

      上海這天,熊黛林雙腿驚艷,杜若溪臉腫唇厚,保劍鋒成最大爭議

      冷紫葉
      2026-01-26 15:07:13
      德央行行長鼓吹給中國“劃紅線”,專家:“既想合作又要防范”,歐洲心態復雜

      德央行行長鼓吹給中國“劃紅線”,專家:“既想合作又要防范”,歐洲心態復雜

      環球網資訊
      2026-01-27 06:46:05
      央視八套今晚播!這部壓了7年的劇我覺得能火

      央視八套今晚播!這部壓了7年的劇我覺得能火

      鄉野小珥
      2026-01-27 03:42:22
      1951 年上海灘,陳毅給黃金榮一把掃帚,蔣介石贊:這條計策厲害

      1951 年上海灘,陳毅給黃金榮一把掃帚,蔣介石贊:這條計策厲害

      嘮叨說歷史
      2026-01-26 15:48:01
      冬天買帶魚:切記分清黑眼和黃眼,差別很大,建議弄懂再買不會錯

      冬天買帶魚:切記分清黑眼和黃眼,差別很大,建議弄懂再買不會錯

      椰青美食分享
      2026-01-26 11:48:41
      90后游資頂流“陳小群”,被媒體扒了:如何借互聯網收割散戶!

      90后游資頂流“陳小群”,被媒體扒了:如何借互聯網收割散戶!

      財通社
      2026-01-26 20:14:42
      因年齡原因,云南省委常委、省紀委書記馮志禮辭去省監委主任

      因年齡原因,云南省委常委、省紀委書記馮志禮辭去省監委主任

      澎湃新聞
      2026-01-26 18:47:07
      聶衛平愛女發文曝光離世真相!早年縱欲過度的他,被拖垮了身體

      聶衛平愛女發文曝光離世真相!早年縱欲過度的他,被拖垮了身體

      老范談史
      2026-01-21 18:25:21
      田家慌了!全網復刻田氏藝術,85歲雕塑家的遮羞布藏不住了

      田家慌了!全網復刻田氏藝術,85歲雕塑家的遮羞布藏不住了

      離離言幾許
      2026-01-26 12:26:16
      2026-01-27 07:44:49
      卡爾的AI沃茨 incentive-icons
      卡爾的AI沃茨
      前大廠算法工程師,3家科技公司技術總監|致力打造最系統的Al學習體系,讓1萬人通過Al提高生產力
      199文章數 84關注度
      往期回顧 全部

      科技要聞

      理想開始關店“過冬”,否認“百家”規模

      頭條要聞

      上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

      頭條要聞

      上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

      體育要聞

      叛逆的大公子,要砸了貝克漢姆這塊招牌

      娛樂要聞

      張雨綺被抵制成功!遼視春晚已將她除名

      財經要聞

      從美式斬殺線看中國社會的制度韌性構建

      汽車要聞

      賓利第四臺Batur敞篷版發布 解鎖四項定制創新

      態度原創

      家居
      時尚
      親子
      游戲
      本地

      家居要聞

      流韻雅居,讓復雜變純粹

      甜了10年,超多曖昧細節,全網求他倆原地結婚

      親子要聞

      網友:這階段屬于純陽之體

      魔獸世界:時光服再次調整,熔火之心迎來削弱,玩家該如何選擇?

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      無障礙瀏覽 進入關懷版