![]()
全球人民翹首以盼,終于在上個(gè)周末,把小紅書的翻譯功能盼來了!
![]()
一些打開方式和須知如下:
升級(jí)到最新版本
嘗試修改自己的語言設(shè)置,包括小紅書設(shè)置和手機(jī)系統(tǒng)設(shè)置
目前只支持單一語言的翻譯,如果是中英夾雜,或者帶有表情包,不能成功觸發(fā)
還是沒反應(yīng)的話,有網(wǎng)友提出了「殺后臺(tái)大法」:評(píng)論區(qū)任意發(fā)一句英文,然后退出后臺(tái),再重新打開小紅書,就會(huì)出現(xiàn)翻譯功能
![]()
本文截圖來自小紅書用戶,用戶名如圖所示,下同
太快了,小紅書你有手速這么快的程序員進(jìn)入公司,tt 用戶表示,從來沒見過速度這么快的更新,這就是傳說中的中國速度嗎?
![]()
全世界人民都很開心,除了有道詞典。
![]()
雖然短短一周時(shí)間就上線,但翻譯的表現(xiàn)出奇的好,這下跨國沖浪簡直如有神助。
![]()
什么 u1s1 啦,yyds 啦,cpdd 啦,這些基于拼音的縮寫全都能準(zhǔn)確領(lǐng)悟,并且標(biāo)注出來。

有一說一,隔壁同事表示她都不知道 cpdd 是什么意思——人類不如 GPT 的又一鐵證。
![]()
小紅書你到底是在做翻譯還是在做梗百科!
這一波的額外效果是,順便把方言也給翻譯了。
![]()
甚至如果原文中有錯(cuò)誤,不僅不會(huì)影響翻譯,小紅書還會(huì)貼心注解好。
![]()
你是真的為了我學(xué)英語在考慮,淚目。
很明顯,這次小紅書翻譯功能的背后有著 大語言模型的支持,網(wǎng)友們迫不及待地開始了對(duì)背后模型的調(diào)戲。
比如先淺淺做個(gè)翻譯,然后寫幾行詩。

還有淺淺做個(gè)翻譯之后,總結(jié)一下今天的新聞。

甚至還有打出一串摩斯電碼讓它翻譯的——這里是小紅書,不是《風(fēng)聲》啊。

單方面宣布:現(xiàn)在最強(qiáng)的多功能翻譯軟件是小紅書。
大語言模型處理翻譯任務(wù),雖然已經(jīng)很好使了,但是落在小紅書這樣內(nèi)容無比豐富的社交平臺(tái)上,還是有很多挑戰(zhàn)。
語言的多樣性就是最具有挑戰(zhàn)性的。一些文化特定的術(shù)語、習(xí)慣表達(dá)或比喻,如成語、俚語,難以準(zhǔn)確翻譯。
還有一些人名、昵稱,模型可能無法很好地區(qū)分哪些詞需要翻譯,哪些詞需要保留。
比如這里的「orange man」直接譯成了「橙人」,其實(shí)這里指的是特朗普。

在準(zhǔn)確性之外,普通用戶比較難感知到的是翻譯所需要的計(jì)算資源。
在小紅書這樣內(nèi)容非常豐富的平臺(tái)上,用戶可能只發(fā)幾個(gè)字母,也可能長至幾百字的筆記。相比之下,長內(nèi)容的翻譯會(huì)占用更多資源,增加系統(tǒng)負(fù)載。
同時(shí),各個(gè)國家的用戶都進(jìn)駐之后,時(shí)區(qū)分布廣泛,導(dǎo)致系統(tǒng)幾乎沒有低負(fù)載時(shí)間。
等到兩邊都睡醒了,短短的時(shí)區(qū)重合區(qū)間內(nèi),翻譯請(qǐng)求量可能瞬間激增,系統(tǒng)需要在短時(shí)間內(nèi)處理大量并發(fā)請(qǐng)求,對(duì)并發(fā)處理能力是很大的考驗(yàn)。
預(yù)判未來,小紅書這波在大氣層
現(xiàn)在還沒有準(zhǔn)確的消息指出新的翻譯功能背后,到底調(diào)用的是什么模型。在一些網(wǎng)友的「逼問」之下,似乎是 GPT。

還有的網(wǎng)友「逼問」出來是智譜。
![]()
拋開幻覺不談,考 慮到成本問題,還真不好說用的是什么。 GPT 參數(shù)量大,計(jì)算成本高,不適合部署在資源受限的環(huán)境中。
比較可行的一種策略,是選擇一個(gè)學(xué)生模型,并把 GPT 作為教師模型進(jìn)行 蒸餾。學(xué)生模型通常參數(shù)量更少,推理速度更快,但盡量保留教師模型的能力。
正好,這種路線對(duì)于小紅書而言,或許更有把握。
小紅書對(duì)大語言模型、多模態(tài)等 AI 技術(shù)的探索,早就開始了,只是一直側(cè)重于算法優(yōu)化。曾經(jīng)也做過一些小小的 AI 功能,我們之前寫過不少。
很少人知道的是,在 2024 年年初的 AAAI 上,小紅書的搜索算法團(tuán)隊(duì),就針對(duì)大模型蒸餾提出過一個(gè)新思路。
![]()
這是一個(gè)全新框架, 在蒸餾大模型推理能力的過程中充分利用負(fù)樣本知識(shí)。
「負(fù)樣本」是一個(gè)很有趣的概念。傳統(tǒng)蒸餾一般只關(guān)注正樣本,這并不難理解:老師教學(xué)生,肯定是教正確的解題方式,讓學(xué)生去理解和模仿。
不過,大家上學(xué)時(shí)肯定也有做過「錯(cuò)題集」,把自己犯過的錯(cuò)、掌握得不夠牢的地方記錄下來。 這些錯(cuò)題就是「負(fù)樣本」,在小紅書的評(píng)論區(qū),那些不夠準(zhǔn)確的翻譯,就是負(fù)樣本。
比如下面這個(gè)「fair point」,是在翻譯功能上線之前,這個(gè)譯文就太機(jī)翻了。在這個(gè)評(píng)論區(qū)里,翻譯成「有道理」更合適。
![]()
就像「錯(cuò)題」里也包含著重要的信息一樣, 「負(fù)樣本」能夠幫助學(xué)生模型識(shí)別哪些預(yù)測是不正確的,增強(qiáng)其辨別能力、提升對(duì)困難樣本的處理,同時(shí)能夠在復(fù)雜的語言表達(dá)中,保持一致性。
打個(gè)比方,現(xiàn)在你想要和外國友人們?cè)u(píng)論區(qū)對(duì)線——啊不,對(duì)賬——一些理財(cái)相關(guān)的詞語可能會(huì)出現(xiàn)。
![]()
比如銀行 bank 這個(gè)詞可能會(huì)經(jīng)常出現(xiàn),但它還有別的意思:「河床」,同時(shí)它還可以作為動(dòng)詞使用。
通過負(fù)樣本學(xué)習(xí),就是在訓(xùn)練模型識(shí)別多義表達(dá),校正翻譯邏輯,生成更自然的內(nèi)容。
負(fù)樣本的優(yōu)勢還體現(xiàn)在對(duì)小語種的支持。要知道,這次不只是美國用戶,還有全球各個(gè)地方的用戶都涌上來:塞爾維亞、秘魯,澳洲某些地區(qū)的原住民。

通過利用負(fù)樣本(包括翻譯錯(cuò)誤的常見模式),學(xué)生模型能夠識(shí)別并規(guī)避高頻錯(cuò)誤,提升低資源語言的翻譯能力。
小紅書團(tuán)隊(duì)提出的這個(gè)框架, 是一種對(duì)蒸餾的創(chuàng)新應(yīng)用,當(dāng)時(shí)是為了從大語言模型中提煉復(fù)雜推理的能力并遷移到專業(yè)化小模型當(dāng)中。至于具體可以完成什么任務(wù)當(dāng)時(shí)并不清晰,起碼看上去,翻譯并不是重點(diǎn)。
那時(shí)或許沒人知道這個(gè)框架,在一年之后,會(huì)為小紅書成為國際交流的橋梁帶來幫助。
還是那句老話:機(jī)會(huì)永遠(yuǎn)留給有準(zhǔn)備的人。
![]()
重磅上線|小電拼開源
小紅書登頂美區(qū) App Store!TikTok 難民瘋狂涌入,畫風(fēng)真的太抽象了
![]()
每次點(diǎn)擊,都是你對(duì)明日生活的態(tài)度
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.