文 | 白鯨出海
7 年前,作者還是一名職業翻譯,用著雅信 CAT 翻譯軟件,搭配谷歌翻譯和紙質的大部頭柯林斯字典,做法律文書、技術資料的翻譯工作,偶爾也幫一些引進的英語電視節目配字幕。
轉行面試的時候,hr 問我為什么不干翻譯了,我回答說,感覺自己這個職業可能很快要被 AI 替代了。
當時的 HR 可能以為這只是個隨口瞎編的理由,但身處行業中,我的體會真是這樣。
2017 年前后,作者明顯能感覺到,谷歌翻譯的準確率在大幅提升。雖然在一些專業領域,尤其句子結構復雜的文本材料,機翻的結果仍存在很多錯誤,沒法直接采用。但對于一些基礎文本,翻譯結果已經相當準確、優雅了。
因而行業內也出現了個別譯員大范圍采納谷歌翻譯結果、敷衍交差的情況,在審校這類稿件時,一旦內容涉及到陌生的專業領域,如果不細看原文,是不容易發現問題的。也就是說,這時候翻譯引擎的“智力”水平,只需配合少許“人工”,就能達到“即使胡說八道、也能自圓其說”的程度了。
當時我還沒注意到,谷歌已經推出了自有品牌手機 Google Pixel phone 和耳機 Pixel Buds,宣傳亮點之一,即是通過軟硬件結合的方式,讓“實時翻譯”這項專業級技能,走進普通消費者的日常生活中。只不過真正的翻譯任務,還是通過手機上深度集成的 Google Translate App 完成,Pixel Buds 本身不直接處理翻譯邏輯,只單純扮演一個“傳聲筒”的角色。而且,就網絡上留存的一些當時的用戶反饋來看,產品使用流程比較繁瑣,高度依賴手機 APP 和手動操作,且翻譯質量和交互體驗也差強人意。
![]()
左 Google Pixel phone,右 Pixel Buds | Alex Dobie 博客
彼時國內同樣掀起了一波人工智能創業浪潮,翻譯領域自然也不乏軟、硬件科技巨頭推陳出新、試圖解決用戶跨語種交流問題。網易有道、百度翻譯陸續采用新的技術路線迭代自家翻譯引擎;被譽為“中國語音產業第一股”的科大訊飛,也于 2016 年年底推出了旗下首款消費級翻譯硬件——訊飛翻譯機,并迅速成為市場上的明星產品。
2017 年,一家位于深圳的智能硬件初創公司,更進一步提出“翻譯耳機” 概念,嘗試“把翻譯軟件直接裝入耳機”,讓用戶實現跨語言自由交流的目標。項目在北美科技眾籌平臺 Kickstarter 上冷啟動,以并不算便宜的價格(超級早鳥價 99 美元),一舉收獲了 1640 位支持者。這就是如今 AI 同傳耳機頭部品牌——Timekettle 時空壺的起點。
![]()
圖:時空壺初代產品眾籌頁
幾乎每個跨語言交流場景, 都有了專屬的“AI 翻譯官”
短短幾年,科技飛速發展,日常工作、生活中的大部分難題,似乎都有了產品化的解法,跨語言交流自然也不例外。大語言模型的出現,讓普通消費者需要翻譯技能的每一個高頻場景,都有了專屬的“翻譯官”。
翻譯工種的分類,幾個核心要素,一是準確性、二是即時性、三是結果展現的方式。
以作者曾經從事的文本翻譯和聽譯工作為例,兩者的共同點,一是對“即時性”要求不高,工作時間相對充裕;二是都不涉及“開口講”,只需要把原文本、音視頻內容,用另一種語言文字準確轉述出來即可。這也是普通消費者日常工作、生活中最常見的場景,包括瀏覽外文資料、網站,看外文影視節目等等。
通用文本的翻譯,目前最佳解決方案,毫無疑問就是大語言模型,以及集成了大語言模型的翻譯引擎本身。ChatGPT、DeepSeek、元寶、豆包……現在任何一個大模型的文本翻譯質量,基本上都達到了拿來就用的水平;谷歌、微軟 Edge 等主流瀏覽器也提供類似于“翻譯此頁面”這樣更大眾化的功能,為用戶瀏覽外文網站掃除障礙;外文影音內容的翻譯,則幾乎從“源頭”上得到了解決——市場上主流的視頻編輯類產品,幾乎把“匹配字幕”、“字幕翻譯”做成了標配功能,有的甚至還免費。卡點依然在法律、金融、醫療等對準確度和專業性要求極高的垂直領域,作者就聽說過“花 5 萬塊買了一套 AI 智能合同審核工具,結果還得靠人工”的案例。
而常見的“聽譯”類產品,已經被廣泛集成在了各類視頻會議、協同辦公軟件中,以語音轉寫、會議紀要、實時字幕等形式出現,例如騰訊會議中的“字幕和轉寫”,飛書“妙記”的實時字幕功能。就我個人使用體驗來看,語音識別的準確度,也就是“聽”的問題,反而比“譯”的問題要大得多。
![]()
圖:騰訊會議和飛書妙記集成的實時翻譯功能
在更專業、更正式、對于“即時性”要求也更高的視聽場景,例如公開演講、大會論壇,很多會議主辦方會將外文演講者的發言,以實時翻譯字幕的形式,投放到會場顯示屏上,同步呈現給聽眾。據作者最近幾次參會的切身體驗,AI 實時翻譯的專業性、準確性已經非常高了,當然也有可能跟預置了專業詞庫、甚至內部預訓練了垂直領域模型有關。
![]()
圖:Meta 電商海外營銷峰會現場,嘉賓用英文演講,大屏幕右側以中文同步展示中文字幕
總之,我曾經賴以謀生的飯碗,可以說是被 AI 砸得七七八八了,也不知當年合作過的翻譯公司和同行小伙伴們是否還安好。
從“對講機”到“自由交流”, AI “嘴替”還在進化
在以上提到的各類場景中,用戶更多還是單方面的“接收”信息,而在需要“開口講外語”的場景,就涉及到更高階的翻譯技能——交替傳譯和同聲傳譯。
交替傳譯大多出現在外交會晤、外貿洽談等場景,就像我們常在電視里看到的那樣,A 講話人講一段,停下來,譯員翻譯給 B 講話人;B 講話人回復,譯員再翻譯給 A 講話人,也就是講話人和譯員“交替”說話。
![]()
圖:意大利總理梅洛尼與美國總統特朗普會面,兩人身側是雙方譯員 | 來源:新聞
同聲傳譯則常見于高端會議、一對多發言的場景,講話人幾乎不需要特意停頓,譯員通過專業設備收音(除去講話人聲音之外的雜音),最多延遲幾秒,即開始同步翻譯,聲音再通過麥克風,傳遞到現場佩戴同傳耳機的觀眾耳朵里。
![]()
圖:聯合國總部的全職同聲翻譯 CHEN JI |來源:CHEN JI 的 YouTube 頻道
過去的同聲傳譯,需要最高級別的專業翻譯人才,輔以昂貴的專業設備提供支持。這里的同傳設備,主要解決的是通信問題,而非“翻譯”工作本身。而當下火熱的 AI 翻譯耳機賽道,試圖攻克的,就是把同聲傳譯這項技能,從少數“高端場景”釋放,真正拉入到普通消費者的日常工作、生活場景中。
經過 7、8 年的技術攻堅和產品迭代,AI 翻譯耳機已從概念階段真正落地,走向普惠化、消費級,應用場景也從參觀訪問、商務會談、跨國會議等商業場景,擴展到了出境旅游、跨文化交流等領域。頭部 AI 翻譯耳機也由當初“對講機”式的交替傳譯模式,進化到了更接近“自由交流”式的同聲傳譯模式。
作者測試了時空壺最新一代產品 TimeKettle W4 Pro,發現它已經完全可以應付需要“開口講外語”的大部分場景。
![]()
這是時空壺 YouTube 官方賬號發布的 W4 Pro 的宣傳片,很好地展示了在商務場景中,W4 Pro 如何作為跨語言交流的 AI “嘴替”發揮作用。
W4 Pro 提供 5 種工作模式,適配不同的應用場景,可供用戶自由切換。這 5 種模式涵蓋了上文中提到的所有場景:
1. 影音模式——為音、視頻內容實時提供字幕和翻譯;
2. 傾聽模式——對方說外語,耳機翻譯給我聽;
3. 發言模式——我說中文,手機外放翻譯給對方聽;
4. 通話模式——我說中文,電話/IM 軟件對方聽到外語翻譯;對方說外語,耳機翻譯中文給我聽;
5. 1v1 雙向對話模式——對話雙方一人佩戴一只耳機自由交流,耳機同步翻譯,更貼近面對面日常交談的場景。
![]()
圖:從左至右依次是影音模式、傾聽/發言模式、通話模式
作為一名前英語筆譯,作者雖然可以應付日常英語交流,但在開會、與不同國籍、不同口音的外國朋友交流時,英語能力仍是明顯的限制,更不用說遇到其他語種的情況了。如今,AI 翻譯耳機這個“外掛”,給了我這樣的跨語言工作者極大的信心和助力。
跨語言交流沒有 one for all 的最佳解
底層技術的躍遷提升了終端產品的用戶體驗,也降低了應用落地的門檻。如今市場上涌現出更多 AI 翻譯軟硬件設備:
許多大廠和初創品牌切入 AI 翻譯耳機賽道;讓普通藍牙耳機秒變“AI 翻譯耳機”的軟件模塊驚現華強北;專為翻譯設計的各類手持設備、手機、平板陸續上市;AI 翻譯眼鏡乃至腦機接口等更多創新形態的產品還在路上……
作者贊同時空壺創始人田力的觀點:“跨語言痛點是非常大的,散落在非常多的產品里,市場是非常大的,但目前還沒出現一個通用型方案,適合所有場景。”
作為最早突破“雙向同傳”技術的 AI 翻譯耳機產品,時空壺的技術優勢在“通話模式”和“1v1 雙向對話模式”中的體驗最好,而在“影音模式”下,同聲傳譯的幾秒延遲可能造成的視頻“音畫不同步”,給用戶的體驗,肯定是不及內容供給側的“原生配音”的。
此外,已有的解決方案還遠談不上“完美”,就如同考試成績一樣,從 90 分提升到 95 分的難度,可能遠大于從 60 分提升到 90 分。
比如,如何在在線翻譯網絡信號不好和離線翻譯質量不好之間平衡?如何突破 1v1 場景限制,實現多人流暢地跨語言交流?耳機的形態如何突破“私人物品共享”的社交障礙?眼鏡的形態如何解決不識字的問題……
這其中,有的是技術問題,有的可能是工程問題,還有的甚至無關“跨語言”,而是純粹的“交流”問題。
田力在近期一次公開談話中表示,“因為人的交流的形式,在時間、空間和對象上,就是非常多元和豐富的。不同場景其實是排列組合的一個網,我們從一開始做產品設計的時候就很明確了,時空壺不是為所有的場景服務的。當前為止,其實我們解決的,只是這個排列組合中的一個點,未來,可能是一個產品組合。我期待在未來解決所有場景問題的選手中,時空壺是幾個主要的貢獻者之一。”
也許未來會像電影《降臨》里描繪的那樣,有新的文字系統出現,亦或者像小說《三體》中三體文明設定的那樣,直接通過“思維交流”,從而徹底顛覆掉人類跨語言交流的模式。但在那之前,作為曾經的翻譯從業者、如今的 AI 翻譯產品用戶,作者自然期待時空壺的使命無限接近于完成——讓所有語言不通的人,都可以用母語自然交流、互相理解。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.