![]()
AI應用風向標(公眾號:ZhidxcomAI)
作者|江宇
編輯|漠影
智東西11月26日報道,近日,豆包輸入法正式上線。體驗過的網友紛紛好評,抱著好奇,我們也下載體驗了一番。
豆包輸入法APP的圖標依然沿用了豆包的代表性形象,是一個舉著手機說話的豆包。這個圖標或許是在暗示,其側重點恰是在“語音轉文字”這個功能上。
![]()
▲豆包輸入法圖標
打開豆包輸入法APP之后,上手流程非常直接,只有兩個步驟:啟用豆包輸入法、切換到豆包輸入法。在安卓端整個過程很干脆,不會有繁瑣的權限設置。
進入設置之后,豆包輸入法的核心功能——語音轉文字的相關內容被放在最前面。
![]()
▲豆包輸入法“語音轉文字”設置欄
在語音設置里,除了常見的語言展示方式、數字與英文處理、弱WiFi下是否切換流量、是否允許有限使用藍牙麥克風這些基礎選項之外,“智能標點”是比較新的功能點。
它給用戶提供了四種選擇:智能增加標點、用空格替代標點、句末不加標點以及保留所有標點。真實體驗下來,我們覺得“智能標點”這個功能在使用語音輸入時較為關鍵。
如果標點能自動處理,那么語音轉文字之后就基本不用再進行二次編輯了。
此外,離線語音功能是我在設置里看到的另一個亮點。只要下載大約150M的離線模型,就能在弱網或無網情況下繼續使用語音識別。
![]()
▲豆包輸入法“離線語言”下載
語音不完全依賴網絡,對輸入法來說其實非常實用。畢竟輸入法并不是一個只在網絡穩定環境下才會使用的工具,把語音能力放在端側可以避免很多使用過程中的斷點。
在簡單設置完成后,可以看到豆包輸入法的整體布局與常用的幾款輸入法較為接近。
![]()
▲豆包輸入法界面
真正體驗語音識別時,我挑了一段比較有挑戰性的片段,選的是《甄嬛傳》里的“滴血認親”名場面。我把播放速度直接調到兩倍,人聲語速非常快,中間還帶有接近文言語感的對白。
![]()
▲豆包輸入法
從結果來看,豆包只在人物姓名的識別上出現了偏差,其余內容與臺詞差別不大。我也用其他輸入法對比測試過同一段內容,差異較為直觀的。
![]()
▲另一款具備AI功能的輸入法
為了進一步測試,我換了一段粵語片段,來自《九品芝麻官》,這一段的密集對白就比較考驗模型的識別能力。
![]()
▲豆包輸入法的粵語識別效果
在豆包上測試時,每行臺詞基本都是完整呈現的。
此外,我嘗試了一個更貼近職場溝通的場景——中英文混說。
![]()
在豆包輸入法中,這類混合語句的識別幾乎無需修正。它能準確識別英語詞匯,并與中文內容保持正確的分割,句子的標點也能合理補齊。
體驗下來,可見豆包輸入法的語音識別能力是較為強勁的。
語音之外我也嘗試了鍵盤輸入,主要觀察聯想欄的表現。比較簡單的是算術題,輸入算式,它會直接在聯想區給出運算結果。
![]()
▲豆包輸入法直接輸入等式結果
如果輸入一些常識類問題,系統也能給出對應答案。
![]()
▲豆包輸入法直接輸出吳承恩屬于哪個朝代
比較意外的是,當我輸入“前OpenAI研究員”時,聯想欄直接出現一串名字。
![]()
▲豆包輸入法推測出伊利亞和卡帕西
然而當我斷開網絡之后,這些聯想就全部消失,可見它并不是傳統意義上“詞庫聯想”。
當然,這里是否“問了AI”還是簡單的聯網搜索,還需要以官方解釋為準,但從體驗角度看,它并不是簡單的靜態詞庫,能夠在很大程度提升輸入體驗。
在整個的體驗過程中,也能感受到豆包輸入法目前仍存在一些需要補齊的功能。
基礎輸入方面,它暫時沒有手寫、五筆和繁體轉換的能力。光標移動目前只能左右,而有些輸入法已經支持上下跨行移動。鍵盤輸入“不跟手”的反饋在社區里也有人提到。
這些問題都屬于輸入法常規能力的一部分,可以期待豆包輸入法后續的優化。
寫在最后:從輸入法看AI時代的人機交互
從豆包輸入法的應運而生可以看出,在AI時代,人機交互的變化已經開始在最日常的工具層面出現苗頭。
人和設備的關系正在從按鍵輸入,走向更自然、更接近日常溝通的語言表達。
而在未來,借助AI,人類或許無需再刻意學習如何操作工具,只需要說出來,甚至只是“想一想”,工具就能理解、思考并執行。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.