![]()
從1990年進入媒體行業,錄音機就是我的日常必備。最初是像磚頭那么大的磁帶錄音機,用TDK磁帶。后來是微型化的錄音機,體積比現在的手機還小一號,用的是小磁帶。每次錄完,再回去一句句重聽和整理。
我的職業生涯,就這樣和錄音設備緊緊聯系在一起。
我和錄音機曾經的尷尬故事
雖然我做內容整理和編輯的能力不錯,但在工具操作方面,我是個笨人。如此簡單的錄音機,就那么幾個按鍵,如錄音、停止、快進、快退、放音等,我有時也會出錯。
錯的最尷尬的一次,是1993年,我代表《南風窗》和新華社廣州記者站、廣州電視臺記者一起采訪時任廣州市市長黎子流。問題主要是新華社記者在提,我一邊錄音,一邊做筆記,不知摁錯了哪個鍵,過了一陣,我突然發現放在市長旁邊的錄音機的磁帶鼓到了錄音機外面。幸好市長沒發現,我趕快把它放到口袋里,按了停止鍵。
等采訪結束,再把磁帶一點一點縮回去聽,發現大部分內容都沒錄上。只好去找電視臺的記者。又不好意思說自己搞砸了,就說這個采訪很重要,要和臺里的版本再對一下。電視臺復制了一版給我,這才把內容補全。
這件事給我留下了長期陰影,以至于后來做錄音采訪——無論是用錄音機、錄音筆、智能本還是手機,我經常采著采著就去看錄音是否正常。有些關鍵采訪,我甚至會用兩個手機同時錄,才會放心。
直到前些年有一天,我偶然翻看女兒的一本大學參考書,美國工業設計家諾曼的《設計心理學》,我在工具方面的壓抑感才得到了緩解。這本書的核心觀點是,當產品出現故障時,人們常常傾向于自責,但實際上,這并非用戶的問題,“操作失誤不應歸咎于使用者,而應歸因于產品與設計。”
哦,原來不是我的問題!
盡管心態正常了,但事實上,要找到一款像諾曼所說的“以用戶為中心”、具備“可視性”和“易通性”的錄音設備,并不容易。特別是今天有很多采訪是英文的,而且在自媒體時代,時效性越來越快,有的采訪需要立即整理、編輯和發出,壓力依然不小。
直到最近在拉斯維加斯參加全球科技界、產業界矚目的CES(消費電子展),用了一款釘釘的AI錄音卡(DingTalk A1),我關于錄音的壓力、焦慮才完全消失了。它貼在我的手機背后,可以隨時進行智能聽記,內容歸納,能支持8種語言的實時互譯和20多種語言的同聲傳譯。在比菜市場還吵的會場和餐廳,它都能聽得清,記得下,翻得準,總結得好,成了我的第一個“AI外掛”。
![]()
從模擬信號時代磚頭般的磁帶錄音機,到AI時代重量只有40克的錄音卡;從一切都靠自己動手整理,到錄音、轉文字、提煉總結、輸出文件紀要等,都可以交給智能硬件,在我身上,從信息化到數字化到智能化,時代的演進也清晰可見。
AI要長出“肉身”
1月4日上午11:49,我乘UA2229航班,從洛杉磯飛拉斯維加斯。
在休息室休息時,我打開釘釘AI錄音卡的產品盒,很簡單,就是一個主機,一個皮套,一個磁吸環。把磁吸環貼到手機背面,再把主機貼上去就行了。主機只有一個錄音鍵和一個語音鍵,按開按停,別的在釘釘APP上操作即可。當然,需要先下載一下釘釘APP,但是我相信很多人手機里都有。
下載,貼好錄音卡,按錄音鍵首次開機,進入待激活,打開APP,掃一下產品激活碼完成激活。我沒有費任何力氣,也無需任何人指導就完成了這些準備,可以開始工作了。
看到我拿出一個和名片一樣長、略寬一點的小東西貼到手機背面,對面坐著的一對老外夫婦,問我是什么。我說我也是第一次用,錄音、翻譯、整理成文字都可以,他說了一句,It’s so cool.
![]()
今年的CES,主題當然是AI,最重要的方向則是AI正從大模型等“信息AI”走向“物理AI”,AI要長出“肉身”,和硬件關聯在一起,給硬件軀殼注入AI靈魂。比如AI眼鏡,相當于給物理世界掛上一幅“實時字幕”。AI錄音卡,其實是把AI語音大模型的能力在卡上實現。
這一方向——有人說是“萬物皆AI”“AI走向端側”(Edge AI),有人說是“一切皆可計算”,我的總結是“終端AI化,AI終端化”——總之,隨著AI大模型能力的提高,AI正在重塑一切物理硬件。
釘釘的AI錄音卡,看起來是張錄音卡,實際上,它搭載著6納米的AI音頻芯片,采用了5顆全向麥克風和一顆骨傳導麥克風,它配備的聲紋識別和空間識別可以進行可視化錄音,錄音文件則在錄音卡、釘釘以及云端雙端加密,實現AI智能調用。
在CES上,我怎么用AI錄音卡?
1月5日上午,我的CES之旅正式開始。
一大早,在威尼斯人酒店CES展區參加聯想集團的一個產品預發布會。會上有六七個產品專家依次展示了一系列的概念驗證產品,都是圍繞個人智能計算的創新形態而展開。全部都講英文。我坐在聽眾席第一排最右邊,講臺在最左邊,距離估計有五六米。我按下釘釘錄音卡的錄音鍵,在APP里選一下“實時翻譯”,這樣一邊在錄,一邊可以看到英文和同步轉寫的中文。半個小時的發布錄完,AI紀要和章節也自動生成了。整個轉寫內容可以直接在釘釘使用,也可以以文檔格式下載到手機里,轉發給其他人。
第一次用下來,我很滿意,因為功能切合我的需求,產品非常易用,整體識別率也挺高。雖然有些專業名詞翻譯的不準確,但我知道,如果我授權它使用我的數據來訓練,很快會慢慢變好的。傳統的機器學習模型,語音識別準確率大概在70%左右,一般大模型的準確率能做到80%,但釘釘錄音卡的背后是釘釘團隊和阿里通義實驗室的能力,他們已經通過1億小時的視頻音頻學習,使準確率能達到90%,經過專項訓練的準確率可以提升到97%。所謂專向訓練,就是要允許它訪問你的一些私人數據,更了解你的工作特征和平時經常使用的語料。
5號中午,威尼斯酒店的一家餐廳,我參加了總部在紐約的一家公關公司高管組織的一場餐敘。餐廳在室外,周圍很多人在就餐,有些吵鬧。我們這張桌子一共五個人。我打開釘釘錄音卡,發現它在有干擾的環境中的錄音準確率很高,我也使用了“實時翻譯”功能做輔助,40多分鐘交流下來,覺得效率比平時提高了。
6號早上,在另一家酒店的餐廳,和一家世界知名公司北亞-太平洋區域的COO交流。這次是室內,我們一共三個人,餐廳人氣很旺,也有些鬧,他們兩位的一些對話我聽的不是很清楚,但看釘釘錄音卡,則非常清楚。
6號上午,我和一位媒體朋友采訪國際足聯創新總監Johannes Holzmuller,這次是在室內,環境很安靜,所以無論錄音效果還是生成的AI紀要,質量比前幾次都更高了。
![]()
再之后,7號上午連續三場的聯想集團高管群訪,我用釘釘錄音卡已有些得心應手。聯想集團董事長兼CEO楊元慶說,AI正變得無處不在,智能設備內置的AI agent智能體可以在用戶授權后,響應指令,甚至做出行動。我想,也許用不了幾年,在各種終端硬件上都體現AI的力量,讓硬件從機械化的“被動執行者”變成智能化的“主動參與者”,就會變成現實。
整個CES之旅,我錄了七八個小時,發現電池還是很強,才用了不到30%的電量。據說它可以連續工作45個小時,而且是TypeC接口,用手機線就能充電,完全沒有續航焦慮。
1月7日下午,當我即將結束今年的CES之行,到中心展館逛展時,我專門找到了釘釘的展位(22020號),雖然展位不大,但我由衷地對釘釘這張AI錄音卡說聲謝謝。自從它貼在我的手機上,還沒有摘下來過。
對我來說它的好處有三:一是錄音效果有保證,隔著幾米遠,且周圍有些嘈雜,效果也沒問題;二是實時翻譯、同聲翻譯,邊錄邊譯,特別適合國際化“出海”的場合和場景;三是錄好即轉好和總結好,能節省大量時間。雖然還并不完美,但隨著它的能力增強,它的表現會越來越好。不像傳統硬件,能力是固定的,難以迭代。
![]()
AI新硬件時代正在來臨
然而,和AI錄音卡的真正能力相比,我所用的只是冰山一角。
比如,它里面有一個AI問答功能,可基于現在所錄的內容知識庫進行各種問答。有的長文件,自己都會忘了在什么時候說過什么,過去要反復地導,現在問一聲,關于某某問題,誰誰是怎么說的,它就會馬上找給你。
又如,已經錄制的多個文件,可以合并在一起,生成整體紀要。這對我這樣喜歡多源頭采訪、錄音量特別大的人來說很有用。
這些功能,我還都沒有用過。
所以說,在充分發揮技術工具的生產力方面,我還是一個笨人。
只不過和過去比起來,現在的笨鳥要幸福很多,因為可以借助AI工具,先飛起來。
對于企業組織來說,釘釘的AI錄音卡的作用就更大了。在AI釘釘1.1產品發布會上,友成公司的執行董事許笑迎分享了這樣一個故事:
不久前,友成董事長去墨西哥出差,許笑迎為他特意配備了一臺釘釘AI錄音卡。起初董事長非常不解,覺得這能有什么用。結果有一場會議結束后,董事長馬上打來電話,說實在太好用了——那是一場在墨西哥跟日本客戶的會議,墨西哥講西班牙語,董事長不會講。但在錄音卡幫助下,不僅實現了西班牙語實時轉譯,甚至還幫董事長對比校正出人工翻譯的遺漏,大幅提升會議溝通質量。公司迅速給管理層及外派人員都配備了錄音卡。
今年的CES,我在不少展臺都看到了新一代AI硬件,比如戒指、項鏈、耳環等飾品。此時的重點不是“可穿戴”,而是可工作、可交流,你對它說一聲話,它就會和你互動起來。AI技術真的從云端落地了,落到萬物里。
這要歸功于過去幾年的AI大模型快速發展,以及芯片、算法、架構、感知、通信五大技術的協同突破(如NPU+存算一體,輕量AI大模型,多傳感器融合等),讓各種便攜式、可穿戴的硬件設備,通過采用“本地采集+手機/云端計算”的分工模式,如神靈附身,變得比過去聰明太多。
根據第三方數據公司弗若斯特沙利文的預測,2025-2029年,全球AI端側硬件市場規模將從3219億元飆升至1.22萬億元,年復合增長率達到40%,增速遠超傳統消費電子品類。
盡管還存在專有數據不足的問題;提升用戶體驗需要投入很強算力,而算力會增加成本和功耗的問題;以及某些網絡環境對于產品使用場景的限制等問題,但AI硬件的最大優勢就是基于軟硬件一體化,可以快速更新迭代。
就像去年4月北京的人形機器人半程馬拉松,不少機器人當時還無法直立直線前行,數月之后已能在多個場景中作業。據說英偉達已將主要AI數據中心GPU的架構更新周期從兩年縮短至一年,并開始發貨新一代“機器人大腦”,就是為了更快提升機器人的推理與決策速度。
對于釘釘這一擁有2600萬組織用戶以及7億個人用戶,中國最大的協同辦公平臺來說,數以萬計的辦公、學習、會議、交流需求,為它推出創新的AI硬件產品,打通從數據輸入、AI處理分析到工作中協同行動的閉環,提供了豐厚土壤。也因此,釘釘錄音卡自然成為阿里面向AI時代的消費級主力硬件。
像釘釘錄音卡這樣的產品,背后所調用的是阿里巴巴的算力和通義大模型。釘釘在深入千行百業的智能硬件方面的作為,也事關阿里的大模型如何被更多地消費。
![]()
結語
在供應鏈方面,中國制造已經有強大的競爭力。現在,是在各種硬件上注入AI的時候了。這將使中國制造變成真正的智造,不僅用智能化方式去做制造,也制造各種智能硬件。
在這個過程中,互聯網超級APP公司、大模型公司都會在“生態終端化”方面下場,不僅釘釘,其他巨頭也都在紛紛嘗試硬件形式,如企業語音AI終端,智能客服/會議硬件,跨工作生態嵌入式設備等。
釘釘的希望是,通過軟硬協同,從任務捕捉到內容解析到協同執行,打造一個更加閉環的辦公體驗,用人人可用的硬件幫助組織沉淀更多的數據資產,發揮AI價值。這是一個橫跨軟件、AI、硬件和企業服務的全棧方向,充滿了想象力。
我從自己親自體驗的這張小小的錄音卡,看到了基于中國的制造優勢、供應鏈優勢和龐大的組織規模、應用場景,一個宏大的AI新硬件時代正在來臨,已經來臨。
這似乎也昭示著,從移動互聯網走向智能體和智能硬件相融合的新互聯時代,也已拉開了大幕。
No.6716 原創首
發文章|作者 秦朔
開白名單 duanyu_H|投稿 tougao99999
歡迎點看【秦朔朋友圈】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.