![]()
從1990年進(jìn)入媒體行業(yè),錄音機(jī)就是我的日常必備。最初是像磚頭那么大的磁帶錄音機(jī),用TDK磁帶。后來是微型化的錄音機(jī),體積比現(xiàn)在的手機(jī)還小一號,用的是小磁帶。每次錄完,再回去一句句重聽和整理。
我的職業(yè)生涯,就這樣和錄音設(shè)備緊緊聯(lián)系在一起。
我和錄音機(jī)曾經(jīng)的尷尬故事
雖然我做內(nèi)容整理和編輯的能力不錯,但在工具操作方面,我是個笨人。如此簡單的錄音機(jī),就那么幾個按鍵,如錄音、停止、快進(jìn)、快退、放音等,我有時也會出錯。
錯的最尷尬的一次,是1993年,我代表《南風(fēng)窗》和新華社廣州記者站、廣州電視臺記者一起采訪時任廣州市市長黎子流。問題主要是新華社記者在提,我一邊錄音,一邊做筆記,不知摁錯了哪個鍵,過了一陣,我突然發(fā)現(xiàn)放在市長旁邊的錄音機(jī)的磁帶鼓到了錄音機(jī)外面。幸好市長沒發(fā)現(xiàn),我趕快把它放到口袋里,按了停止鍵。
等采訪結(jié)束,再把磁帶一點(diǎn)一點(diǎn)縮回去聽,發(fā)現(xiàn)大部分內(nèi)容都沒錄上。只好去找電視臺的記者。又不好意思說自己搞砸了,就說這個采訪很重要,要和臺里的版本再對一下。電視臺復(fù)制了一版給我,這才把內(nèi)容補(bǔ)全。
這件事給我留下了長期陰影,以至于后來做錄音采訪——無論是用錄音機(jī)、錄音筆、智能本還是手機(jī),我經(jīng)常采著采著就去看錄音是否正常。有些關(guān)鍵采訪,我甚至?xí)脙蓚€手機(jī)同時錄,才會放心。
直到前些年有一天,我偶然翻看女兒的一本大學(xué)參考書,美國工業(yè)設(shè)計(jì)家諾曼的《設(shè)計(jì)心理學(xué)》,我在工具方面的壓抑感才得到了緩解。這本書的核心觀點(diǎn)是,當(dāng)產(chǎn)品出現(xiàn)故障時,人們常常傾向于自責(zé),但實(shí)際上,這并非用戶的問題,“操作失誤不應(yīng)歸咎于使用者,而應(yīng)歸因于產(chǎn)品與設(shè)計(jì)。”
哦,原來不是我的問題!
盡管心態(tài)正常了,但事實(shí)上,要找到一款像諾曼所說的“以用戶為中心”、具備“可視性”和“易通性”的錄音設(shè)備,并不容易。特別是今天有很多采訪是英文的,而且在自媒體時代,時效性越來越快,有的采訪需要立即整理、編輯和發(fā)出,壓力依然不小。
直到最近在拉斯維加斯參加全球科技界、產(chǎn)業(yè)界矚目的CES(消費(fèi)電子展),用了一款釘釘?shù)腁I錄音卡(DingTalk A1),我關(guān)于錄音的壓力、焦慮才完全消失了。它貼在我的手機(jī)背后,可以隨時進(jìn)行智能聽記,內(nèi)容歸納,能支持8種語言的實(shí)時互譯和20多種語言的同聲傳譯。在比菜市場還吵的會場和餐廳,它都能聽得清,記得下,翻得準(zhǔn),總結(jié)得好,成了我的第一個“AI外掛”。
![]()
從模擬信號時代磚頭般的磁帶錄音機(jī),到AI時代重量只有40克的錄音卡;從一切都靠自己動手整理,到錄音、轉(zhuǎn)文字、提煉總結(jié)、輸出文件紀(jì)要等,都可以交給智能硬件,在我身上,從信息化到數(shù)字化到智能化,時代的演進(jìn)也清晰可見。
AI要長出“肉身”
1月4日上午11:49,我乘UA2229航班,從洛杉磯飛拉斯維加斯。
在休息室休息時,我打開釘釘AI錄音卡的產(chǎn)品盒,很簡單,就是一個主機(jī),一個皮套,一個磁吸環(huán)。把磁吸環(huán)貼到手機(jī)背面,再把主機(jī)貼上去就行了。主機(jī)只有一個錄音鍵和一個語音鍵,按開按停,別的在釘釘APP上操作即可。當(dāng)然,需要先下載一下釘釘APP,但是我相信很多人手機(jī)里都有。
下載,貼好錄音卡,按錄音鍵首次開機(jī),進(jìn)入待激活,打開APP,掃一下產(chǎn)品激活碼完成激活。我沒有費(fèi)任何力氣,也無需任何人指導(dǎo)就完成了這些準(zhǔn)備,可以開始工作了。
看到我拿出一個和名片一樣長、略寬一點(diǎn)的小東西貼到手機(jī)背面,對面坐著的一對老外夫婦,問我是什么。我說我也是第一次用,錄音、翻譯、整理成文字都可以,他說了一句,It’s so cool.
![]()
今年的CES,主題當(dāng)然是AI,最重要的方向則是AI正從大模型等“信息AI”走向“物理AI”,AI要長出“肉身”,和硬件關(guān)聯(lián)在一起,給硬件軀殼注入AI靈魂。比如AI眼鏡,相當(dāng)于給物理世界掛上一幅“實(shí)時字幕”。AI錄音卡,其實(shí)是把AI語音大模型的能力在卡上實(shí)現(xiàn)。
這一方向——有人說是“萬物皆AI”“AI走向端側(cè)”(Edge AI),有人說是“一切皆可計(jì)算”,我的總結(jié)是“終端AI化,AI終端化”——總之,隨著AI大模型能力的提高,AI正在重塑一切物理硬件。
釘釘?shù)腁I錄音卡,看起來是張錄音卡,實(shí)際上,它搭載著6納米的AI音頻芯片,采用了5顆全向麥克風(fēng)和一顆骨傳導(dǎo)麥克風(fēng),它配備的聲紋識別和空間識別可以進(jìn)行可視化錄音,錄音文件則在錄音卡、釘釘以及云端雙端加密,實(shí)現(xiàn)AI智能調(diào)用。
在CES上,我怎么用AI錄音卡?
1月5日上午,我的CES之旅正式開始。
一大早,在威尼斯人酒店CES展區(qū)參加聯(lián)想集團(tuán)的一個產(chǎn)品預(yù)發(fā)布會。會上有六七個產(chǎn)品專家依次展示了一系列的概念驗(yàn)證產(chǎn)品,都是圍繞個人智能計(jì)算的創(chuàng)新形態(tài)而展開。全部都講英文。我坐在聽眾席第一排最右邊,講臺在最左邊,距離估計(jì)有五六米。我按下釘釘錄音卡的錄音鍵,在APP里選一下“實(shí)時翻譯”,這樣一邊在錄,一邊可以看到英文和同步轉(zhuǎn)寫的中文。半個小時的發(fā)布錄完,AI紀(jì)要和章節(jié)也自動生成了。整個轉(zhuǎn)寫內(nèi)容可以直接在釘釘使用,也可以以文檔格式下載到手機(jī)里,轉(zhuǎn)發(fā)給其他人。
第一次用下來,我很滿意,因?yàn)楣δ芮泻衔业男枨螅a(chǎn)品非常易用,整體識別率也挺高。雖然有些專業(yè)名詞翻譯的不準(zhǔn)確,但我知道,如果我授權(quán)它使用我的數(shù)據(jù)來訓(xùn)練,很快會慢慢變好的。傳統(tǒng)的機(jī)器學(xué)習(xí)模型,語音識別準(zhǔn)確率大概在70%左右,一般大模型的準(zhǔn)確率能做到80%,但釘釘錄音卡的背后是釘釘團(tuán)隊(duì)和阿里通義實(shí)驗(yàn)室的能力,他們已經(jīng)通過1億小時的視頻音頻學(xué)習(xí),使準(zhǔn)確率能達(dá)到90%,經(jīng)過專項(xiàng)訓(xùn)練的準(zhǔn)確率可以提升到97%。所謂專向訓(xùn)練,就是要允許它訪問你的一些私人數(shù)據(jù),更了解你的工作特征和平時經(jīng)常使用的語料。
5號中午,威尼斯酒店的一家餐廳,我參加了總部在紐約的一家公關(guān)公司高管組織的一場餐敘。餐廳在室外,周圍很多人在就餐,有些吵鬧。我們這張桌子一共五個人。我打開釘釘錄音卡,發(fā)現(xiàn)它在有干擾的環(huán)境中的錄音準(zhǔn)確率很高,我也使用了“實(shí)時翻譯”功能做輔助,40多分鐘交流下來,覺得效率比平時提高了。
6號早上,在另一家酒店的餐廳,和一家世界知名公司北亞-太平洋區(qū)域的COO交流。這次是室內(nèi),我們一共三個人,餐廳人氣很旺,也有些鬧,他們兩位的一些對話我聽的不是很清楚,但看釘釘錄音卡,則非常清楚。
6號上午,我和一位媒體朋友采訪國際足聯(lián)創(chuàng)新總監(jiān)Johannes Holzmuller,這次是在室內(nèi),環(huán)境很安靜,所以無論錄音效果還是生成的AI紀(jì)要,質(zhì)量比前幾次都更高了。
![]()
再之后,7號上午連續(xù)三場的聯(lián)想集團(tuán)高管群訪,我用釘釘錄音卡已有些得心應(yīng)手。聯(lián)想集團(tuán)董事長兼CEO楊元慶說,AI正變得無處不在,智能設(shè)備內(nèi)置的AI agent智能體可以在用戶授權(quán)后,響應(yīng)指令,甚至做出行動。我想,也許用不了幾年,在各種終端硬件上都體現(xiàn)AI的力量,讓硬件從機(jī)械化的“被動執(zhí)行者”變成智能化的“主動參與者”,就會變成現(xiàn)實(shí)。
整個CES之旅,我錄了七八個小時,發(fā)現(xiàn)電池還是很強(qiáng),才用了不到30%的電量。據(jù)說它可以連續(xù)工作45個小時,而且是TypeC接口,用手機(jī)線就能充電,完全沒有續(xù)航焦慮。
1月7日下午,當(dāng)我即將結(jié)束今年的CES之行,到中心展館逛展時,我專門找到了釘釘?shù)恼刮唬?2020號),雖然展位不大,但我由衷地對釘釘這張AI錄音卡說聲謝謝。自從它貼在我的手機(jī)上,還沒有摘下來過。
對我來說它的好處有三:一是錄音效果有保證,隔著幾米遠(yuǎn),且周圍有些嘈雜,效果也沒問題;二是實(shí)時翻譯、同聲翻譯,邊錄邊譯,特別適合國際化“出海”的場合和場景;三是錄好即轉(zhuǎn)好和總結(jié)好,能節(jié)省大量時間。雖然還并不完美,但隨著它的能力增強(qiáng),它的表現(xiàn)會越來越好。不像傳統(tǒng)硬件,能力是固定的,難以迭代。
![]()
AI新硬件時代正在來臨
然而,和AI錄音卡的真正能力相比,我所用的只是冰山一角。
比如,它里面有一個AI問答功能,可基于現(xiàn)在所錄的內(nèi)容知識庫進(jìn)行各種問答。有的長文件,自己都會忘了在什么時候說過什么,過去要反復(fù)地導(dǎo),現(xiàn)在問一聲,關(guān)于某某問題,誰誰是怎么說的,它就會馬上找給你。
又如,已經(jīng)錄制的多個文件,可以合并在一起,生成整體紀(jì)要。這對我這樣喜歡多源頭采訪、錄音量特別大的人來說很有用。
這些功能,我還都沒有用過。
所以說,在充分發(fā)揮技術(shù)工具的生產(chǎn)力方面,我還是一個笨人。
只不過和過去比起來,現(xiàn)在的笨鳥要幸福很多,因?yàn)榭梢越柚鶤I工具,先飛起來。
對于企業(yè)組織來說,釘釘?shù)腁I錄音卡的作用就更大了。在AI釘釘1.1產(chǎn)品發(fā)布會上,友成公司的執(zhí)行董事許笑迎分享了這樣一個故事:
不久前,友成董事長去墨西哥出差,許笑迎為他特意配備了一臺釘釘AI錄音卡。起初董事長非常不解,覺得這能有什么用。結(jié)果有一場會議結(jié)束后,董事長馬上打來電話,說實(shí)在太好用了——那是一場在墨西哥跟日本客戶的會議,墨西哥講西班牙語,董事長不會講。但在錄音卡幫助下,不僅實(shí)現(xiàn)了西班牙語實(shí)時轉(zhuǎn)譯,甚至還幫董事長對比校正出人工翻譯的遺漏,大幅提升會議溝通質(zhì)量。公司迅速給管理層及外派人員都配備了錄音卡。
今年的CES,我在不少展臺都看到了新一代AI硬件,比如戒指、項(xiàng)鏈、耳環(huán)等飾品。此時的重點(diǎn)不是“可穿戴”,而是可工作、可交流,你對它說一聲話,它就會和你互動起來。AI技術(shù)真的從云端落地了,落到萬物里。
這要?dú)w功于過去幾年的AI大模型快速發(fā)展,以及芯片、算法、架構(gòu)、感知、通信五大技術(shù)的協(xié)同突破(如NPU+存算一體,輕量AI大模型,多傳感器融合等),讓各種便攜式、可穿戴的硬件設(shè)備,通過采用“本地采集+手機(jī)/云端計(jì)算”的分工模式,如神靈附身,變得比過去聰明太多。
根據(jù)第三方數(shù)據(jù)公司弗若斯特沙利文的預(yù)測,2025-2029年,全球AI端側(cè)硬件市場規(guī)模將從3219億元飆升至1.22萬億元,年復(fù)合增長率達(dá)到40%,增速遠(yuǎn)超傳統(tǒng)消費(fèi)電子品類。
盡管還存在專有數(shù)據(jù)不足的問題;提升用戶體驗(yàn)需要投入很強(qiáng)算力,而算力會增加成本和功耗的問題;以及某些網(wǎng)絡(luò)環(huán)境對于產(chǎn)品使用場景的限制等問題,但AI硬件的最大優(yōu)勢就是基于軟硬件一體化,可以快速更新迭代。
就像去年4月北京的人形機(jī)器人半程馬拉松,不少機(jī)器人當(dāng)時還無法直立直線前行,數(shù)月之后已能在多個場景中作業(yè)。據(jù)說英偉達(dá)已將主要AI數(shù)據(jù)中心GPU的架構(gòu)更新周期從兩年縮短至一年,并開始發(fā)貨新一代“機(jī)器人大腦”,就是為了更快提升機(jī)器人的推理與決策速度。
對于釘釘這一擁有2600萬組織用戶以及7億個人用戶,中國最大的協(xié)同辦公平臺來說,數(shù)以萬計(jì)的辦公、學(xué)習(xí)、會議、交流需求,為它推出創(chuàng)新的AI硬件產(chǎn)品,打通從數(shù)據(jù)輸入、AI處理分析到工作中協(xié)同行動的閉環(huán),提供了豐厚土壤。也因此,釘釘錄音卡自然成為阿里面向AI時代的消費(fèi)級主力硬件。
像釘釘錄音卡這樣的產(chǎn)品,背后所調(diào)用的是阿里巴巴的算力和通義大模型。釘釘在深入千行百業(yè)的智能硬件方面的作為,也事關(guān)阿里的大模型如何被更多地消費(fèi)。
![]()
結(jié)語
在供應(yīng)鏈方面,中國制造已經(jīng)有強(qiáng)大的競爭力。現(xiàn)在,是在各種硬件上注入AI的時候了。這將使中國制造變成真正的智造,不僅用智能化方式去做制造,也制造各種智能硬件。
在這個過程中,互聯(lián)網(wǎng)超級APP公司、大模型公司都會在“生態(tài)終端化”方面下場,不僅釘釘,其他巨頭也都在紛紛嘗試硬件形式,如企業(yè)語音AI終端,智能客服/會議硬件,跨工作生態(tài)嵌入式設(shè)備等。
釘釘?shù)南M牵ㄟ^軟硬協(xié)同,從任務(wù)捕捉到內(nèi)容解析到協(xié)同執(zhí)行,打造一個更加閉環(huán)的辦公體驗(yàn),用人人可用的硬件幫助組織沉淀更多的數(shù)據(jù)資產(chǎn),發(fā)揮AI價值。這是一個橫跨軟件、AI、硬件和企業(yè)服務(wù)的全棧方向,充滿了想象力。
我從自己親自體驗(yàn)的這張小小的錄音卡,看到了基于中國的制造優(yōu)勢、供應(yīng)鏈優(yōu)勢和龐大的組織規(guī)模、應(yīng)用場景,一個宏大的AI新硬件時代正在來臨,已經(jīng)來臨。
這似乎也昭示著,從移動互聯(lián)網(wǎng)走向智能體和智能硬件相融合的新互聯(lián)時代,也已拉開了大幕。
No.6716 原創(chuàng)首
發(fā)文章|作者 秦朔
開白名單 duanyu_H|投稿 tougao99999
歡迎點(diǎn)看【秦朔朋友圈】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.