當(dāng)人工智能成為驅(qū)動(dòng)產(chǎn)業(yè)變革的核心引擎,高質(zhì)量數(shù)據(jù)便是這場(chǎng)革命的“核燃料”。
在寧波這片汽車產(chǎn)業(yè)沃土上,寧波博登智能科技有限公司(以下簡(jiǎn)稱“博登智能”)以“AI for AI”為核心理念,用六年時(shí)間完成了從3人初創(chuàng)團(tuán)隊(duì)到年?duì)I收過億元的跨越式增長(zhǎng),現(xiàn)已成長(zhǎng)為數(shù)據(jù)標(biāo)注領(lǐng)域的國(guó)家級(jí)專精特新“小巨人”。
近日,創(chuàng)始人趙捷博士接受機(jī)器人大講堂專訪,分享了這家AI數(shù)據(jù)處理服務(wù)商的創(chuàng)業(yè)初心、技術(shù)突破與未來藍(lán)圖。
▍跨境洞察:從德國(guó)經(jīng)驗(yàn)到寧波創(chuàng)業(yè)
2019年,帶著德國(guó)留學(xué)與工業(yè)界的雙重積淀,趙捷博士將創(chuàng)業(yè)的種子播撒在寧波。這一選擇背后,是他對(duì)行業(yè)趨勢(shì)的精準(zhǔn)預(yù)判與對(duì)產(chǎn)業(yè)生態(tài)的深度考量。
當(dāng)時(shí)國(guó)內(nèi)自動(dòng)駕駛產(chǎn)業(yè)正處于數(shù)據(jù)需求爆發(fā)前期,但數(shù)據(jù)標(biāo)注行業(yè)還停留在手工作坊階段,嚴(yán)重依賴人力重復(fù)勞動(dòng)。”趙捷回憶道,德國(guó)的學(xué)術(shù)背景讓他深耕強(qiáng)化學(xué)習(xí)領(lǐng)域,早早就意識(shí)到高質(zhì)量數(shù)據(jù)集對(duì)AI模型的關(guān)鍵價(jià)值,而構(gòu)建德國(guó)汽車主機(jī)廠數(shù)據(jù)中心的行業(yè)經(jīng)驗(yàn),更讓他洞悉了自動(dòng)駕駛對(duì)數(shù)據(jù)質(zhì)量、安全與效率的核心訴求。
寧波完善的汽車產(chǎn)業(yè)鏈生態(tài)成為創(chuàng)業(yè)的關(guān)鍵契機(jī)。“這里聚集了吉利、零跑、路特斯等主機(jī)廠,能讓我們的產(chǎn)研與市場(chǎng)需求緊密契合。”趙捷坦言,寧波的營(yíng)商環(huán)境、政府支持力度以及對(duì)品質(zhì)的追求,讓他在兩次考察后便下定決心落地。2019年公司營(yíng)收為600多萬元,目前博登智能早已實(shí)現(xiàn)過億元營(yíng)收。其成長(zhǎng)軌跡,恰是AI數(shù)據(jù)服務(wù)行業(yè)爆發(fā)式增長(zhǎng)的縮影。
德國(guó)經(jīng)歷不僅帶來了技術(shù)視野,更塑造了企業(yè)的核心基因。“德國(guó)工業(yè)界對(duì)流程標(biāo)準(zhǔn)化和質(zhì)量控制的執(zhí)著,讓我們建立了嚴(yán)謹(jǐn)?shù)慕桓扼w系。”趙捷表示,2016年歐盟GDPR法案的推出,讓他提前布局?jǐn)?shù)據(jù)合規(guī)體系,為后續(xù)服務(wù)國(guó)內(nèi)外客戶奠定了基礎(chǔ),這也成為博登智能區(qū)別于傳統(tǒng)標(biāo)注企業(yè)的顯著特征。
▍技術(shù)破壁:重新定義數(shù)據(jù)處理標(biāo)準(zhǔn)
在AI產(chǎn)業(yè)“模型架構(gòu)差距縮小,數(shù)據(jù)質(zhì)量差距成為關(guān)鍵”的競(jìng)爭(zhēng)格局下,博登智能以技術(shù)創(chuàng)新破解傳統(tǒng)數(shù)據(jù)處理的效率低、成本高、質(zhì)量不穩(wěn)定三大痛點(diǎn)。
![]()
公司自研BASE數(shù)據(jù)標(biāo)注平臺(tái),深度融合智能體、多模態(tài)大模型以及內(nèi)嵌的200+預(yù)標(biāo)注模型,構(gòu)建了覆蓋文本、語(yǔ)音、圖像、視頻的多模態(tài)數(shù)據(jù)處理能力。“我們突破了單一數(shù)據(jù)類型限制,支持2D、3D乃至點(diǎn)云時(shí)序拼接的4D標(biāo)注,實(shí)現(xiàn)‘一次標(biāo)注多幀映射’。”趙捷介紹,通過融合AI模型與大語(yǔ)言模型,平臺(tái)打造了主動(dòng)學(xué)習(xí)機(jī)制,能自動(dòng)生成標(biāo)注模板,結(jié)合AI質(zhì)檢模型形成閉環(huán)優(yōu)化體系。
具體來看,非交互式算法層面構(gòu)建了全鏈路的自動(dòng)化優(yōu)化能力:基于龐大的預(yù)訓(xùn)練模型庫(kù),通過遷移學(xué)習(xí)快速生成高質(zhì)量初始標(biāo)注,再借助弱監(jiān)督、自監(jiān)督與主動(dòng)學(xué)習(xí)技術(shù)持續(xù)迭代模型,不斷降低對(duì)人工干預(yù)的依賴;通用屬性大模型通過多任務(wù)特征表示技術(shù),有效減少重復(fù)標(biāo)注環(huán)節(jié),提升標(biāo)注統(tǒng)一性;專用分割模型則搭建起“預(yù)測(cè)-反饋-再訓(xùn)練”的閉環(huán)體系,逐步實(shí)現(xiàn)核心場(chǎng)景的自動(dòng)化標(biāo)注。
硬核技術(shù)帶來了顛覆性的效率提升:4D標(biāo)注項(xiàng)目效率最高提升7倍,降低成本40%,標(biāo)注準(zhǔn)確率高達(dá)99%以上。更值得關(guān)注的是,平臺(tái)具備十億級(jí)圖片毫秒級(jí)檢索與億級(jí)點(diǎn)云實(shí)時(shí)渲染能力,重新定義了大規(guī)模數(shù)據(jù)處理的行業(yè)標(biāo)準(zhǔn)。“我們的模型每周定期更新,確保準(zhǔn)確率持續(xù)向上增長(zhǎng),真正實(shí)現(xiàn)從人力依賴到AI驅(qū)動(dòng)的轉(zhuǎn)型。”
針對(duì)不同行業(yè)的差異化需求,博登智能構(gòu)建了可配置化的柔性數(shù)據(jù)中臺(tái)。在自動(dòng)駕駛領(lǐng)域,與吉利、零跑等車企合作開發(fā)預(yù)標(biāo)注方案與占據(jù)網(wǎng)絡(luò)標(biāo)注工具,通過降噪算法處理雨雪天激光雷達(dá)數(shù)據(jù)噪聲;在大模型領(lǐng)域,為騰訊、阿里定制教育類試題標(biāo)注流程;在具身智能領(lǐng)域,為頭部企業(yè)提供多模態(tài)交互式標(biāo)注服務(wù),通過合成數(shù)據(jù)生成覆蓋復(fù)雜場(chǎng)景的數(shù)據(jù)。
![]()
▍生態(tài)布局:從產(chǎn)學(xué)研到行業(yè)標(biāo)準(zhǔn)共建
面對(duì)AI產(chǎn)業(yè)的快速迭代,博登智能通過“技術(shù)+場(chǎng)景+人才”的生態(tài)布局,構(gòu)建起難以復(fù)制的核心競(jìng)爭(zhēng)力。
在產(chǎn)學(xué)研合作方面,公司與上海交通大學(xué)等高校共建聯(lián)合實(shí)驗(yàn)室,形成雙向賦能的良性循環(huán)。“高校的實(shí)際使用反饋為產(chǎn)品優(yōu)化提供了真實(shí)依據(jù),實(shí)驗(yàn)室也成為前沿技術(shù)的試驗(yàn)田,幫助我們降低研發(fā)風(fēng)險(xiǎn)。”趙捷表示,雙方共同打造的高質(zhì)量開源數(shù)據(jù)集,既樹立了行業(yè)技術(shù)權(quán)威,也通過前置化人才培養(yǎng),建立了穩(wěn)定的校園招聘通道。
![]()
在具身智能這一千億級(jí)藍(lán)海市場(chǎng),博登智能提前布局應(yīng)對(duì)數(shù)據(jù)挑戰(zhàn)。“目前可用的具身智能數(shù)據(jù)不足行業(yè)需求的千分之一,多模態(tài)數(shù)據(jù)稀缺、獲取成本高、數(shù)據(jù)孤島等問題突出。”趙捷介紹,公司推出專為具身智能打造的BRICRobo平臺(tái),已接入智元、松靈、零次方等主流機(jī)器人本體,支持遙操、動(dòng)捕等多種采集模式。
![]()
此外,該平臺(tái)支持多本體接入,實(shí)現(xiàn)了對(duì)多類型機(jī)器人本體的統(tǒng)一接入與標(biāo)準(zhǔn)化管理,構(gòu)建了從采集到應(yīng)用的完整數(shù)據(jù)閉環(huán)。在采集端,系統(tǒng)集成任務(wù)領(lǐng)取、多模態(tài)數(shù)據(jù)采集與自動(dòng)上傳功能;后端管理中樞則涵蓋機(jī)器人管理、任務(wù)調(diào)度、數(shù)據(jù)入庫(kù)、算法質(zhì)檢、人工復(fù)核、數(shù)據(jù)處理及動(dòng)態(tài)回放等全流程環(huán)節(jié)。平臺(tái)同步采集末端執(zhí)行器位姿、關(guān)節(jié)空間狀態(tài)、六維力/力矩反饋及多視角RGB-D視覺流,通過多模態(tài)對(duì)齊技術(shù),精準(zhǔn)還原“視覺-觸覺-本體感覺”的耦合過程,為訓(xùn)練感知能力強(qiáng)的具身大模型提供高保真數(shù)據(jù)。同時(shí),博登智能具備從標(biāo)準(zhǔn)化工業(yè)產(chǎn)線到家庭客廳等多樣化真實(shí)場(chǎng)景搭建能力,通過調(diào)整環(huán)境變量生成高難度Corner Case數(shù)據(jù),確保模型不僅掌握已知任務(wù),也能應(yīng)對(duì)未知復(fù)雜情況
![]()
數(shù)據(jù)合規(guī)與資產(chǎn)化成為另一核心護(hù)城河。“我們?cè)谄嚁?shù)據(jù)安全領(lǐng)域的認(rèn)證與流程,構(gòu)建了極高的準(zhǔn)入門檻。”趙捷表示,公司構(gòu)建的高質(zhì)量數(shù)據(jù)集與場(chǎng)景庫(kù)具備復(fù)用價(jià)值,可通過授權(quán)模式服務(wù)客戶,同時(shí)反哺AI預(yù)標(biāo)注算法迭代。持續(xù)20%以上的研發(fā)投入,重點(diǎn)布局大語(yǔ)言模型與具身智能領(lǐng)域,讓企業(yè)保持技術(shù)領(lǐng)先。
海外市場(chǎng)的開拓已納入規(guī)劃。“德國(guó)經(jīng)驗(yàn)讓我們?cè)跀?shù)據(jù)合規(guī)、自動(dòng)化算法等方面更易融入國(guó)際市場(chǎng)。”趙捷表示,公司的全站式數(shù)據(jù)處理方案將逐步推向海外,借助國(guó)家數(shù)據(jù)要素市場(chǎng)化配置的政策東風(fēng),參與跨境數(shù)據(jù)流動(dòng)與價(jià)值釋放。
▍未來愿景:五年成長(zhǎng)為跨行業(yè)數(shù)據(jù)解決方案巨頭
站在“人工智能+”行動(dòng)深入實(shí)施的政策風(fēng)口,趙捷為博登智能描繪了清晰的五年愿景:從自動(dòng)駕駛數(shù)據(jù)服務(wù)領(lǐng)軍者,成長(zhǎng)為覆蓋大模型、具身智能等領(lǐng)域的跨行業(yè)智能數(shù)據(jù)解決方案巨頭;從標(biāo)注效率提升者,演進(jìn)為數(shù)據(jù)要素的“煉金術(shù)師”與架構(gòu)師,主導(dǎo)關(guān)鍵行業(yè)數(shù)據(jù)標(biāo)準(zhǔn);通過IPO實(shí)現(xiàn)資本賦能,加速技術(shù)并購(gòu)與全球擴(kuò)張。
“我們希望扮演三個(gè)核心角色:創(chuàng)新加速器,為AI企業(yè)突破數(shù)據(jù)瓶頸提供高質(zhì)量‘燃料’;生態(tài)構(gòu)建者,推動(dòng)數(shù)據(jù)資產(chǎn)化與流通價(jià)值重構(gòu);規(guī)則參與者,深度參與國(guó)際國(guó)內(nèi)數(shù)據(jù)標(biāo)注、合成數(shù)據(jù)、AI倫理等標(biāo)準(zhǔn)制定。”趙捷強(qiáng)調(diào),在數(shù)據(jù)要素與人工智能深度融合的時(shí)代,企業(yè)的核心競(jìng)爭(zhēng)力是“數(shù)據(jù)資產(chǎn)化能力”與“AI應(yīng)用能力”的乘積。
從寧波創(chuàng)業(yè)的初心到賦能全球AI產(chǎn)業(yè)的雄心,博登智能的發(fā)展軌跡,恰是中國(guó)AI數(shù)據(jù)服務(wù)行業(yè)從追趕到領(lǐng)跑的縮影。隨著“AI for AI”理念的深入實(shí)踐,這家扎根寧波的科技企業(yè),正以技術(shù)創(chuàng)新為筆,以生態(tài)協(xié)同為墨,書寫數(shù)據(jù)驅(qū)動(dòng)智能革命的新篇章。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.