9月11日,在外灘大會主論壇上,宇樹科技創(chuàng)始人王興興接受記者張小珺訪問,分享了對AI原生時代、機器人創(chuàng)業(yè)等多方面的看法。
王興興認為,AI原生時代對年輕一代尤其是學(xué)生是絕佳機遇。當下AI模型可看作預(yù)編程工具集,能助力創(chuàng)作圖像、影像,甚至編寫自己的agent,比以往更便捷直接。他鼓勵大家對AI模型認知更激進,將其視為全能型工具集,重新學(xué)習(xí)接納并善加利用。
回顧創(chuàng)業(yè)歷程,王興興表示宇樹科技2016年成立,早期發(fā)展較慢,近四五年加速。他自幼熱愛科技,2009年大一便制作出雙足機器人,公司現(xiàn)主營人形與四足機器人。早期創(chuàng)業(yè)源于興趣,雖曾因AI冷門而減少關(guān)注,但近年AI發(fā)展為其帶來新機遇。他覺得AI時代對所有人公平,當下讓AI“干活”領(lǐng)域尚處發(fā)展初期,充滿潛力。
對于市場十分關(guān)注的公司上市問題,王興興表示,他把上市當作一次“高考”,是企業(yè)邁向更成熟管理階段的標志,也是對股東的交代。
![]()
以下為訪問全文速記:
張小珺:
Hello,大家好,我是小珺。
據(jù)說今天這場嘉賓是全場主論壇里面最年輕的四位嘉賓,所以主辦方給了我們一個非常具有創(chuàng)業(yè)者氣質(zhì)的話題,叫作“AI原生時代,舊地圖上沒有新大陸”。
我非常想問在座的四位第一個問題是,在你們眼里什么是AI原生時代,以及你們眼前已經(jīng)浮現(xiàn)這片新大陸了嗎?它長什么樣?王興興你先來。
王興興:
目前我感覺最近幾年,尤其對年輕一代,尤其還在讀書的其實是個非常好的機會。目前大家知道,像以前大家編程主要是從一些基礎(chǔ)性的代碼做編程,現(xiàn)在大家使用工具,包括用AI,我一直感覺目前的AI模型你本身就可以把它當作一個很好的預(yù)編程的工具集,包括很多的能力。反而是原本大家都是調(diào)一些最基礎(chǔ)的代碼,但是現(xiàn)在可以用更高級的模型能力去創(chuàng)作作品,無論是圖像,或者是影像式生成的模型,或者用AI模型編一個自己的agent出來,都是比以前方便很多,也是更加直接的一個思想。
而且我個人感覺,包括我自己也在轉(zhuǎn)變一些思路,大家可能對AI模型本身的認知可以再更加激進一點,就不用把它當作一個模型,而真正是把它當作一個全能型的工具集,就是把過去的很多東西都給忘了去重新學(xué)習(xí)和接受它一下,再去把它用得更好。
張小珺:
給大家簡單地先鋪墊一下,坐在我左手邊的王興興和蘇昊他們是機器人領(lǐng)域,另外吳翼和吳承霖是軟件方向做agent和強化學(xué)習(xí)相關(guān)。接下來我想問問各位,都是怎么踏上這片新大陸的?王興興你創(chuàng)業(yè)時間最久,2016年就開始創(chuàng)辦宇樹科技,我記得2016年還是如火如荼的共享單車大戰(zhàn),而你卻開始了機器人的創(chuàng)業(yè),你是怎么踏上這片新大陸的?來得早讓你感受到了什么?
王興興:
我覺得現(xiàn)在我們公司確實2016年成立,到現(xiàn)在滿打滿算已經(jīng)9年時間了,這個時間也不算短。我們公司早些年,早幾年四五年可能發(fā)展比較慢一點,最近四五年發(fā)展比較快一點。我最大的點,我個人感覺我還是非常幸運的,很多情況包括我們讀書的時候,或者我剛創(chuàng)業(yè)的時候沒人想象到今天會發(fā)展成這樣子,無論是AI也好,包括機器人沒人會想象到發(fā)展到,比我原本預(yù)計的還要樂觀很多。
最早的時候,比如我小時候?qū)萍级挤浅O矚g,各種的化學(xué)、物理、生物,包括核聚變我都非常喜歡這些事情,畢竟后來大一2009年最開始做的機器人,而且非常湊巧,我也不知道是機緣巧合還是某種原因,我2009年大一做的第一款機器人,就是兩條腿的一個小的雙足機器人或者人形機器人,我們公司現(xiàn)在的主營業(yè)務(wù)也變成人形機器人和四足機器人。做機器人這塊已經(jīng)十幾年的時間了。
最大的點,當時主要是出于興趣愛好我覺得非常酷,大家也知道年輕一代大家想象的肯定是更加天馬行空一點,或者更加有一些夢想,比如說當時AI我本身2010年和2011年的時候我就非常喜歡神經(jīng)網(wǎng)絡(luò),當時是非常冷門的學(xué)科。包括一些別的領(lǐng)域都非常喜歡,但機器人可能算是我過去的一個職業(yè)方向,相對來說可能做起來更加順理成章一點,但AI確實我覺得我過去做的最后悔的一件事,我雖然2011年非常喜歡AI,但是那時候真的是非常冷門的學(xué)科,相關(guān)的AI書籍或者神經(jīng)網(wǎng)絡(luò)都在圖書館吃灰的,我看了幾本書,覺得好像能搞的東西有點少,后來沒有花太多時間關(guān)注,后來很多年主要是搞機器人去了,對AI的關(guān)注度相對小一點。
最近幾年因為AI領(lǐng)域的發(fā)展,無論是大模型,包括機器人的AI模型進展非常快,這是最近幾年也是給我個人再一次的機會,把握住這個AI的時代,也是讓AI真正的落地去干活。現(xiàn)在的語言模型大家也知道在信息領(lǐng)域,包括文字圖像領(lǐng)域已經(jīng)做得非常好,我覺得比99.99%的人都要做得好,無論是語言,包括畫畫都好非常多。但是真正的在讓AI干活這個領(lǐng)域,現(xiàn)在整個領(lǐng)域都是荒漠的階段,就是荒漠上可能長了幾根小草,真正的大規(guī)模的在爆發(fā)性增長的前夜還沒有到來,這個時代對我人來說都是非常激動人心的。我對所有的人,尤其對現(xiàn)在在座的,包括現(xiàn)在的學(xué)生來說,我覺得AI時代都是一個非常公平的時代,我覺得比以前公平非常非常多。只要你聰明,你愿意做事,你能達到你自己想達到的目標,大家在這個荒漠上都可以長出一些參天大樹出來。
張小珺:
王興興我看到你曾經(jīng)公開說行業(yè)現(xiàn)在過度關(guān)注數(shù)據(jù)問題而忽視模型架構(gòu)缺陷,這其實跟蘇昊觀點有一些不同,你為什么持有這個觀點?以及你覺得架構(gòu)創(chuàng)新的方向應(yīng)該是什么樣的?
王興興:
這個點確實我前段時間說過,但我說這話也不是否定數(shù)據(jù)不重要,大家不要誤解。我只是說可能大家平時說數(shù)據(jù)說得比較多,模型說得少一點,這兩塊目前都非常重要。
當然核心的話現(xiàn)在很難判斷,單純從數(shù)據(jù)角度目前機器人的數(shù)據(jù)無論采集、噪聲、數(shù)據(jù)質(zhì)量問題都非常大,包括現(xiàn)在為止大家可能在數(shù)據(jù)上面,比如說真正優(yōu)質(zhì)數(shù)據(jù)怎么采?或者數(shù)據(jù)的質(zhì)量應(yīng)該達到什么樣的程度會是好的標準,或者這個數(shù)據(jù)當下應(yīng)該采集什么類型的數(shù)據(jù)?多大的規(guī)模?都是比較模糊的階段。當然我個人一直覺得還是希望能提高對于數(shù)據(jù)的利用率吧,比如說我們要更加確定說,從模型的角度,模型本身對數(shù)據(jù)理解能力更強,我本身數(shù)據(jù)可以少一點效果會更好,數(shù)據(jù)利用率會更高一點。
其次,從模型的角度,我們也可以發(fā)現(xiàn)這些數(shù)據(jù)里哪些數(shù)據(jù)比較有價值我們重點采集一下,從語言模型的角度大家也發(fā)現(xiàn)很多情況下需要特征性的數(shù)據(jù),而不是單純從量的角度,有些特征性數(shù)據(jù)非常重要,所以從機器人的角度,比如說到底哪些動作或者場景應(yīng)該怎么采是比較有質(zhì)量的,這從模型角度大家也要評價一下。
另外,確實目前的模型尤其是對多模態(tài)的融合做得不太理想,純語言模型或者純視頻模型大家也知道現(xiàn)在效果非常好,但單純把語言和圖像效果要做得很好,是當下比較大的難點,當然現(xiàn)在做得越來越好了。比如說你要控制好一個圖片生成的細節(jié)或者視頻生成的細節(jié),你用文字單純?nèi)タ刂剖呛茈y的,目前通過一些插圖或者線稿生成效果會更好一點。目前在機器人領(lǐng)域的話,如果單純從語言或者什么方式跟它的模態(tài),讓機器人的控制模態(tài)綁得更好一點,現(xiàn)在也是很大的挑戰(zhàn)。
比如說現(xiàn)在如果用視頻生成說要讓一個機器人去做一個家務(wù),現(xiàn)在視頻生成效果還不錯,但生成的效果和機器人的控制模態(tài)要對齊的非常好,當下非常有挑戰(zhàn),簡單來說,僅僅是讓機器人更好地運動、視頻與語言模型對齊,都是非常有挑戰(zhàn)的,包括語言模型要做得更好一點,大概是這樣的情況。
張小珺:
架構(gòu)創(chuàng)新呢?
王興興:
架構(gòu)和數(shù)據(jù)都非常重要的。
張小珺:
我們知道宇樹非常做硬件和本體,你們能給機器人做一個更聰明的大腦嗎?你們覺得需要多長時間?
王興興:
目前硬件跟大腦兩部分不是同一個事情的事情了。說實在的,硬件其實目前是足夠用的,一兩年前的硬件都完全足夠用,現(xiàn)在最大的問題還是說AI模型本身能力還確實不太夠,目前硬件沒辦法很好把這些硬件給用起來,包括大家也知道目前靈巧手大家也關(guān)注非常多,靈巧手這部分,你要把靈巧手用好目前AI是非常困難的一件事情,無論是數(shù)據(jù)采集包括你能控制靈巧手做一些更靈巧的事情,而不單單做一些簡單的抓取這些的事情,當下對AI領(lǐng)域也是非常有挑戰(zhàn)的事情。
張小珺:
王興興你以前說AI并不是資源多、人多、錢多就能做出全球最好的技術(shù),中小團隊也可以,你認可剛才吳翼說的嗎?你認為什么樣的組織設(shè)計能夠更好孕育創(chuàng)新?
王興興:
AI時代對于小組織爆發(fā)的能力越來越強大。包括我覺得尤其是在純AI領(lǐng)域,我一直覺得目前純AI領(lǐng)域的團隊有非常頂尖的幾個人才,頭部的,非常有創(chuàng)新力的全球前沿的,可以做非常多的事情。
當然另外有一點,像我們公司畢竟做硬件事情比較多,我們面臨的組織問題其實是挺大的問題,我們有更多的產(chǎn)品、更多的客戶,我們給客戶提供更好的服務(wù),所以面臨組織挑戰(zhàn)是非常大的一件事,我們當下公司最大的一件事情。
第一,非常缺頂尖人才,這是毋庸置疑的。
第二,管理和組織上的問題,很多情況下人多了反而效率更低了,人多了反而工作推來推去,或者大家覺得各種問題暴露更嚴重一些。
張小珺:
而且你們要同時管理硬件和軟件。
王興興:
對,這個挑戰(zhàn)是非常大的一件事,我覺得對于所有的人員擴增比較多的公司來說,哪怕對于一家大公司來說組織和管理是非常大的一個挑戰(zhàn)。
張小珺:
有沒有最近有一個Knowhow呀?在管理上。
王興興:
最大的點還是花時間。原本比如說想著招很好的人呀,或者自己不想管這件事,但后來發(fā)現(xiàn)還是要自己管一下。
張小珺:
我們的時間到了,最后問一個問題。你們作為先進入這片新大陸的人,如果給之后的人一個建議,讓他們能夠更好地一個技能點,讓他們能夠更好地在新大陸上存活下來你們會給什么建議?
王興興:
我個人現(xiàn)在最大的感受,大家可以把過去很多已經(jīng)現(xiàn)存發(fā)生的事情,能忘的盡量忘了。重新學(xué)習(xí)當下最新的,比如半年或者一年的新東西,以前的東西能忘的全忘了,我覺得這個可以發(fā)生更多的新的靈感,不然對過去經(jīng)驗的依賴,對未來的決策不是好事。因為過去有經(jīng)驗的人可能比你還多,反而可能把握一下當下已經(jīng)發(fā)生的事情做一些新的決策,反而更可能發(fā)生一些新的創(chuàng)造。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.