網易首頁 > 網易號 > 正文申請入駐

對話諾因李銀川：華為出身的天才科學家想用合成數據造家務機器人

2026-03-06 09:05:20　來源: 晚點LatePost

北京舉報

分享至

一個極度樂觀主義者心目中具身智能的模樣。

文丨申遠

編輯丨宋瑋

見過李銀川的人都說他是一個天才。學生時代他直接保送北理工校長的博士，在讀期間就參與了大賣的雷達產品研發。留學美國期間，李銀川做了一個量化交易的軟件，賣給了華爾街。“對學生來說是很大一筆錢。”

在華為諾亞實驗室待了五年，李銀川 “拿遍了公司主流大獎”，即使以華為的標準看，他也是一個全力以赴的卷王。

但李銀川真正想做的是創業，他給自己設定了一個時間節點： 30 歲，方向也很早就清晰，To c 硬件產品。疊加他的 AI 技術背景，這一切自然指向了機器人。

2025 年，30 歲的李銀川從華為離職創辦了諾因智能。一個主打家用智能機器人的具身智能品牌，選擇的技術路線也略顯小眾，合成數據。

諾因成立半年就完成了 3 輪融資，估值超過 20 億人民幣。許多人沖著他堅實的學術背景而來。

坦率地說，已經十分擁擠的具身智能賽道并不缺少天才，也不缺少技術路線，缺的是落地能力，至少是落地的可能性。

李銀川需要以一種和學術完全不同的方式證明自己是對的，但他非但不焦慮，反倒信心爆棚，用他的原話說，被 200 個人質疑拒絕，他也不會感到受挫。

下面呈現的，是一個極度樂觀主義者心中具身智能的模樣。

諾因版 L1 - L5 家庭機器人能力等級

這是李銀川第一次接受媒體訪問，為此他專程從深圳飛到北京。深冬的北京和深圳的溫差達到 20 多度，誘發了他的鼻炎，這讓他慢條斯理的說話言語中帶著一些鼻音。李銀川是安徽人，盡管之前曾在北京求學和工作過數年，但顯然，溫暖潮濕更適合他。采訪前一天他六點才睡，這似乎也是天才的一個普遍特征：晚睡晚起，作息并不規律。

晚點：網上關于你的個人資料很少，但論文超級多，乍看上去涉及很多主題，你怎么總結你這種復雜的學術背景？它們都和 AI 或具身智能相關嗎？

李銀川：論文也沒有超級多啦，其實我的研究都可以歸類為決策推理。從最早的信號處理開始，然后到強化學習和模仿學習，再到流模型、生成式方法，包括生成流網絡，它們都是決策推理大方向上的不同分支，本質都是在研究如何學習高維概率分布，在約束下高效采樣、組合 / 優化出新的可行解，在具身領域就是把生成與推理能力落到動作策略上。

2017 年 Transformer 出來那會兒我還在研究強化學習，當時它和 NLP 大模型幾乎是兩條平行線。2020 年做聯邦學習和分布式訓練研究的時候，我開始嘗試訓練一些大模型。

晚點：轉向訓練大模型的過程困難嗎？或者說，這對你來說是一種研究主題的轉變嗎？

李銀川：我覺得更像是工具和范式升級，其實從早期做信號處理的時候就開始用機器學習和深度學習了，所以你能看到早期很多做 AI 的人都是信號處理轉過去的，它們之間的理論是相通的。

Transformer 的出現改進了傳統深度學習架構的缺點，讓基于文本和圖像訓練非常大的模型變得可能，但決策推理領域在 2020 年的時候并沒有這樣一種架構范式。

晚點：在決策推理領域，事情朝著什么方向發展了？

李銀川：當時決策推理有一個重要技術流派是強化學習，但人們逐漸從理論和應用上都發現它有一些局限性，在求解非常大規模問題的時候，它的探索復雜度太高了。

除了強化學習，別的流派還包括模仿學習以及流網絡，但逐漸地有個趨勢變得越來越明顯，大家的研究目標不約而同開始朝著構建一個生成式決策大模型發展，一個好的決策模型應該把策略知識都學進去，就像語言模型能夠生成新的內容那樣，決策模型生成新的動作。

晚點：聽上去就是 VLA 了。

李銀川：可以這么理解，但我更愿意叫它 “生成式決策大模型”，它的概念范圍比 VLA 更廣。

當時構建這種模型有很多思路，其中一種是把流網絡和強化學習相結合，也就是生成流網絡。它不像傳統強化學習那樣只追求一個最優動作，而是通過學習完整策略分布，采樣出多種可行的方案，探索效率能夠提升很多倍。

還有一種是模仿學習結合擴散策略（diffusion policy），這部分技術一定程度上促進了早期具身 VLA 架構的誕生。

晚點：當時這種架構最大的缺點是什么？

李銀川：很多早期 VLA 模型實際上還是依賴擴散策略的模仿學習能力，本質上是把人的操作軌跡給背會。數據覆蓋足夠的時候會表現很好，但數據不足的時候就容易變得不穩定，一旦遇到訓練分布之外的組合、長鏈條任務里的意外分支它就比較吃力，它更擅長 “復現做過的動作”，因此泛化到復雜場景比較吃力，不是一個能涌現能力的架構。

我們一直在做的，就是把更多生成式決策思想引入 VLA 架構，讓模型不僅學會模仿，還要學會在約束獎勵下建模和采樣動作分布，把動作片段做可組合的表征，再通過后訓練把多種能力進行對齊，逐步逼近具身決策大模型應有的能力形態，也就是在復雜場景下執行長鏈條任務的泛化能力。

晚點：我看到了一個你們內部的材料，劃分了具身智能 L1 到 L5 能力范疇，這是你寫的嗎？

李銀川：是我自己做的，因為現在行業內還沒有一個對具身智能標準的公認的劃分方法。不過這個也算不上是原創，主要對標了自動駕駛領域的劃分方法。

具體來說：

L1 （輔助操作）：以遙控操作為主，能在遙操作機器人時提供基礎輔助，這也是當前行業內用動捕、手柄等技術遙操作機器人的主流形態；

L2 （簡單能力、隨時接管）：這個階段的機器人可以模仿人類完成特定動作，能實現一些看似酷炫的功能，但需要人一直守著；

L3 （長鏈條執行、待命接管）：最具商業價值，此階段人只是待命接管，而不是隨時接管的狀態，機器人可以自主、長鏈條的去完成一些任務；

L4 （系統運行、無需接管）：機器人可以完成限定場景內的各種各樣的復雜任務，是無需接管的；

L5 （完全智能）：是無需任何干預，機器人可完成任意場景下的各類任務，真的和真人一樣。

晚點：諾因的技術現在處于哪個階段？L3 嗎？

李銀川：按照我們的技術路線，可以到 L3，現在是從 L2 到 L3 跨越的關鍵階段。現階段機器人已經可以在特定場景和任務下，實現閉環執行，人只需要待命接管。

晚點：這意味著模型一定要有泛化能力。

李銀川：在我們的定義下肯定是這樣。沒有泛化能力，根本無法實現長鏈條任務的自主閉環和執行嘛。

晚點：這條技術路線，長遠看會通向 L5 嗎？

李銀川：我覺得這更像一個偽命題。L5 會不會出現，不僅要看技術能力，還要看它的商業價值，如果沒有商業價值了，盡管技術上能實現，它也永遠不會真正走向市場。比如 L5 的自動駕駛真的會出現嗎？不一定吧。

晚點：為什么不一定？

李銀川：越往后遇到的是越極端的長尾場景，投入會越來越大，但帶來的用戶價值增量未必成比例，當消費者不會為它買單的時候，它就不會到來了，比如停在 L4 階段，或者后面的進步非常緩慢。

晚點：你是說邊際效率遞減對么？

李銀川：對，當然在具身上這個問題并不是絕對的，我只是說 L5 也有可能不會到來。至少目前來看，沒有哪家公司會把研發 L5 級別的具身智能作為目標，這就有點不著邊際了。

晚點：在具身領域，大家對什么是端到端莫衷一是，說什么的都有，你怎么看這個問題？

李銀川：因為缺乏標準定義。端到端這三個字，你可以指訓練端到端，也可以說模型架構端到端，但在模型架構上，除非你只用一個 Transformer 結構解決所有問題，不然你很難說任何 VLA 模型是純粹的端到端。

晚點：總結起來，諾因機器人上應用的會是一個端到端的具有泛化能力的生成式決策大模型，而不是分層模型，對么？

李銀川：非要這么劃分的話，是的我們會偏端到端。因為其實現在很難說還有純粹分層的架構了，打個比方，即使是分層的架構，在工業落地的時候大家還是會做一系列后訓練，那么它就還是一個端到端訓練的模型。

“你沒法證明你的直覺是對的。”

晚點：什么時候下定決心出來創業？

李銀川：GPT-4o 發布。

晚點：當時你還在華為。

李銀川：對，創業想法我其實很早就有了，但博士畢業后我還是想在 AI 領域積累更多經驗，在當時諾亞研究院是國內公認的最好的 AI 研究院之一，我就加入了諾亞，一直工作了 5 年。

晚點：在華為的時候你主要負責什么？

李銀川：我加入的是決策推理實驗室，規模相當大，這和其他公司不太一樣，因為華為有很多業務都和決策推理、強化學習等技術高度相關。

晚點：聽說你在華為內部拿遍了員工能得的主流獎項。

李銀川：我做事追求全力以赴，在華為績效一直都挺好，確實也拿了很多獎。 ChatGPT 大火那一年，公司讓我成立了新項目組，開始專注做生成模型相關研究，所以也可以算是吃到大模型爆火的一波紅利吧。

晚點：你的項目組主要做什么？

李銀川：這個項目組叫生成模型理論項目組，方向之一是 AIGA，最后一個 A 就是 action，所以我們重點關注如何基于生成式學習來生成動作，它的應用范圍很廣，包括自動駕駛、具身智能等多個領域。

其實在 23 年早期我就提出過類似后來 OpenAI o1 推理架構的想法，因為當時我在尋找 AIGA 在大模型訓練上的應用方向。

晚點：但這個方向最后沒有推進下去。

李銀川：有很多原因吧，具體就不展開了。歸根結底很多時候你沒法證明你的直覺是對的，對吧？

晚點：你認為你有一種準確地技術直覺。

李銀川：對，因為我一直在這個方向上做研究，對行業的技術發展趨勢有自己的判斷和積累。其實最拼的那段時間就是 23 年，當時經常處于一種特別興奮的狀態，很長一段時間每天只能睡 3 個小時，看各種論文，有點像追漫畫，論文一更新，我就拿來讀，讀得多了之后，一篇新論文只需要幾分鐘我就能抓到重點了。

晚點：說回來，為什么 GPT-4o 讓你覺得可以出來創業了？

李銀川：因為它解決了一直困擾我的問題，那就是具身的數據來源。很多人覺得合成數據就是生成逼真的畫面，但機器人需要的不是好看的圖片，而是能學到動作的數據。

GPT-4o 模型已經能夠理解和生成具有物理結構的內容，指令遵從性也非常高，只要在具身場景下做進一步提升，從中提取動作相關的信息是可行的，這讓我覺得用合成數據做具身這條路可以走通了。

當時 GPT-4o 的吉卜力風格特別出圈，說實話我還挺驚訝的。

晚點：連你也沒預料到進步會這么快？

李銀川：對，當時確實沒有料到。我們當時還聚焦在研究大語言模型上，突然發現多模態能力都已經開始快速涌現了。

晚點：你沒有想探究一下它能力提升的原因嗎？

李銀川：原理我是大概知道的。GPT-4o 能做到這么出色，不是因為某一篇論文提出了一個劃時代的技術，而是依靠背后龐大工程團隊的技術整合能力和工程落地能力，把各類前沿技術進行了高效融合和落地。

晚點：總結起來邏輯就是多模態模型可以生成高質量合成數據，它們能被用來訓練具身模型。

李銀川：對，要用模型生成具身數據，而不是人采集具身數據。這是我們基于這代多模態大模型摸索出的全新技術和數據路線，目前行業內還沒有形成廣泛共識。和大部分具身公司基于自動駕駛的技術體系不一樣，而我們是完全圍繞多模態大模型和家庭具身場景，打造的專屬體系。

晚點：為什么人采集具身數據不行？

李銀川：這和我們的創業方向有關，諾因是一家專注 To C 的具身智能公司，機器人會進入家庭。你很難想象讓機器人走進 1 萬個家庭采集遙控操作的數據吧？仿真數據也是，它需要很精細的物理建模，還要投入大量的人力去標定仿真數據，這在復雜的家庭環境下實現成本太高了。

晚點：成本高不意味著不可行，如果模型最終出現了很好的泛化能力，成本高一點也是可以接受的？

李銀川：首先，我們做的是 To C 產品，這些成本最終都會疊加到產品的售價上。其次，模型的泛化能力并不是憑空出現的，一定是數據足夠多，質量足夠高才可以。

好的數據就像好的模型架構一樣，必須簡單、可擴展，合成數據恰好有這樣的特點，同時成本更低。這會讓其它的數據采集路線雖然理論上可行，但最終會失去商業價值。

晚點：訓練數據都采用生成方式，不會容易出現過擬合的問題么，出來的數據都太類似。

李銀川：為什么你覺得真人采集的數據就不會過擬合呢？其實在實踐中你會發現，你很難教會一個人什么叫采集 “非同質化” 數據，比如倒水這個動作，真人采集 1000 條數據，最終 90% 對模型來說可能都是類似的，因為他很難每次都做出非常不一樣的動作、產生很大不同的變化。

但合成數據可以做到，只要工程能力足夠強、生成質量足夠高，就能把數據差異化做得很大。另外這里還有一個對模型能力的理解問題，不是隨便變就叫多樣性，有些維度上的變化對模型泛化幫助很大，但大部分的變化都是有害的，我們花了不少時間去找到這條邊界。

晚點：諾因生成數據的模型是怎么做的？

李銀川：現在沒有一個拿來就能生成高質量家務操作的模型，所以我們在針對具身任務微調開源模型。

晚點：這個東西聽上去沒有很難。

李銀川：聽起來就是正常訓練大模型的那些技巧，對我們做過的人來說可能不難。當然我們現在敢出來講，肯定這里面還是有非常非常多 know-how 的，核心難點不在于訓練模型，而在于定義什么是好的合成數據。

模型生成的是像素，但機器人從中學的是動作策略，這兩者之間的橋怎么搭，目前沒有現成答案。我們的合成數據針對的是我們自研的具身決策大模型架構，它們結合起來門檻就非常高了，我們走了非常多彎路。

晚點：你們不是才成立了半年多時間嗎？

李銀川：大模型時代每個月都能算是一個技術新周期了。你會不會覺得 GPT-5 已經到來很長一段時間了？其實也才半年多。

晚點：你提到了好幾次技術和成本效率之間的關系，你是不是很早就想好了要創業？

李銀川：我 20 歲就開始準備創業了，而且明確定的就是 30 歲下場。

晚點：那要是 30 歲等不到風口怎么辦？

李銀川：其實風口來的更早啊，如果是做大模型的話 23 年就是很好的時機了。當時沒做，一來是因為大模型并不是我最擅長的方向，二來我覺得做大模型很難跟大廠競爭。

晚點：大模型很難跟大廠競爭，機器人呢？

李銀川：To C 機器人完全可以呀，它屬于消費電子賽道，商業模式和大模型完全不一樣。消費電子是做出一個好產品賣出去就能賺錢，這個賽道不存在壟斷。不管是初創公司還是大廠，消費電子想做好還是要聚焦產品，所以從第一性原理上來講我們并沒有什么劣勢。

晚點：你從什么時候起想要做機器人的？

李銀川：我從小就對機器人比較感興趣，本科讀的就是電子工程，對硬件和算法都有一定的了解和積累。整個 AI 學科，如果非要我選一個最擅長的領域，那確實就是具身。我以前挺喜歡搗鼓電路板這些東西的，讀博時我還參與過一個雷達產品的研發。

不過讀博參與項目對我沖擊更大的還是周圍的同學，當你親眼看到一幫通過自己努力成功創業的人之后，你會意識到成立一家公司并不是遙不可及的。

晚點：但是據我所知你在美國曾有一次創業經歷，和機器人沒什么關系。

李銀川：一個基于強化學習的量化軟件，最后賣給了一家投資公司。

晚點：為什么沒有延續這個創業路線？

李銀川：純粹做技術研發，如果要給更多人提供價值，那賣掉是正確的選擇。第一次創業我就發現了這一點，做個技術把它賣掉，確實能賺一些錢，但似乎對這個世界沒什么改變？我還是想做一個真正能改變世界的偉大公司，這需要足夠大的市場規模，也就是 To C 市場。

晚點：大家都在說機器人進工廠，基本做的都是 To B 生意。

李銀川：我認可工業場景先落地，這點沒有問題。但真的很少有公司能同時把 B 端和 C 端業務都做好，華為是很少數的個例。我還是更愿意做規模更大的市場。

晚點：后面的事就是在等風口了。

李銀川：對，我之前一直沒有想清楚 To C 到底要怎么做，比如訓練數據怎么收集？就像前面說的，雇很多人走進家庭去采集數據我覺得肯定不行。等到 GPT-4o 出來，數據的事情比較清晰之后，創業的決心就比較堅定了。

不像人的家務機器人

諾因機器人原型機，來源：諾因。

晚點：考慮到你的背景，To C 市場你之前的經驗并不多，對吧？

李銀川：人要追求進步，要學習嘛。

晚點：就你個人來說，你覺得最需要進步的是什么？

李銀川：需要去學習很多 To C 產品定義相關的事，不然很多時候會想當然。比如，你覺得機器人價格多少是合理的？如果一個家務機器人賣 10 萬塊，你愿意買嗎？

晚點：當然不買啊。

李銀川：所以你看，真的不能想當然，不同人的想法真的差異挺大的。

晚點：你難道覺得 10 萬塊這個價格合理？

李銀川：沒有到十萬，但最開始我確實覺得大家愿意花更多的錢買一個家務機器人。汽車十幾萬、幾十萬的都有人買，那如果一個足夠強的家務機器人，能給你做好多個領域的家務，每天都能用到，對標保姆的話，貴一點應該也是有人買的。

晚點：什么讓你改變了這個想法？

李銀川：這就是產品定義我需要補課的一部分。消費電子產品定價不能簡單根據已有功能的強弱定價。

晚點：那應該怎么定價？

李銀川：跟成本掛鉤。如果售價比成本高出太多，那一定會出現一家公司賣的比你便宜，然后你就失敗了，盡管對方功能可能并沒有你好，但它足夠便宜。

晚點：怎么定義 To C 家庭機器人的功能好？

李銀川：至少有一個功能，讓用戶每天，或者至少每周能用個幾次，而不是放在那里吃灰，這就是好。

家庭是機器人最大和最難的場景。我比較擅長算法，肯定要做最難的事才能發揮自己的優勢。諾因正在關注的家庭高頻場景大部分是清潔相關，比如案面清潔、洗衣服等，此外還有像老人孩子的照顧，寵物照顧清潔這些同樣比較高頻的需求。

晚點：洗衣服包含大家喜聞樂見、最愛展示的折疊衣物環節對嗎？

李銀川：我們想的是從拿衣服開始，到把它放到洗衣機里，洗完然后晾曬，一個完整流程。

晚點：上面你提到的這些需求，每一個聽上去都很難。

李銀川：是的，實際做起來也不容易。

晚點：你答應的蠻干脆的，這些 L3 級別的任務諾因目前完成到什么程度了呢？

李銀川：我們認為技術路線是收斂的，也就是說這些事情是可以做到的，只是還需要一些時間把它做好。

晚點：這個技術路線收斂的判斷是你做的嗎？

李銀川：我做的判斷，然后大家也會有共識。其實去年注冊公司的時候我就做了這個判斷了，大概在 7-8 月份，這半年技術上的進展和我們的預期是相符的。

采訪時李銀川給我們展示了兩段視頻。一段是機器人在一個橫向放置宛如桌子的電視屏幕上疊衣服，電視同時在播放著五光十色的視頻片段，而機器人旁邊還有包括迪斯科燈球在內的各種復雜光源。機器人依舊可以順利折疊任意形態的衣服。另一段視頻里，機器人在調節洗衣機的旋鈕，李銀川說，諾因的機器人已經可以做到精準控制洗衣機操作旋鈕的角度。任意形態、任意背景、任意光照條件下的泛化，這種能力，根據李銀川的說法，完全來自使用足夠多的合成數據。

晚點：聊了這么久，還沒說你們的產品形態。第一款產品是什么樣子的？大概多久會上市？

李銀川：第一款是基于輪式底盤，沒有上靈巧手，預計明年開始發布，然后用大概半年時間量產交貨。Sunday Robotics 之前的視頻挺火的，給大家帶來了一些想象，我們已經有一些類似但不一樣的設計概念了。

晚點：一個老生常談但又不得不問的問題，為什么是輪式？

李銀川：家庭一定是輪式的，雙足太容易摔倒了，而且續航、噪音也是問題，輪式可以放更大的電池，也更安靜。

晚點：除了產品價格，還有什么產品定義上和你之前想得不一樣的地方嗎？

李銀川：有一個思路上的不同，就是應該用做加法的方式做產品，也就是說當你為了達到某種能力必須加東西的時候再給你的產品加，除此之外，你應該努力還原家庭機器人最極簡形態，這也方便我們全棧自研，整合硬件與供應鏈系統。

晚點：舉個例子？

李銀川：比如在操作感知上我們是純視覺方案，沒有結構光或激光雷達。不是說它們完全沒用，而是價格確實很貴，我們在算法上做了很多額外工作試圖彌補沒有結構光和激光雷達造成的問題，最后發現這條路是可行的。

當然，這和我們的技術路線也有關系，我們本來用的就是純視覺的合成數據，從第一性原理來講視覺信息就是足夠的。

晚點：我知道你們有一位聯創來自大疆，這種做加法的理論算是大疆的方法論嗎？

李銀川：這確實是他給我講的，我想應該算是吧（笑）。第一款機器人不上靈巧手也是這個原因，現階段夾爪就能把家務做得很好，所以暫時不需要靈巧手。

晚點：大疆方法論還有什么讓你印象深刻的地方？

李銀川：我是和他們聊才知道，產品的外觀設計是一套可以在白板上寫公式的方法論，我第一次看的時候特別震撼。哪些設計必須有，哪些是附帶的，加上之后會對整個外觀的函數造成什么影響，這是可以算出來的。產品設計最終是需要找到一種平衡，而不是拍腦袋覺得某個東西好看或者不好看。

晚點：那有什么功能或者產品設計讓你印象比較深刻？

李銀川：現在還在比較早期階段，我可以貢獻一個已經被否了的產品設計。我聽音樂的時候比較在意音質，所以一開始我想這個機器人是不是可以放個高品質音響在里面，我看電影的時候在旁邊放音樂。

晚點：因為不符合加法方法論而被否了，是么？

李銀川：在家里看電影用專門的外置音箱可能還是一個小眾需求。

晚點：創業之后你有沒有發現自己的產品 sense 相比技術直覺差很多嗎？

李銀川：我在進步（笑）。我確實之前沒做過 To C 產品，但從我這半年的進步來看，我覺得我學習能力還是可以的，而且我的產品團隊非常強。

晚點：明年機器人發布，會解決剛才我們提到的那些任務，主要圍繞清潔相關家務展開，當然也包括洗衣服對么？

李銀川：我們在往這個方向努力，目前看應該可以。

晚點：換句話說，明年就是你們預計技術上可以攻克，產品上完全準備好的時間節點。

李銀川：對，我們預計是一年多的時間。

晚點：最終，諾因的機器人在家庭中會是一個什么樣的存在？

李銀川：第一款產品我不希望大家把它當做一個家庭成員看待。如果是家庭成員的話，那意味著存在感很強，也不匹配現階段具身的能力，現階段它只是一個做家務的機器人，不是保姆。所以我們希望它存在感盡量低一點，該工作的時候工作，大部分時間休息。它升起來大概一米六左右，降下去一米二三的樣子，尺寸也比較適合中國家庭，因為大家的房子普遍還沒有那么大。

晚點：你更希望大家把它看做一個工具產品，而不是機器人？

李銀川：我希望大家把它當做一個聰明的，能為你做事的產品，主打家務功能，附贈情緒價值。

被 200 個人拒絕的極度樂觀主義者

晚點：你們融資速度非常快，成立第一個月就融資了，第二輪估值就翻倍，但即使現在，合成數據都不能說是個主流的方向，你怎么去說服投資人？

李銀川：最早的時候大家可能覺得我在吹牛，但我們進展真的非常快，非常迅速，大家一看演示就知道，很多人被我們的速度震驚到，所以我們融資上確實沒怎么費力，反而因為估值漲的比較快還被抱怨過。

晚點：這算是凡爾賽吧 … 成立時間這么晚，你怎么跟投資人解釋諾因和其他公司不一樣的地方？

李銀川：我們極度聚焦在技術和產品本身，從最開始十幾個人到現在 100 人的規模，我們都很像蘋果早期 Mac 開發團隊，組織架構圍繞著產品在快速迭代，非常扁平。

晚點：你個人覺得有什么短板需要補嗎？

李銀川：最大的問題可能是時間不夠用，除此之外，我覺得只要一直保持學習，所謂短板都是可以補上的。

晚點：感覺你創業之后好像更快樂了？

李銀川：因為每天都有正反饋，很多時候都興奮地睡不著覺。我從小就不太喜歡按部就班死記硬背，所以我偏科很厲害，學生時代最快樂時間段是讀博之后，因為有很多自我探索的時間，再有就是現在創業。

晚點：除了快樂，感覺你也不焦慮，盡管具身智能是一個競爭這么激烈的賽道。

李銀川：因為我在做正確的事情，這方面我極度樂觀。舉個例子，如果你去創業的話，聊 100 個人，99 個人都在質疑你，你會受挫嗎？

晚點：正常人都會吧。

李銀川：我完全不會。我們早期招人的時候，很多人都不認可我的技術路線，會遇到非常果斷的拒絕，但這完全不影響我第二天依舊能量滿滿的繼續和人聊。最后，聊多了你就發現，這個行業里真正頂級的，技術非常強的人我們是會聊得來的，會認可我的。

晚點：但還是拒絕了你。

李銀川：哈哈哈哈對，各種各樣原因拒絕的都有，我早期可能聊了 200 個人都被拒絕了。

晚點：你就沒有一個心理調適的過程？這是自信還是你非常確定你就是對的？

李銀川：因為知道自己是對的，所以被拒絕或不認可真的不困擾我。這實際上還形成了一個雙向篩選，真正有技術判斷力、最頂級的人最后反倒是被我們的愿景和技術路線打動加入我們了，因為大家對技術的理解真能聊到一起去，所以諾因現在團隊的人才密度和技術水平說實話超出了我最初預期。

晚點：基于你非常自信的這個視角，你怎么看 2026 年具身智能的競爭格局？

李銀川：我覺得 2026 年不聚焦落地或者沒有落地能力的公司就不太會被關注了。合成數據這個方向會有更多的玩家出現。

我算比較早出來融資講具身智能 To C 可以做以及怎么落地的人，所以可以說諾因確實在 To C 上有先發優勢。

晚點：這個先發優勢能維持多久？

李銀川：就像之前說的，首先，這里面積累了很多 know-how，就算競爭對手完全知道了技術路線的細節，那也要花半年到一年的時間才能追上來。其次，前面也說過，合成數據并不適配所有技術路線，這是和我們生成式決策的架構高度綁定的，這方面的門檻很高。

晚點：你該不會要給我說，其實你心目中諾因的競爭對手只有自己吧？

李銀川：我們真的不跟外界比，因為真的很聚焦產品本身，它是一個世界上還沒有的產品，所以你也沒法從別人身上學到現成的答案。現在最大的問題是如何讓團隊里來自不同背景的人充分協調配合，發揮最大創造力，只要你做到最好了，其實也就不用太關心外界了對不對？外界最多也就是和你持平。

晚點：諾因現在規劃中的機器人產品是從 L2 到 L3 的過渡，那再往前一步的技術會是什么樣的？需要新的范式轉變嗎？

李銀川：我其實已經想好技術的轉變會在什么時候發生了，我面試許多候選人的時候也會深入聊這些細節。但是大模型技術進步太快了，現在我們預料兩年后該做什么，那它大概率不會發生，或者到時候已經不是最優解了。

晚點：還是可以大概說一下吧，讀者也會好奇的。

李銀川：這就純猜了哈，比如我們最終產品賣出很多臺后，收集了大量真實數據，屆時我們會有一種更涌現的架構，把所有的家務技能重組編排，然后訓到基座模型里面。

晚點：它和現在的技術路線區別在于一個是合成數據一個是真實數據？

李銀川：在于泛化能力不同，現在的模型已經可以精確操控洗衣機了，但如果你讓它炒個菜它還是不行的。最終具身大模型會從生成新動作轉向涌現新技能，因為人是可以觸類旁通生成新技能的。

晚點：現在的模型依舊圍繞在特定場景執行特定任務。

李銀川：圍繞特定難度的任務。像炒菜這種非常復雜、對安全性要求很高的任務我覺得目前還是泛化不了，現在能夠實現一定泛化的任務難度還是可控的。

晚點：因為合成數據的原因，你們對模型架構做了一些調整，但未來總的來說還是以 Transformer 架構為主導。

李銀川：是這樣的，其實現在大家也都在這樣做。

晚點：具身智能領域同樣也會遵循 Scaling Law （縮放定律）對么，會突然涌現么？

李銀川：我們內部的 Scaling Law 曲線已經繪制半年了，每月都會更新進展，但它和涌現不太一樣。這條曲線讓我們可以預判，再投入多少數據、在什么任務上能獲得多少能力提升，這也是我們敢說技術路線收斂的依據。Scaling Law 是說數據量和模型能力以及準確度之間的關系，涌現是說模型出現了意料之外的泛化，比如模型本來是做清潔任務，突然就會做菜了，這種現在的技術還看不太到。

題圖來源：諾因智能

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.