![]()
編輯|吳昕
第一次見到「愛學」前,王佳佳(化名)害怕和老師互動。
這個來自安徽阜陽的初三女生,性格內向,在課堂上幾乎從不舉手。題不會,不敢問,寧愿空著;一被老師點名,就緊張到大腦一片空白。久而久之,數學和英語成了她最不愿面對的兩門課。
直到有一天,她開始反復和一個「不會不耐煩」的對象對話。一句沒聽懂,就一直追問,直到徹底弄清楚。對方有表情,會根據她的反應實時調整講解節奏,也會在她猶豫、走神時主動追問,把她拉回來。
慢慢地,王佳佳敢開口了,學習也變得主動。最近一次數學隨堂考試,她考了 103 分,比上一次整整提高了 40 分。
「愛學」所承載的并不是一位真人老師,而是一個真人級 AI 導師。
2025 年初,成立不到兩年的首批 AI 原生應用企業與愛為舞率先落地了國內首個真人級 AI 一對一導師產品「愛學」。App 上線不到一年,已經被超過百萬名學員真實使用。
單次課可能持續 1—2 小時,沒有任何真人介入,完課率卻高達 92.4%。單個學員的最長學習時長已達到 9000 分鐘。
在 AI 課堂中,單次課的答題正確率也從 59.1% 提升至 83.2%。
![]()
學員小蘋果學英語,進步明顯。
AI 導師,拒走「答題」老路
放眼當前的 AI 教育市場,大模型似乎成了基礎設施,但真正意義上的突破,卻遲遲沒有出現。大量產品仍停留在「舒適區」——
把 LLM 「套進」學習機或 App ,當作一個更聰明的聊天機器人來用。它擅長預測下一個 token,卻沒能走進教學本身。
最常見的使用方式是被大量用于搜題、批改。用戶卡題了,點一下 AI,答案瞬間生成。所謂「講解」,只是堆疊冗長而晦澀的推理鏈,對低齡用戶來說如同天書。好一點的情況,會調用提前錄制好的人類視頻,但交互為零。
例如,一個常見的語法題:My sister plans _____ (meet)her teacher after school tomorrow. 這里的 meet 應該填什么形式?
很多 AI 的回答只是就著答案做解釋(尤其像 AI 拍搜):
1.答案:to meet
a.核心原因:固定搭配+非謂語動詞用法
b.動詞plan的固定搭配規則:plan + to do sth.,即計劃做某事
2.語法邏輯解析:
a.plan作為謂語動詞,后面需要接“賓語”來表示“計劃的內容”
b.英語中,動詞原形(meet)不能直接做賓語,需要通過不定式(to+動詞原形)構成不定式短語(to meet her teacher),才能充當plan的賓語,表示“計劃的具體動作”
更常見的是打著「AI 課程」旗號的產品,本質仍是錄播,AI 交互淺到幾乎可以忽略。這些產品解決了「有教」的一部分,卻仍難以觸及「會教」,更別提「因材施教」。
要將 AI 真正引入教育,必須在「教學」這件事上下功夫。與愛為舞認為,新一代 AI 教育范式應該因材施教、授人以漁。這套判斷,來自一支典型的「互聯網大廠× 頭部教育」跨界團隊。公司創始人兼 CEO 張懷亭,曾擔任百度商業化系統「鳳巢」核心負責人、高途聯合創始人。創始人兼 COO 劉威,曾任高途集團副總裁、高途課堂總經理。
就拿前面那道英語題來說,為什么是to meet,而不是其他形式?
「授人以漁」的 AI ,不會一上來就告訴你答案是to meet。它會先判斷學員卡在哪一層,是不是沒搞懂非謂語動詞?
隨后,通過追問與對比引導學員自己發現:plan表達的是尚未發生的計劃動作,英語里通常用to do來承載這種未來意圖。
再通過舉一反三讓學員理解共性規律。當遇到plan / decide / hope / want這類動詞時,不必死背搭配,也能判斷該如何表達。
近兩年,AI Agent 概念大熱,市場上也出現了一對一 AI 導師的雛形,但仍局限在英語、數學等單一學科 。相比之下,「愛學」已實現全年齡段覆蓋、「多學科 + 長課時」深度陪伴。
而支撐這一跨代產品的,是自研的國內首個 AI 原生教育框架——一個打通了「數字人 + 語音 + 大模型 + 工程」的全棧技術體系。與愛為舞也因此成為國內首個在教育場景下打通全棧技術能力的公司。
那么,一個好的 AI 導師是如何煉出來的?
![]()
「愛學」背后的全棧技術能力。
「筑魂」:
從 ChatBot 到 MDP 決策
為了打造一個真正「會教」的 AI 導師,與愛為舞自研了三大基礎模型體系——從感知的「皮囊」,到負責決策的「靈魂」——完整覆蓋 AI 教學的核心能力閉環。
![]()
與愛為舞認為,一個優秀的AI導師需要具備上面四個方面的核心能力。
其中,愛學教育大模型,第一次讓 AI 擁有了真正的「教學之魂」,更是與競對拉開身位的關鍵賽點。
與市面上仍停留在預測下一個 token 的對話系統不同,「愛學」從一開始就被設計成一套實時教學決策系統——
「一對一教學」不再只是問答交互,而被抽象為一個持續演化的馬爾科夫決策過程(MDP),一次教學就是一場目標明確的博弈。
- 學員的狀態——包括理解程度、情緒變化、長時間猶豫等——被視作環境;
- 每一次提問、追問、提示、鼓勵與糾偏,都是 AI 導師可選擇的教學策略;
- 系統的獎勵,不再是「題對了+1 分」,而是學員是否真的學會了、學得更快、學得更開心。
因此,AI 導師每一次講解、每一次追問、每一次糾錯,都不是「接一句話」,而是在當前學員狀態下做出的最優教學決策
![]()
數學課上,學員和AI導師一問一答,互動學習。
為了讓模型真正具備「師魂」,與愛為舞設計了兩個進化階段:
- SFT(啟發式注入):不只是喂數據,而是通過思維鏈(CoT)將大量名師的隱性經驗系統化。它不只學「說什么」,更在學「為什么要這么教」。
- RL(強化學習進化):引入定制化 GRPO 算法。圍繞教學規劃的質量與靈活性構建 Reward 函數,讓 AI 在數億次的模擬試錯中,打磨出類似真人的「教學直覺」,做到因材施教。
![]()
AI 導師是如何煉成的?這是在真實課堂 + 仿真課堂中持續進化的完整數據閉環與訓練體系。
如果說模型架構決定了「導師素質」的上限,那么數據工程則構成了能力的下限。
與愛為舞沒有簡單堆砌題庫或對話語料,而是先搭建了一套可運行的 AI 教學環境,讓數據在真實教學邏輯中自然生長。數據被系統性地拆解為三層核心要素。
- 學科本體。通過構建覆蓋各學科的核心知識圖譜、關鍵考點與解題方法,將教材與考綱轉化為 AI 可理解、可調用的教學結構;
- 教學方法。通過名師參與課程設計,沉淀「為什么這么教、先講什么、后練什么」的課程邏輯;
- 真實課堂中的學員交互數據。這也是最關鍵、最稀缺的一層。學員的回答方式、猶豫與卡頓、追問與反饋,都被完整記錄下來,形成高價值的實時互動樣本。
三者共同構成一套「可運行的數字課堂」,也為后續模型訓練提供了區別于傳統題庫與對話數據的核心養料:不僅知道教什么、怎么教,更知道該如何根據學員狀態去教。
為補齊真實數據的稀缺與長尾問題,研發團隊進一步引入了類似 AlphaGo 的自博弈機制:讓「學員模擬器」與「AI 導師」在虛擬課堂中反復對弈,自生成千萬級訓練樣本。
真實課堂每周數萬小時的數據持續回流,驅動 SFT 與 RL 的高速迭代,形成一套穩定運轉的數據飛輪。
最終,具備教學判斷力的 AI 導師,得以在教學目標、教學路徑、課堂交互與作業鞏固上,實現真正意義上的個性化學習。
![]()
AI 導師從四個方面實現「個性化」施教:教學目標、路徑、交互與作業鞏固。
與愛為舞依靠真實的教學互動數據,通過數據飛輪,推動算法以周為單位迭代。目前已更新 20 多個版本,建立了業界首個在線一對一 AI 教學 Agent,全方位提升了教學效果。
1、持續優化互動頻次,每節課 AI 導師都能與學員進行幾十次的一對一互動,牢牢抓住學員的注意力。
2、持續優化互動質量,學員在一對一互動中的有效回答率提升到 95% 以上,說明學員的注意力得到顯著提升。
3、持續優化個性化教學質量,通過個性化教學目標和個性化教學路徑,將學員做題的準確率從不足 60% 提升到 83% ,部分課程正確率超過 95%,說明學員在集中精力學習之后,確實掌握了相關知識點。
重做「聽說」:
上下文 ASR +流式 TTS + 全雙工語音交互
在打磨「師魂」的同時,與愛為舞也在感知層完成了一次徹底重構。
原因并不復雜:教學本質上是一種高頻互動行為,語音是所有交互的第一道門檻。老師聽得準、反應快,學員才愿意繼續說下去。
傳統 ASR 只會「聽寫」,至于這句話是在教幾何還是教英語,一概不知。于是,因環境嘈雜或學員口音,「four」被聽成「for」,「D答案」被聽成「第一答案」,「有理數」被聽成「有禮數」也就不足為奇。
與愛為舞不再把 ASR 當作「聽寫」工具,而是把它升級為「課堂參與者」。自研多模態語音理解模型,在解碼最底層引入教學語境約束,讓「聽」從一開始就帶著教學目的。約束來自三方面:
- 教學任務(Task):如當前正在攻克哪一個知識點?
- 教學進度(Step):目前處于引入、練習還是總結階段?
- 學員畫像(Persona):學員此前的錯誤分布和表達習慣。
由于上下文信息直接參與解碼路徑計算,模型在第一時間就能排除那些在純語音層面「聽起來合理」,但在教學邏輯上完全荒謬的候選結果,ASR 準確率從行業最好開放能力約 80% 左右提升至 95%+
除了「聽懂」,AI 導師說話得有人味兒。因此,TTS 也被重做了一番。
自研流式 TTS 大模型將首字延遲壓到300ms 以內,通過語義/聲學雙 Speech Token + 強化學習聯合優化,讓語音能隨語境動態調整節奏、重音與情緒——講詩詞會留白,講推導會干凈利落,甚至能用少樣本快速對齊「名師腔」。
讓我們一起聽聽下面這段音頻,猜猜是真人還是 AI。
![]()
音頻鏈接:https://mp.weixin.qq.com/s/eNVVbsrzHfgscRRhq57yPQ
聽出來了嗎?下面揭曉答案:短短 18 秒的音頻,混合了 3 段真人音頻和 3 段 AI ,是不是完全聽不出來?
更關鍵的是,AI 導師還能被隨時打斷。通過全雙工語音交互,結合流式語義 VAD 與打斷拒識模型,實現真正意義上的邊說邊聽,說話過程中即可識別學員插話,打斷識別準確率 90%+
![]()
「肉身」進化:
數字人百 FPS 實時,不出戲
在課堂里,聲音與「人」必須嚴格同步。多數數字人 Demo,十幾秒足夠驚艷,但一旦拉長到 40 多分鐘課堂,就會迅速滑向「恐怖片」:
穿模、口型錯位、動作僵硬、抖動、表情漂移、聲音輸出和其唇部動作之間存在明顯延遲……
能穩穩 hold 住一整堂課的 AI 導師,對數字人技術提出了近乎苛刻的要求——極致的實時互動能力,以及長期一致性。圍繞這些目標,與愛為舞的數字人系統開啟了一次從 1.0 到 6.0 的瘋狂進化。
![]()
一旦 AI 導師出現卡頓,學習心流就會瞬間崩潰。為了把實時性做到極致,他們先在架構上做了徹底解耦——引入 NeRF 與 3D Gaussian Splatting 建模,構建實時驅動框架,將口型、表情、身體動作分離建模;音頻不再只是驅動嘴巴,而是在毫秒級聯動微表情與姿態變化,讓反應真正貼合課堂節奏。
再把性能推到百 FPS 級:系統不再「生成完再播放」,而是云端實時「存活」并持續輸出;并實現無需訓練的秒級生成,僅憑音頻輸入即可秒級生成高質量視頻,內容生產從「提前制作」走向「實時發生」。
在「一致性」上,核心策略只有一個:鎖定人格穩定性。
通過構建跨 ID 動作驅動體系,名師動作可穩定遷移;高精度骨骼提取保證復雜姿態下也不穿模、不崩壞,內容生產效率提升 5 倍。

基于真人動作捕捉與骨架識別,將手勢與姿態精準映射到虛擬導師,實現自然同步的數字人教學演示。
最新 6.0 架構進一步把語音、文本、動作、情緒與人物 ID 融合進統一多模態模型調度,即便 45 分鐘情緒持續變化,外觀一致性與動作分布依然自然如初,音素級口型同步也終于告別「永遠對不上的嘴型」。
鋼鐵骨架:
萬人并發,1–1.6s 即時響應
如果說,「師魂」決定教學邏輯,「皮囊」負責感知,那么,能規模化交付的底線只有兩個字:不崩。這意味著高并發、低延遲
現實很殘酷。傳統方案一旦沖到萬人并發,端到端延遲往往直接飆到 3 秒以上,交互體驗斷崖式下滑。而與愛為舞從零搭建的這套「 AI 課堂操作系統」,硬是把 ASR、教學決策、內容生成、TTS、數字人驅動到音視頻推流的整條長鏈路,壓縮到了1.0–1.6 秒萬人同時在線,依然做到即問即答
![]()
「愛學」如何真正跑起來?背后一整套工程系統,萬人并發下還能實時上課的端到端 AI 教學架構圖。
為了把時間一分一秒摳出來,他們做了幾項工程改造。
第一刀,砍在 ASR上。通過ASR 預判 + 并行執行,語音識別鏈路延遲被壓到 100ms 級。
第二刀,打斷意圖秒識。基于歷史先驗的意圖識別,判斷學員是不是要插話、追問、糾錯。整條打斷鏈路,1.6 秒內閉環,不會讓 AI 導師「慢半拍」。
第三刀,落在緩存體系,把「每問必算」改成「能不算就不算」。用 Prefill Cache 消滅重復計算,用語義 Cache 復用專家答案,真正把響應時間壓到人感知不到的區間。
如果說延遲是體驗底線,那成本就是商業底線。
數字人渲染,是典型的 GPU 吞噬型任務。如果一張 GPU 只能服務一兩名學員,萬人并發意味著服務器成本直接失控。
為此,他們一方面通過GPU 顯存全共享,榨干單張 GPU 承載極限。另一方面,通過統一調度「大腦」而非模型堆疊,在萬人并發下,對不同形象、不同語音素材進行毫秒級自動分配。
真正難的,其實在運營階段。當系統跑起來,一萬個學員就有一萬個進度。學習路徑高度碎片化,請求分布不可預測——這是任何 AI 教育系統的「噩夢」。
與愛為舞決定拆解「復雜性」——把教學拆成樂高積木一樣的零件,原本「隨心所欲」的交互,被重構為「按劇本執行」的自動化指令,復雜調度變得可預測、可收斂。
為對抗「意外中斷」,系統還引入可重入(Re-entrant)機制,保證 AI 導師不會「斷片兒」,隨時恢復狀態,陪你學。
在過去不到一年的時間里,像王佳佳這樣的變化,并不只發生在安徽阜陽的一間書房。它出現在佳木斯的清晨,也出現在三沙的落日里。有人甚至死磕同一節課12 次、交互 585 次,從「不知道」走到「全部知道」。真人級 AI 導師正在為天南地北的孩子,持續規劃各自獨一無二的學習路徑。
這不只是一次產品能力的展示,更是一種新范式的顯形:AI 以導師的身份,進入真實、復雜、對結果高度敏感的學習現場,并穩定發揮作用。它也為中國AI Agent 的規模化落地,定義了一套清晰的范式,甚至走在了世界前列。
當知識的獲取不再是刷題、排名與淘汰的賽跑,而是一段被理解、被引導、被尊重的旅程——學習這件事,永遠值得投入,也永遠值得期待。
文中視頻鏈接:https://mp.weixin.qq.com/s/eNVVbsrzHfgscRRhq57yPQ
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.