![]()
以下為演講實錄,經編輯:
大家下午好!我是來自即構科技的教育行業產品經理,我今天分享的主題是“RTC+AI,AI伴學開啟在線課堂新范式”。
即構科技是一家專注于RTC和AI領域的在線教育服務商。RTC是實時互動音視頻技術,我們通過實時音視頻技術為客戶提供音視頻互動通話,教育里面主要應用于在線課堂里面的直播、1V1相關場景。
基于我們20年的技術積累,截止到今天,我們服務了超過4000家全球企業,連接了超過5億終端的用戶,覆蓋200多個國家和地區。每天使用ZEGO RTC服務的用戶產生的日均互動時長超過30億分鐘,基于用戶體驗,我們適配了3萬多臺終端設備,覆蓋國內外各大廠商。
一、在線課堂
(一)從技術視角,看在線課堂演進的驅動邏輯
教育行業也是我們服務的重點行業之一。通過RTC和AI相關技術,我們為教育行業主要輸出了包括大班課、小班課、1V1、雙師課堂、超級小班等各類在線課堂的解決方案。也正是因為有這樣的一些積累,所以今天在這里,我們想從技術平臺的視角來分享一些對在線課堂的看法。
![]()
從技術的視角,我們認為在線課堂主要受三大核心力量的驅動。
? 市場需求:首先是市場需求,市場需求是核心的牽引,在不同的階段提出了不同的在線課堂的需求。
? 技術發展:底層是技術,技術是作為基礎引擎為我們的市場需求提供解決方案,同時技術的突破可以去推動教學理念的演進。比如早期的教學理念是以資源為中心,當移動互聯網直播技術的普及,把教育資源問題解決以后,教學的理念就變成了以學生為中心,今天又希望實時互動甚至AI相關的技術能夠為學生提供更好的個性化教學服務。
? 教育理念:教育理念的不斷變化同時在刷新著好課堂的定義,什么樣的課堂才是一個好的在線課堂?所以我們認為在線課堂就是在這樣一個循環里面不斷地發展。
在線課堂的發展歷程我們總結為大概四個階段。
1. 在2015年之前,在線課堂其實還是在解決教育資源的問題,主要是解決資源不均衡的問題。
2. 從2015年開始,主要是直播、實時互動、移動互聯網的普及,這個時候在線課堂才是真正實現了在線教學,也就是老師可以通過線上進行教學,而遠端的學生直接進入課堂之后和老師進行線上的互動學習。
3. 到2020年,在線課堂又邁入了新的階段,進入OMO線上線下融合、智能化的教學階段,智能硬件、AI等技術大面積應用。
4. 現在這個階段已經不再去滿足于當下的直播的這種課堂需求,而更多的是以學生為中心,想要追求個性化的教學和提升學習的主動性。
(二)實時互動在線課堂典型產品形態
![]()
從2020年開始,當下的在線課堂更多的是追求學生的個性化,我們想看一下今天市面上主流的在線課堂產品形態,它們在這個方向上做得如何。這里列舉了四個主流課堂場景:
1. 大班課:大班課的主要特點是普惠教育,它可以覆蓋足夠大的規模,但是大班課對學生的個性化關注幾乎沒有。
2. 1V1:和大班課截然相反的就是1V1,1V1是一個老師對一個學生,老師能關注到學生個體的意愿和訴求,可以因材施教。1V1可以滿足個性化的需求,但是需要大量的老師,老師的成本對教育機構來講是非常高昂的。
3. 小班課:介于大班課和1V1之間的課堂形態,小班課可以兼顧一定的個性化訴求以及課堂的氛圍。但是如果想要兼顧這兩者對老師的能力素質要求比較高,老師需要有很好的控場能力,所以老師的成本相對也是比較高的。
4. 錄播AI課:除了這三種真人老師和學生之間的形式,還有錄播AI課,錄播AI課是把學習的內容一次性制作進行無限分發。它的特點是可以做到規模和成本的極致,但是它也沒有辦法交付個性化的輔導。
所以我們可以看得到,當下在主流的教育在線課堂的產品形態里面,每一個場景都有自己的特點,但是其核心就是在成本、個性化和規模化之間找平衡點。
(二)傳統AI錄播課:邊際成本做到極低,但無法個性化教學
剛剛的幾個場景各有優勢,但是沒有辦法解決所有的問題,所以我們就提出一個問題,能否在追求普惠教育,也就是規模化的同時提升課堂學習的互動性和個性化?
![]()
這個圖表示在沒有AI之前的情況下,可以看到只有錄播AI課是真正可以把規模化和成本做到極致,但是它和個性化的方向相距甚遠,沒有辦法滿足個性化的需求。
稍微講一下錄播AI課,這是錄播AI課的學習流程。錄播AI課本質上是把完整的內容切割成多個片段,然后把這些片段和學生進行人機交互,學生可以在過程中學習內容,到了一定的時候,通過點擊或者是判斷,或者是一些人機相關的交互,可以進行反饋,然后在固定的流程里面會根據學生的反饋給到判斷式的反饋信息。它的特點就是一次制作標準的內容可以無限分發,把規模和成本做到極致,但也是因為它是固定的流程,所以在這個過程中學生沒有辦法脫離這個流程,也沒有辦法進行個性化的教學。
二、個性化AI伴學
(一)打造在線課堂新范式
沒有AI的時候我們很難解決剛剛那些問題,但是今天有了AI之后,我們探索了一些新的課堂形式。AI伴學,就是我們接下來要講的新的課堂形式,我們認為可以同時解決我們想要的規模化、個性化、成本之間的問題。
AI伴學是什么樣的課堂形態?
這是在直播課中的AI伴學形式,它的流程是,有一位真人老師在直播課中先進行在線教學,比如說今天是一節英語課,她教的是關于How often這個問題對應的詞匯。當真人老師需要和學生之間進行互動,來檢驗學習效果的時候,類似課堂演練的環節,這個時候真人老師可以通過控制系統,讓所有的學生都進入到一對一的對話彈框,在這個對話彈框里我們引入了AI的分身老師,剛剛一個彈框里面的老師其實就是真人老師的分身,通過AI老師和學生之間進行個性化的問答。在剛剛的視頻里面,學生剛開始沒有答出來,老師給予了一定的引導,等到學生回答以后老師給予了肯定。
這里面有效解決了三大問題:
1. 學生參與互動少。傳統的直播課里面如果想要互動只能是真人老師和學生之間通過連麥,真人老師可以選擇少數幾個同學進行連麥,其他同學只能眼巴巴地看著那些同學和老師連麥,可能只有羨慕的份兒,但是通過這種方式可以讓所有學生在同時課都可以參與這種互動,所以有效解決了學生參與互動少的問題。
2. AI老師是真正根據學生進行一對一的互動問答,并且給到他個性化的學習。
3. 在直播課中引入AI伴學這種產品形式可以即時知道學習效果。老師和學生包括家長可以在這種隨堂演練中,及時知道學生的學習效果,而不至于到課后練習之后才能知道學習效果如何。這就是AI伴學課堂方案,它是真正可以提供一種規模化、個性化的互動學習形式。
(二)業務能力根本性升華
我們把傳統的AI錄播課和新的AI伴學做一個對比,AI伴學不僅僅是交互技術上的變化,更多的是業務能力的根本性升華。我們總結了三個大點:
1. AI伴學對比傳統的AI錄播課是對整個教學模式的變化。傳統的AI錄播課核心是輸出標準性的內容,還是在賣內容,但是AI伴學其實只是和學習主題有關,但是不再拘泥于生成標準性的內容,是真正做到個性化的互動,它所售賣或者給學生提供的是服務,是服務學生的時間。
2. AI伴學和傳統的AI錄播課相比,我們給了學生自由控制的權利。大家不要小看這個自由控制的權利,自由控制的權利其實是對學生探索意愿和好奇心的保護。想象一下,如果我在一個傳統的AI錄播課中,對某一個知識點有疑問,但是如果這個時候流程沒有進入到提問的環節,你就沒有辦法對這個課程進行提問,從而解決你的一些疑惑。但是AI伴學的這種形式里面,你可以隨時隨地地給你的伴學老師進行提問,伴學老師給你反饋。這一點極大保持了學生的好奇心以及他對于知識探索的欲望。在傳統的AI錄播課里面,如果一而再再而三,讓學生想要了解知識的時候了解不到,會影響他的學習欲望。AI伴學可以讓學生有持續的學習動力。
3. AI伴學可以給業務機構形成護城河。怎么理解?傳統AI錄播課所能夠給機構帶來的數據最多就是判別式的數據,比如這道題學生答得對還是錯,但是AI伴學給教學機構帶來的是完整的對話,里面每一個環節都是對應數據,比如我們的學生在什么時候會發起這樣的提問,提的問題都有什么、分布是怎么樣的,學生的回答又是怎么樣的,大部分的學生在這個回答中是流暢的還是有一定的磕巴,這些數據都可以反哺教育機構、反哺我們自己的AI模型,讓我們的AI模型進行升級迭代,從而形成業務的護城河。
所以AI伴學我們認為是一個業務能力根本性的升華,它是一個真正意義上的教學新范式。
(三)個性化AI伴學——四大核心要素
AI伴學既然能解決這么多的問題,那么如何打造一個重塑業務場景的個性化AI伴學課堂。我們主要關心四大要素:
1. 互動體驗。自然流暢的實時互動是整個學習的基礎。
2. AI的“聽”和“答”。AI能不能像真人老師一樣及時性地理解學生提出的問題,并且準確地識別到學生所提到的關鍵詞,給到對應的內容。只有讓AI老師和學生進行正確的互動問答之后,你才能讓對話持續,否則學生提一個問題,老師已讀亂回,或者老師和學生各說各話,這個互動就沒辦法進行下去。
3. 學習效果。學習效果評價有兩個方面:一是AI老師的專業性,專業性一是來源于大模型的設定,二是教學知識庫相關的處理。還有另外一方面就是,AI是不是冰冷的AI,AI是不是有感情的AI,它也會影響學生的學習效果。比如我們的AI老師能夠給學生回復的內容上,除了準確以外,還可以給予一定的情緒價值,比如說鼓勵學生大膽開口,鼓勵學生勇敢地回答,對于正確的答案給予一定的認可價值,都是能夠提升學習效果的。
4. 性價比。能不能低成本、大規模的落地。今天成本是所有教育機構面臨的核心問題,所以我們希望技術方案能夠給教育機構不帶來額外成本的情況下真正做到落地,讓千萬學生真正能夠得到受益。
(四)即構AI伴學在線課堂方案
我們提供了什么樣的技術能力來實現剛才所說的四大要點?
![]()
1. 實時流暢的對話
第一,業界領先的RTC服務,保障AI的穩定性與實時性。
我們在RTC領域持續積累了近20年,這里是我們幾個關鍵性指標,第一個指標是我們為全球所有的用戶可以提供200毫秒的超低延時的全球實時互動。這個數據是什么樣的含義?今天人和人之間的溝通,比如我站在這里,你站在我旁邊,我說一句話,你聽到的時延大概是300-400毫秒,200毫秒以內完全是一個擬真的場景,完全感知不出來有距離,這是RTC的能力。RTC即使結合了ASR、AI、TTS等相關的處理環節,我們也可以提供在差不多1秒左右的端到端的AI互動對話體驗,1秒左右基本上等同于人和人之間,我提了問題之后,你稍微思索一下,然后回復我的時延。國內外廠商終端的適配數量我們剛剛也提到了,我們大概適配了3萬家國內廠商的終端適配,這點可以保障我們所有的學生,不管是什么樣的機型,都能夠有一致的互動體驗。最下面的兩點是我們自己全球的MSDN海量有序網絡和節前情況,我們在全球覆蓋500+的節點,為全球所有的用戶提供穩定的網絡服務。
2. 準確、擬人的互動
第二,我們希望可以提供提供一個更自然擬真的AI互動對話體驗。
這里就用到我們自研的AI音頻處理能力,我們的AI音頻處理可以讓AI像真人一樣反應快、聽得準、說得清。大家看到音頻處理有太多的技術要點,它到底是什么東西?以及它的價值到底是什么?我這里就直接用兩段音頻給大家演示一下。
剛剛的兩段音頻大家應該能夠聽得出來區別,第一段音頻里面在說話的時候,它有很多的背景噪音,比如說有風聲、雨聲,甚至有叮叮當當,其實那個是炒菜的聲音,還有其他的雜音。第二段就是經過我們自己的音頻處理之后,得到一個干凈純粹的聲音。這里的價值就是,我們的學生在線課堂學習的時候,他的身邊不一定是非常安靜的環境,他有可能在客廳學習,媽媽可能在看電視、在做飯,或者在線下其他的地方,咖啡廳還有背景音樂,可能窗戶外還有噪音等等這些聲音。
人和人之間溝通的時候,這些聲音我們可以通過一定的方法,比如說我和你的距離拉近一點,我的聲音說大一點,或者我們人本身的大腦就會自動過濾掉這些雜音。但是我們要讓學生和AI老師進行互動的時候,AI老師是不會直接把這些雜音處理掉的,就需要在給到AI老師準確的信息之前對它做一些處理,要保證我們給到的信息是真正的學生有價值、有用的準確信息,才能讓AI老師真正理解學生的意思,并且給出正確的回答。所以我們說要讓AI老師像真人一樣反應快、聽得準、說得性。
3. 個性化教學+情感反饋
![]()
第三,情感化相關的事情。
AI老師通過大語言模型、知識庫可以做到回答得準,這個在今天已經不是非常困難了。但是如何讓AI老師具有一定的情感?我們給出的方案就是可以定制老師的聲音和形象,讓它有一定的人格,可以做到更多的情感輸出。針對不同的課堂場景以及不同的訴求,我們可以提供多種定制方案。比如說對于一些名師來講,或者是一些相對比較嚴肅的,學生對于老師的認可度較高的場景,我們建議可以去復刻真人老師的形象;對一些比較有意思的課堂或者是一些有特點的課堂,我們可以通過AI生成擬真人的形象,復刻這些形象,可以做到形象的靈活百變,來提高學生吸引力。對于一些比較小的學生,幼齡的學生,他們可能對真人老師的形象會有一些害怕,就像小朋友見到大人會有一些害怕,這是自然的。
這個時候我們用卡通的形象,可能小朋友更容易接受,小朋友更喜愛,他就愿意和它進行對話。最后還有特定的場景,比如在語文和歷史這樣的課程中,可以運用一些歷史人物的形象把它給復刻,讓它和學生之間進行互動回答。比如我們講李白,如果我們可以復刻一個李白的形象,讓李白介紹自己的一生,對學生來講仿佛穿越了課本,和古人真正進行互動對話,可以提高學生的學習興趣。
4. 靈活選擇,輕松接入
以上是互動相關的技術能力,在這個過程中我們需要有大語言模型等相關能力,我們現在已經接入了國內外各類大模型,教育機構可以根據自己的需求自定義,來調整大模型。同樣,tts也可以根據機構的需求進行靈活調整。
5. 高并發能力
個性化的問題得到解決之后,還有第二個問題就是如何去做到大規模。
兩個人同時互動對話的場景,其實這兩個人是同時發生的,AI老師是根據一個教學主題,但是對兩個同學下發了不同的問題,兩個同學再根據這個問題進行回答,AI老師也給了他們對應的個性化反饋。我們這里演示的是兩個人,其實我們整套的架構可以針對萬人級別規模的并發,讓所有的學生都可以在同時進入到這樣的AI伴學場景里面。
這個就是我們整個AI伴學的業務架構,首先真人老師通過我們的直播技術或者是CDN技術來進行萬級別甚至十萬級別的直播,當老師進入到了需要AI伴學互動的環節,就像我剛剛提到的老師們需要隨堂演練的時候,老師可以通過觸發系統,讓AI老師和學生進入到一對一的彈框。我們已經驗證了在萬級規模并發下保障所有的同學同時進入,保障所有學生的效果一致性。這個過程中,AI老師可以和學生提供個性化的問答,真人老師可以靈活自由控住互動問答的頻率、時長。
6. 極致性價比
大規模、個性化都解決了,最后說一下關于性價比。我們講用得起來、用得上的方案才是好的方案。所以通過我們不斷的技術優化,我們可以通過靈活的計費和極致性價比得單價,可以做到單課程、單人成本在3塊錢以內,這是大部分教育機構可以接受的成本。我們希望不給教育機構增加負擔的情況下真正讓這個方案能夠落地實現。
(五)客戶案例
這是我們某一個K12的教育機構的案例。首先從互動學生占比,直播課里面互動學生占比就是真人老師和學生之間的連麥,以前可能就是挑選那么兩三個,不到5%,但是用了這個方案之后,所有的學生都可以參與這種互動,可以把占比提高到百分之百。互動頻率上,在真人直播課里面,如果真人老師互動的話,因為真人老師精力的問題頂多有1-2次互動。但是用AI以后,真人老師只要控制這個AI老師就可以了,可以穿插5-6次的互動,甚至更多,單節課互動占比可以從之前的10%提升到30%。下面是這兩個數據是對教育機構非常有價值的反饋信息,第一個是在退課和續費的轉化率方面,我們的客戶用了AI伴學方案之后,和沒有AI伴學的課堂對比,整體的退課率降低了50%。
正是因為好的效果,當前該客戶是在英語和數學學科上進行了使用,未來會在更多的學科里面復刻這個場景,然后為更多的學生提供個性化的教學。
這就是為我們的教育機構提供的一站式AI伴學解決方案,我們通過提供多模態的,包括IM、語音和數字人的互動形式,讓我們的教育機構能夠去實現一對一的伴學互動。通過高級的音頻處理,讓我們的AI能像真人一樣,及時地去反饋聽得清、說得準,在大語言模型,文字轉語音上,機構都可以根據自己的需求自定義。我們配套提供了會話管理、知識庫以及內容審核等相關能力,能讓教育機構快速高效落地整套方案。
這是我們即構公司RTC+AI的整個產品矩陣,剛才講的是AI伴學解決方案,AI伴學的底層核心是RTC+AI的工程化結合,這里面整個的能力其實已經融入到了我們公司的產品矩陣中來,不僅在教育行業,我們在娛樂、出海、金融等相關行業都提供相關的技術方案,這里我就不多講了。希望我們能夠給所有的行業伙伴和開發者們提供更好的實時音視頻互動技術,共建實時互動世界。大家如果有興趣的話,我們公司在外面有一個展臺,可以來咨詢。
我的分享就到這里,謝謝大家!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.