
![]()
摘要
隨著教育信息化深入發展,學習類應用在數字化學習生態中日益重要。本文研究學習類應用用戶與開發者之間的交互響應情況,助力提升用戶與開發者之間交互響應水平。本文基于BERTopic模型、BERT語義相似度計算等技術,對9個學習類應用的30356條用戶評論和1035條版本更新日志進行語義分析,識別交互響應模式,并對四種響應模式進行量化統計與對比分析。研究表明,用戶評論呈現10個主題簇,而更新日志則聚焦于6個主題簇,反映出需求分散與更新聚焦的結構性差異;同時發現,學習類應用用戶與開發者之間的交互響應模式表現出動態演化特點。最后,結合發現為學習類應用優化提供了參考策略。
關鍵詞
BERTopic;學習類應用;用戶評論
Abstract
With the deepening development of educational informatization, learning applications have become a critical component of the digital learning ecosystem. This study investigates the interaction-response between users and developers of learning applications to improve the quality of their communication and collaboration. Leveraging the BERTopic model, BERT-based semantic similarity calculations and other technologies, this study conducts semantic analysis on 30,356 user reviews and 1,035 version update logs from 9 learning applications. It identifies interaction-response patterns and performs quantitative statistics and comparative analysis on four response modes. The findings reveal that user comments cluster into ten thematic groups, whereas update logs concentrate on six core themes, highlighting the structural disparity between diverse user demands and focused developer updates. Additionally, the study demonstrates that interaction-response patterns between users and developers exhibit dynamic evolutionary characteristics. Finally, reference strategies for optimizing learning applications are provided based on these findings.
Keywords
BERTopic; Learning applications; User reviews
1 引言
隨著教育信息化進程加深,學習類應用在數字化學習生態中地位日益凸顯。《2023年中國教育信息化發展報告》顯示,我國在線教育市場規模已突破4000億元,學習類應用日活躍用戶超過1.2億。然而,用戶眾多且學習偏好和動機迥異,使在線學習需求獲取較為困難[1]。在移動互聯網生態中,用戶生成的應用評價已成為獲取用戶反饋的核心數據源,通過挖掘用戶應用需求,對輔助應用設計、驅動迭代更新以及增強用戶與開發者價值共創關系具有重要意義[2]。此外,在線教育本質上是學習者與應用的交互過程[3],因此,與用戶評論形成閉環的是,應用版本迭代日志構成了開發者主動回應用戶需求的完整敘事鏈。這種雙向數據流的交叉驗證,有利于驅動學習類軟件形成“需求感知—功能迭代—體驗反饋”的自適應演進生態。
由此,本文引入BERTopic主題建模技術,構建基于深度學習的交互響應分析框架。通過對30356條用戶評論和1035條版本更新日志進行跨模態語義分析,重點探討三個問題:①學習類應用用戶評論與更新日志的主題分布特征及其對應關系。②學習類應用用戶與開發者之間的雙向交互響應模式。③針對交互響應的結構特征與動態演化,提出有助于提升用戶與開發者之間交互響應水平的優化策略。
2 相關研究
2.1 BERTopic主題建模的優越性與改進研究
BERTopic整合了BERT文本嵌入技術,在主題識別及演化分析研究中具有一定優勢[4]。與 LDA等傳統方法相比,BERTopic顯著提高了主題提取的效果。Nabila Khodei等發現BERTopic 在 MOOC 論壇緊急帖子主題建模中表現優越,在大規模主題處理任務中明顯優于 LDA 和 LSI 等傳統算法,能有效識別需要教師立即關注的內容[5]。Hajar Zankadi等通過對比分析LDA、LSA和BERTopic三種模型的主題一致性、多樣性分布及語義相關度,驗證了BERTopic在從社交媒體文本中識別學習者潛在興趣方面的優越性,為MOOC平臺個性化課程推薦與提升學習者滿意度提供了技術支持[6]。逯萬輝進行科學文獻主題識別時,發現BERTopic的主題穩定性和離散性均優于 LDA 和 Top2Vec,且在中英文跨語言分析中展現了較高的主題識別一致性[7]。但是,BERTopic 初始提取的主題簇往往存在數量過多、粒度不均的問題,而層次聚類在破除這些問題中起著關鍵作用。楊思洛等通過參數設定識別信息資源管理領域的50個研究主題,并基于層次聚類將主題細化為10個核心方向,揭示了主要學術熱點的演化軌跡與發展趨勢[8]。Zhongyi Wang等利用層次聚類技術,將初始提取的86個全局主題整合為更精煉的40個主題,更精準地界定跨學科主題的語義邊界與內部構成特征[9]。
學習類應用的用戶需求與體驗優化一直是學術界關注的重點。鄭明鑒等提出了一種結合預訓練語言模型和大數據挖掘的語言學習APP評價技術方案,分析了20款語言學習APP的用戶評論數據,構建了基于情感分析的多維度評價體系,為后續研究奠定了方法論基礎[10]。而丁芬采用LDA主題模型分析了兒童有聲讀物APP的用戶需求,并提出了基于Kano模型的具體優化策略,實現了從理論走向現實[11]。劉曉倩等研究了中國大學MOOCAPP的用戶評價,通過分析好評和差評的內容,提出了平臺優化策略[12]。然而,即便用戶評論構成了軟件需求發現的豐富來源[13],但以單一的用戶評論為研究數據源沒有考慮用戶的意見是否得到研發團隊的回應。因此,錢宇等創新性地提出了“更新日志-用戶評論”匹配算法,為探究各類應用的用戶和開發者交互提供理論參考[14]。
綜合來看,在關于學習類應用的研究中,學者們更多基于傳統主題模型、以單一的用戶評論為數據源進行探究。由此,本文引入先進的BERTopic主題建模技術,將“更新日志-用戶評論”匹配算法應用到學習類應用領域,構建學習類應用用戶和開發者交互響應框架,探索學習類應用交互響應的結構特征與動態演化,并提出學習類應用的優化路徑。
3 研究設計
3.1研究方法
本文基于第三方數據平臺所采集到的學習類應用的用戶評論及更新日志數據,整合預處理后的用戶評論文本與版本更新日志條目,結合BERTopic主題建模、BERT語義相似度計算等,挖掘用戶需求與技術優化的匹配關系,識別并分析不同交互響應模式,提出有助于優化用戶與開發者之間交互響應水平的策略。研究框架如圖1所示。
![]()
圖 1 本文研究框架
具體研究步驟如下:
(1)數據獲取與預處理;
(2)基于BERTopic進行用戶評論與更新日志的主題聚類;采用BERTopic主題建模框架進行跨模態特征挖掘。具體技術實施過程包含:①采用UMAP[15]降維構建低維語義空間;②采用HDBSCAN[16]密度聚類實現主題結構自適應識別并剔除非特異性噪聲;③采用C-TF-IDF算法提取具有領域區分度的主題表征詞集。④為揭示主題間層級關系,通過生成層次聚類圖譜并進行主題合并。最終在評論文本中識別出10個主題簇,在更新日志數據中析取出6個主題簇。
(3)基于用戶評論和更新日志的向量表示,結合用戶評論和應用更新日志所發布的時間維度,計算用戶評論與更新日志之間的相似度,并通過該相似度判斷用戶需求與技術優化的匹配程度,從而構建不同的交互響應模式。
(4)針對學習類應用交互響應模式的的結構特征與動態演化,提出助于提升用戶與開發者之間交互響應水平的優化策略。
3.2數據來源及數據預處理
本文數據來源于七麥數據移動應用分析平臺。選取九個具有高市場覆蓋度的學習類應用:網易云課堂、考途、中國大學MOOC、網易公開課、CCTALK、小鵝通、學堂在線、粉筆、新東方,涵蓋專業學習、職業培訓、考試輔導、知識付費等教育場景。采集2018年1月1日至2024年12月18日期間的用戶評論71896條和更新日志1085條,如表1所示。
表 1 用戶評論與更新日志數據情況
![]()
3.2.1用戶評論數據預處理
本文評論數據預處理包含六步:①刪除重復行;②合并評論標題和內容;③去除特殊字符;④刪除數字、非中文及廣告評論;⑤構建功能特征詞典并篩選評論;⑥基于g-index方法設定高頻詞標準[17],以出現頻次超過442次為基準,獲取1622個高頻詞,通過人工篩選核心功能術語作為種子詞,結合同義詞庫和上下文規則進行語義擴展,構建學習類應用特征詞典,最終抽取30356條功能相關評論文本形成數據集。
3.2.2版本更新日志數據預處理
在版本更新日志數據預處理過程中,本文采取了以下步驟進行數據清洗:①將更新項目拆分為具體條目。為了確保分析準確性,需要將每個更新項目拆解為獨立的更新條目,以便逐一分析。②剔除無實際分析價值的數據。③去除重復的更新條目。通過以上預處理,最終得到1035條更新日志。
4 數據分析
4.1用戶評論和更新日志主題分析
本部分對用戶評論和更新日志數據進行BERTopic主題建模,從中提取出核心主題,以探究學習類應用用戶評論與更新日志的主題分布特征及其對應關系,并為后續研究做準備。
通過BERTopic主題建模獲取用戶評論和更新日志的初步主題,結合層次聚類法進行聚類分析,結果如圖2、圖3所示。
![]()
圖2 用戶評論主題層次聚類圖
![]()
圖3 更新日志主題層次聚類圖
相近主題在層次聚類圖中呈近距離分布。分別在圖2橫坐標1處和圖3橫坐標1.02處繪制垂直線,左側連接主題構成具備良好分離度的功能主題簇。最終學習類應用的用戶評論數據得到10個功能主題:軟件適配,用戶的稱贊,課程學習,視頻播放,用戶登錄,軟件bug,課后任務,軟件網絡,夜間模式優化,客服支持服務,主題分布情況如表2所示。而更新日志數據得到6個功能主題:軟件體驗管理,課后學習管理,視頻播放管理,課程查找管理,學習交流管理,用戶登錄管理,主題分布情況如表3所示。
表 2 用戶評論主題與主題關鍵詞
![]()
表 3 更新日志主題與主題關鍵詞
![]()
調用topic_model.visualize_topics()生成主題間距圖,如圖4所示。圖4(a)和圖4(b)顯示各主題在二維空間中間隔明顯,表明語義獨立性較高,驗證了主題劃分的合理性。
![]()
圖 4 主題間距圖
本文基于10個用戶評論主題和6個更新日志主題,對二者的異同進行對比分析,以揭示用戶需求與技術響應之間的匹配程度。分析發現:①用戶評論主題與更新日志主題在概念和關鍵詞層面存在一定對應關系,如“視頻播放”對應“視頻播放管理”,“軟件適配”“軟件bug”與“軟件體驗管理”相匹配,這反映開發者在部分功能上能響應用戶需求,形成良好的交互閉環。②部分用戶關注主題如“夜間模式優化”“客服支持服務”“軟件網絡”等未在更新日志中體現,表明某些用戶需求尚未被技術優化覆蓋。③10個用戶評論主題數量顯著多于6個更新日志主題,顯示用戶關注點相對分散,涉及功能體驗、技術問題等多維度需求,而開發者更專注于關鍵功能和系統穩定性提升,反映了用戶需求廣泛性與開發策略針對性之間的落差。
4.2學習類應用用戶與開發者的交互響應模式分析
本部分通過學習類應用的用戶評論與更新日志的相似度匹配,評估用戶需求與技術優化的契合度;隨后,基于匹配結果劃分出不同的用戶與開發者的交互模式;最后,構建學習類應用用戶與開發者的交互響應模式量化統計表,以進一步分析交互響應模式情況,為提出有助于提升用戶與開發者之間交互響應水平的優化策略做準備。
4.2.1用戶與開發者交互響應模式構建
基于 BERT-base 的框架將用戶評論與更新日志映射為 768 維向量,利用 Transformer 捕捉雙向語義,并以余弦相似度(cosθ≥0.8)量化用戶需求與技術優化的匹配度。最終,共獲得10651條有效的用戶評論與更新日志匹配組,匹配結果示例如表4所示。
表 4 用戶需求與技術優化的匹配表
![]()
基于用戶需求與技術優化的匹配相似度結果,以時間為維度劃分,得到學習類應用用戶與開發者交互響應的四種模式。①高效交互響應模式表現為功能優化前后均有用戶評論,反映用戶需求強烈且技術優化后反饋積極。②用戶激發型交互響應模式表現為優化前有用戶評論而優化后無評論,說明用戶需求明確但技術優化后未形成有效互動。③供給側主導交互響應模式表現為優化前無用戶評論而優化后有評論,表明技術更新非用戶明確需求但獲得積極反饋。④雙向滯后響應模式分為兩類:一是技術優化前后均無用戶評論,二是用戶需求表達前后技術方均未進行功能調整,均反映某項功能未引起用戶廣泛關注或未被納入開發優化計劃。表5展示了學習類應用與用戶交互響應模式的具體示例。
表 5 學習類應用與用戶交互響應模式示例
![]()
4.2.2各學習類應用用戶與開發者交互響應模式分布量化情況
基于前文對學習類應用的用戶評論與更新日志的語義匹配分析,我們識別出了四種交互響應模式。同時,BERTopic模型的更新日志的主題分析結果表明,功能優化構成了版本迭代的核心內容。由此,本部分對更新日志六大功能主題下的交互響應模式進行量化統計,以便更好提取學習類應用所凸顯的用戶和開發者交互響應特征。
基于前文的用戶評論與更新日志匹配情況以及交互響應模式,本文得出更新日志六大功能主題下的交互響應模式量化統計表,如表6所示。
表 6 更新日志六大功能主題下的交互響應模式量化統計表
![]()
從學習應用樣本整體的交互響應模式分布來看,軟件體驗管理和視頻播放管理等核心功能傾向于形成高效交互響應模式,這些功能與用戶直接學習體驗密切相關,在技術迭代中表現出更強的雙向互動性;而學習交流管理和用戶登錄管理等功能更多依賴用戶激發型交互響應模式,反映其優化往往始于用戶主動需求表達。
此外,本文進一步對比分析了成熟學習應用新東方與新興學習應用小鵝通的交互模式差異,以揭示不同發展階段學習應用的交互特征。從功能維度看,軟件體驗管理和課后學習管理功能優化中,小鵝通依賴用戶激發型交互響應模式,占比37.93%,新東方偏向高效交互響應模式,占比40.69%。從應用維度看,新東方最適用高效交互響應模式,占比66.9%,小鵝通最適用用戶激發型交互響應模式,占比58.62%,這為不同發展階段的在線教育應用優化提供了參考。
5 結論
5.1學習類應用交互響應的結構特征與動態演化
從結構性差異視角分析用戶需求與技術響應的匹配特征,研究發現顯著的不對稱現象。用戶評論呈現10個主題簇,而技術更新聚焦于6個核心功能簇,這種結構性差異揭示了學習類應用需求響應機制的特征:用戶需求呈現高度分散化趨勢,涵蓋從基礎功能到個性化體驗的多個維度,而技術迭代策略表現出明顯聚焦性,優先關注應用穩定性和核心服務質量相關功能模塊。需求分散與更新聚焦的結構性差異反映了學習類應用在技術迭代中面臨的策略性選擇,即如何在有限開發資源下平衡普適性需求與個性化訴求。該發現既揭示了當前學習類應用需求響應機制現狀,也為技術迭代決策提供了重要依據。
基于四象限交互響應模型的實證分析,本文發現了學習類應用迭代的階段性演化規律。新興應用,如小鵝通,與成熟應用,如新東方在交互響應模式上呈現出顯著不同,可能主要源于技術積累和競爭策略方面的差異。
一方面,成熟應用憑借技術沉淀建立了完善的功能優化機制,能夠預判用戶需求并主動創新,形成高效交互響應模式,如新東方在軟件體驗管理和課后學習管理功能上的高效交互占比達40.69%。新興應用因技術積累不足,需依賴用戶反饋指導功能優化,表現出較強的用戶激發型交互響應特征。另一方面,成熟應用傾向采取“技術引領”策略,通過功能創新保持競爭優勢;新興應用則采取“需求跟隨”策略,通過快速響應用戶反饋獲取市場份額。
由此,學習類應用的交互響應模式隨成熟度動態演進:新興應用通過用戶激發型交互積累經驗,逐步向高效交互模式轉化;而成熟應用在保持高效交互的同時,仍需保持對用戶需求的敏感度,實現技術創新與用戶需求的動態平衡。
5.2學習類應用的優化策略
基于學習類應用用戶與開發者交互模式的特征和演化規律,本文提出以下有助于提升用戶與開發者之間交互響應水平的優化策略。
其一,開發者可建立動態響應評估體系,通過文本分析模型實時監測用戶需求變化,形成分級處理方案:對軟件適配、視頻播放等高頻核心問題采用快速迭代模式,確保兩周內推出解決方案;將夜間模式優化等中等頻次需求納入季度更新計劃;對個性化定制類長尾需求,通過開放插件市場實現彈性供給。這種分層管理策略能夠平衡基礎體驗穩定性與多元化需求滿足。
其二,開發者可針對不同發展階段應用的特點,采取差異化優化路徑。新興應用應打通用戶反饋直連通道,在更新日志中可視化展示需求響應成果,通過新舊版本對比測試驗證改進成效;成熟應用則需培養需求預判能力,通過深度分析用戶行為軌跡,提前部署前瞻性功能。這種階梯式進化策略既幫助新興應用快速建立用戶信任,又助力成熟應用保持創新活力。
其三,開發者可主動引導用戶進行有效反饋。通過提供結構化反饋模板提升溝通效能,如設計“具體現象+設備型號+操作步驟”的標準化問題反饋框架,將模糊的主觀感受轉化為可分析的客觀數據。此外,構建多元化的用戶參與渠道,通過功能提案投票、新功能測試招募等有組織的引導方式,促進用戶深度參與產品改進協作。這種主導式多元反饋機制既尊重了用戶作為產品共創者的價值,又比被動接收零散評論更有效,有助于收集高質量用戶意見并形成代表性的改進方向。
基金項目:本文系湖北省高等學校省級教學研究項目“新文科視角下‘專業-縱深-融合-協同’創新創業教育體系研究 ”(項目編號:2021239)
作者簡介
何鑫 武漢科技大學管理學院2024級物流工程與管理專業在讀碩士研究生
王靜 武漢科技大學管理學院副教授
王鑫鑫 武漢科技大學管理學院教授
參考文獻
![]()
![]()

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.