背景:新品發(fā)布期的用戶(hù)聲音亟待結(jié)構(gòu)化洞察
2025 年 10 月,華為正式發(fā)布 Mate 80 系列旗艦手機(jī),涵蓋 Mate 80、Mate 80 Pro、Mate 80 RS 以及延續(xù)經(jīng)典的 Mate X2 折疊屏機(jī)型。作為國(guó)產(chǎn)高端智能手機(jī)的代表,該系列一經(jīng)亮相便在全球科技圈引發(fā)熱議。我們團(tuán)隊(duì)通過(guò) YouTube Data API 采集了與“Mate 80”相關(guān)的數(shù)百個(gè)熱門(mén)視頻下的全部評(píng)論數(shù)據(jù)。
初步統(tǒng)計(jì)顯示,僅一周內(nèi)就收集到 超過(guò) 2.1 萬(wàn)條原始評(píng)論,內(nèi)容涵蓋產(chǎn)品功能評(píng)價(jià)、價(jià)格討論、競(jìng)品對(duì)比、購(gòu)買(mǎi)意向等豐富維度。然而,這些數(shù)據(jù)高度非結(jié)構(gòu)化:語(yǔ)言混雜(中英夾雜)、表達(dá)隨意(如“M80P太頂了!”、“mate80pro衛(wèi)星通話(huà)救命”)、情緒隱晦(如“等第一批用戶(hù)踩雷”實(shí)為觀望態(tài)度)。更關(guān)鍵的是,大量評(píng)論與 Mate 80 無(wú)關(guān)——例如討論 iPhone 16、榮耀 Magic7,甚至與手機(jī)完全無(wú)關(guān)的廣告或表情包。
面對(duì)海量噪聲數(shù)據(jù),傳統(tǒng)人工閱讀或通用 NLP 工具已無(wú)法滿(mǎn)足高效、精準(zhǔn)的分析需求。我們需要一個(gè)能自動(dòng)識(shí)別具體機(jī)型、準(zhǔn)確判斷情感傾向、提煉核心關(guān)注點(diǎn)的智能系統(tǒng),并在極低成本下快速落地。
目標(biāo)定義:構(gòu)建輕量級(jí)、高精度的輿情分析流水線(xiàn)
基于業(yè)務(wù)訴求,我們明確了三大核心目標(biāo):
精準(zhǔn)過(guò)濾:僅保留明確提及 Mate 80 系列(含 Pro/RS/X2 等子型號(hào))的評(píng)論;
細(xì)粒度分析:區(qū)分不同機(jī)型的情感分布與功能關(guān)注點(diǎn);
結(jié)構(gòu)化輸出:生成可直接用于匯報(bào)的中文分析報(bào)告,包含情感比例、典型語(yǔ)句、熱門(mén)維度及各型號(hào)聲量。
技術(shù)選型:為什么選擇 LazyLLM?
在評(píng)估多個(gè)方案后,我們決定采用 LazyLLM + DeepSeek 大模型 的組合。原因如下:
開(kāi)發(fā)效率高:LazyLLM 提供統(tǒng)一接口封裝主流大模型(包括 DeepSeek),無(wú)需處理認(rèn)證、重試、流式響應(yīng)等底層細(xì)節(jié);
靈活性強(qiáng):支持自定義 Prompt,可精確引導(dǎo)模型輸出所需 JSON 結(jié)構(gòu);
成本可控:結(jié)合本地預(yù)處理,實(shí)現(xiàn)“一次調(diào)用、全局分析”的批處理模式。
這一架構(gòu)完美契合我們的“輕量、精準(zhǔn)、低成本”原則。
落地過(guò)程:從數(shù)據(jù)清洗到智能洞察 第一階段:本地規(guī)則引擎實(shí)現(xiàn)精準(zhǔn)過(guò)濾
我們首先構(gòu)建了一個(gè)本地型號(hào)識(shí)別模塊。考慮到用戶(hù)寫(xiě)法多樣(如 “Mate80Pro”、“Mate 80 Pro”、“m80 rs”),我們采用“標(biāo)準(zhǔn)化+最長(zhǎng)匹配”策略:
定義標(biāo)準(zhǔn)型號(hào)列表:["Mate 80 RS", "Mate 80 Pro", "Mate 80", "Mate X2"];
將評(píng)論和型號(hào)均去除空格并轉(zhuǎn)小寫(xiě);
按型號(hào)長(zhǎng)度降序匹配,確保“Mate 80 Pro”不會(huì)被誤判為“Mate 80”。
大量評(píng)論與 Mate 80 無(wú)關(guān)——例如討論 iPhone 16、榮耀 Magic7,甚至與手機(jī)完全無(wú)關(guān)的廣告或表情包等(如下圖)
![]()
真正聚焦于 Mate 80 系列的評(píng)論散落在海量噪聲之中,且表達(dá)形式高度非結(jié)構(gòu)化,因此,我們統(tǒng)一提取所有明確提及 Mate 80 及其子型號(hào)(如 Pro、RS、X2)的評(píng)論進(jìn)行分析。
核心代碼如下:
return found if found else ["Unknown"]隨后,我們?cè)谥髁鞒讨姓{(diào)用該函數(shù)進(jìn)行批量篩選:
return entries該模塊在本地運(yùn)行,不依賴(lài)任何外部 API,2.1 萬(wàn)條評(píng)論僅需 3 秒即可完成過(guò)濾。最終,系統(tǒng)從 21,451 條原始評(píng)論中精準(zhǔn)提取出 274 條有效評(píng)論,過(guò)濾率達(dá) 98.7%。
![]()
第二階段:設(shè)計(jì)結(jié)構(gòu)化 Prompt 引導(dǎo)大模型輸出
我們將 274 條評(píng)論截取前 200 條(兼顧代表性與 token 限制),拼接成一段上下文,并精心設(shè)計(jì)中文 Prompt,明確要求模型:
統(tǒng)計(jì)正面/負(fù)面/中性情感數(shù)量及占比;
為每類(lèi)情感提供 2 條原始評(píng)論示例;
從預(yù)設(shè)維度(如衛(wèi)星通信、操作系統(tǒng)、價(jià)格等)中選出熱度最高的 5 項(xiàng);
分別統(tǒng)計(jì)各具體機(jī)型的提及次數(shù);
所有輸出字段必須為簡(jiǎn)體中文,且為標(biāo)準(zhǔn) JSON 格式。
這一設(shè)計(jì)確保了 LLM 的輸出可直接解析,無(wú)需后處理。
Prompt 構(gòu)建代碼如下:
return prompt第三階段:?jiǎn)未握{(diào)用完成全局分析
通過(guò) LazyLLM 的 OnlineChatModule,我們僅用一行代碼完成 DeepSeek 調(diào)用:
raw_output = llm(prompt)為確保結(jié)果可靠,我們還加入了安全解析邏輯:
result = {"原始LLM輸出": raw_output}整個(gè)過(guò)程耗時(shí)約 4 秒,消耗約 10,000 tokens,成本僅為 ¥0.0015(約 0.15 分錢(qián))如下圖(0.23包含其他請(qǐng)求)
![]()
第四階段:結(jié)果驗(yàn)證與業(yè)務(wù)賦能
系統(tǒng)輸出清晰展示了關(guān)鍵洞察:
Mate X2 是絕對(duì)討論焦點(diǎn),占相關(guān)評(píng)論的 98%(196/200),Mate 80 系列幾乎未被提及。
正面情緒為主(62.5%),用戶(hù)稱(chēng)贊其“無(wú)折痕折疊設(shè)計(jì)”和“硬件領(lǐng)先三星”。
負(fù)面主要集中在價(jià)格與生態(tài):高價(jià)(約 $2700)、無(wú) Google 服務(wù)、不支持手寫(xiě)筆和防水,被指“性?xún)r(jià)比低”。
中性評(píng)論多為混淆或詢(xún)問(wèn),如誤問(wèn)“Mate 80 Pro 尺寸”,反映新品認(rèn)知度不足。
高頻維度:折疊屏、價(jià)格、系統(tǒng)、設(shè)計(jì)、相機(jī)——聚焦硬件形態(tài)與生態(tài)短板,Mate 80 新特性尚未進(jìn)入海外討論視野。
最終生成的 JSON 報(bào)告示例如下:
}價(jià)值總結(jié):小投入撬動(dòng)大洞察
本次項(xiàng)目從需求提出到完成僅用 1 日,卻實(shí)現(xiàn)了傳統(tǒng)方式難以企及的分析深度與速度。更重要的是,它驗(yàn)證了一種可復(fù)用的輕量化大模型應(yīng)用范式:本地規(guī)則做“減法”,大模型做“加法”,用規(guī)則過(guò)濾噪聲,用智能提煉價(jià)值。
未來(lái),該框架將擴(kuò)展至 Pura 系列、平板、穿戴設(shè)備等產(chǎn)品線(xiàn),成為我們用戶(hù)聲音監(jiān)測(cè)的標(biāo)準(zhǔn)化工具。而這一切的起點(diǎn),正是 LazyLLM 所提供的極簡(jiǎn)開(kāi)發(fā)體驗(yàn)與強(qiáng)大問(wèn)題解決能力。
版權(quán)聲明:本文作者@Y
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.