12月20日,在華爾街見聞和中歐國際工商學(xué)院聯(lián)合主辦的「Alpha峰會」上,金山辦公助理總裁、資深技術(shù)專家朱熠鍔發(fā)表題為《WPS AI:邁向更高質(zhì)量的知識增強(qiáng)生成》的演講。
![]()
他表示,當(dāng)前AI應(yīng)用的核心挑戰(zhàn)已經(jīng)從模型能力的競爭,轉(zhuǎn)向如何高效利用企業(yè)私域數(shù)據(jù)。模型能力的趨同,意味著其本身難以形成壟斷優(yōu)勢。
他強(qiáng)調(diào),真正決定AI應(yīng)用價(jià)值的關(guān)鍵,在于將企業(yè)內(nèi)大量復(fù)雜、非結(jié)構(gòu)化的文檔數(shù)據(jù),轉(zhuǎn)化為高質(zhì)量、可被模型理解的知識資產(chǎn)。傳統(tǒng)RAG面臨“文檔不等于知識”以及“語義相似不等于邏輯相關(guān)”的根本局限,因此必須推動技術(shù)范式從“以模型為中心”升級為“以數(shù)據(jù)/知識為中心”。
他強(qiáng)調(diào),未來的路徑是發(fā)展“KAG(Knowledge Augmented Generation,知識增強(qiáng)生成)”。這要求企業(yè)像管理數(shù)據(jù)一樣,系統(tǒng)性地對知識進(jìn)行治理、建模與應(yīng)用。具體而言,需要通過VLM、知識圖譜等技術(shù),融合多模態(tài)、多結(jié)構(gòu)化的知識,并構(gòu)建“數(shù)據(jù)湖”與“知識湖”雙湖并重的架構(gòu)。最終目標(biāo)是讓AI真正“掌握”而非僅僅“看到”企業(yè)知識,從而在專業(yè)領(lǐng)域問答、智能寫作與合規(guī)創(chuàng)作等場景中發(fā)揮可靠價(jià)值,完成從數(shù)字化到智能化的關(guān)鍵跨越。
以下為演講精彩觀點(diǎn):
企業(yè)AI應(yīng)用正從“以模型為中心”轉(zhuǎn)向“以數(shù)據(jù)為中心”。數(shù)據(jù)質(zhì)量成為決定AI應(yīng)用效果的關(guān)鍵。WPS AI以知識增強(qiáng)生成(Knowledge-Augmented Generation)為目標(biāo),幫助大模型真正“掌握”企業(yè)的知識資產(chǎn)。
要像管理數(shù)據(jù)一樣管理知識。將數(shù)據(jù)與知識轉(zhuǎn)化為AI可用的資產(chǎn),是企業(yè)從數(shù)字化邁向智能化的基石。DATA 2.0時(shí)代,企業(yè)要像管理數(shù)據(jù)一樣管理知識,WPS 365通過知識建模、知識治理與多模態(tài)融合,為企業(yè)構(gòu)建專屬的“企業(yè)大腦”。
高質(zhì)量的輸出,必須始于高質(zhì)量的輸入。如果輸入的是混亂、沖突的原始數(shù)據(jù),無論模型多強(qiáng)大,產(chǎn)出的結(jié)果都不可靠。因此,知識治理是AI在專業(yè)領(lǐng)域落地的基石,其重要性將超越算法優(yōu)化本身。
AI的專業(yè)化應(yīng)用是一場“知識工程”,而非簡單的技術(shù)集成。從合規(guī)報(bào)告撰寫到精準(zhǔn)信息抽取,其本質(zhì)都是將專業(yè)領(lǐng)域知識系統(tǒng)化、結(jié)構(gòu)化的過程。誰能率先完成自身知識資產(chǎn)的升級,誰就能在AI時(shí)代建立真正的競爭優(yōu)勢。
真正的智能不是“看到”文檔,而是“理解”邏輯。當(dāng)前主流的AI應(yīng)用(如RAG)因“語義相似不等于邏輯相關(guān)”而遭遇瓶頸。真正的突破在于融合知識圖譜、業(yè)務(wù)規(guī)則等多源知識,讓AI能進(jìn)行邏輯推理與精準(zhǔn)回答,從而解鎖專業(yè)場景的價(jià)值。
以下是華爾街見聞?wù)淼木A內(nèi)容:
大模型之后,真正的瓶頸是什么?
當(dāng)前一個(gè)關(guān)鍵的共識是,前沿大模型的綜合智能在知識儲備與邏輯理解上已超越普通員工,且模型能力趨同,難以壟斷。那么,核心問題便轉(zhuǎn)向了:大模型如何在實(shí)際應(yīng)用中發(fā)揮真正的價(jià)值?
我們的答案是:必須與外部數(shù)據(jù),尤其是企業(yè)私域數(shù)據(jù)深度結(jié)合。但以“文檔”形式存在的數(shù)據(jù)本身不等于“知識”,是由于企業(yè)海量的文檔(文字、表格、PDF等)存在格式復(fù)雜、組織混亂、內(nèi)容矛盾等“先天不足”。一份文檔中,未休年假折算比例可能是200%,另一份卻是300%;一份法規(guī)要求存儲六個(gè)月數(shù)據(jù),另一份則說只保留必要數(shù)據(jù)。這些沖突不解決,AI的輸出就不可靠。
更深刻的挑戰(zhàn)在于主流技術(shù)范式。當(dāng)前廣泛應(yīng)用的RAG(檢索增強(qiáng)生成)技術(shù),其核心是“向量相似度檢索”。這帶來了一個(gè)根本性局限:語義相似,不等于邏輯相關(guān)。例如,問“筆記本電腦開不了機(jī)怎么辦”,系統(tǒng)可能召回一篇詳細(xì)介紹“MacBook Pro 14寸”規(guī)格的文檔(語義相似),卻錯(cuò)過了真正解決問題但未提及“筆記本”三個(gè)字的故障排查指南(邏輯相關(guān))。這導(dǎo)致許多AI應(yīng)用“出Demo驚艷,上生產(chǎn)困難”。
從RAG到KAG,構(gòu)建“知識增強(qiáng)生成”新范式
為了突破這些瓶頸,我們提出必須從RAG演進(jìn)到KAG(Knowledge Augmented Generation,知識增強(qiáng)生成)。這不是簡單的優(yōu)化,而是一次范式轉(zhuǎn)移。其核心觀點(diǎn)有兩個(gè):
一是高質(zhì)量輸入才有高質(zhì)量輸出。知識必須先經(jīng)過治理,解決沖突、補(bǔ)齊缺失、建立結(jié)構(gòu)。
二是必須系統(tǒng)性融合多模態(tài)、多結(jié)構(gòu)的知識資產(chǎn)。不能只檢索文檔,還要融合企業(yè)已有的知識圖譜、結(jié)構(gòu)化標(biāo)簽、流程SOP等,為AI生成提供高質(zhì)量輸入。
基于此,我們設(shè)計(jì)了一個(gè)雙層架構(gòu)。底層是“知識治理層”,負(fù)責(zé)文檔解析、知識抽取、圖譜構(gòu)建與質(zhì)量監(jiān)控;上層是“知識應(yīng)用層”,它多源融合檢索引擎、動態(tài)排序模塊、上下文工程體系為核心組件,構(gòu)建能夠賦能各類專業(yè)場景的知識基座。
在四個(gè)關(guān)鍵場景中落地KAG
基于KAG架構(gòu),我們研發(fā)了智能文檔庫產(chǎn)品,并聚焦于四個(gè)核心場景:
第一,知識治理。 我們通過自動化的知識抽取與圖譜構(gòu)建,幫助客戶發(fā)現(xiàn)文檔庫中的重復(fù)內(nèi)容、邏輯沖突和知識缺失。例如,系統(tǒng)可以自動標(biāo)出關(guān)于年假折算比例的兩個(gè)沖突版本,或指出一個(gè)“IT支持”知識庫還缺少“打印機(jī)驅(qū)動安裝”的關(guān)鍵章節(jié),輔助管理員進(jìn)行決策和優(yōu)化。
第二,專業(yè)智能問答。在融合了私域文檔圖譜與行業(yè)法規(guī)、SOP等結(jié)構(gòu)化知識后,我們的問答系統(tǒng)能處理復(fù)雜的專業(yè)查詢。例如,用戶可以問:“在浙江省,生產(chǎn)某種特定粒徑的原料藥,是否可以使用X成分?請僅依據(jù)2025年的規(guī)定。”系統(tǒng)能精準(zhǔn)解析地點(diǎn)、成分、年份等多個(gè)約束條件,并給出精確答案。
第三,復(fù)雜文檔的智能抽取。我們針對醫(yī)療報(bào)告、合同、發(fā)票中常見的復(fù)雜表格、復(fù)選框、手寫體等進(jìn)行了專項(xiàng)優(yōu)化。一家醫(yī)藥客戶利用此功能,將藥物不良反應(yīng)報(bào)告的郵件附件自動解析、抽取關(guān)鍵字段,并回填至客戶的藥物管理系統(tǒng),將原本人工處理需數(shù)小時(shí)的工作縮短到幾分鐘。
第四,專業(yè)領(lǐng)域的智能寫作。這不同于寫請假條,而是撰寫有嚴(yán)格格式與數(shù)據(jù)引用精準(zhǔn)要求的行業(yè)報(bào)告(如臨床研究報(bào)告CSR)。我們通過兩個(gè)智能體(Agent)協(xié)同工作:一個(gè)負(fù)責(zé)根據(jù)范例和法規(guī)生成包含大綱、數(shù)據(jù)需求的“智能模板”;另一個(gè)則依據(jù)模板,從海量實(shí)驗(yàn)數(shù)據(jù)中精準(zhǔn)定位、無損引用所需的數(shù)據(jù)和表格,最終生成格式合規(guī)、數(shù)據(jù)準(zhǔn)確的專業(yè)報(bào)告,將撰寫周期從數(shù)周大幅縮短。
像管理數(shù)據(jù)一樣管理知識
最后,我想做一個(gè)總結(jié)。從RAG到Graph RAG再到KAG,是一個(gè)從“讓大模型看到文檔”,到“理解文檔間邏輯”,再到“真正掌握企業(yè)知識資產(chǎn)”的升級。
我們認(rèn)為,在智能化時(shí)代,企業(yè)需要構(gòu)建 “數(shù)據(jù)湖”與“知識湖”雙湖并重 的新架構(gòu)。未來,企業(yè)不僅要積累原始數(shù)據(jù),更要像過去管理數(shù)據(jù)一樣,系統(tǒng)地進(jìn)行知識運(yùn)營、知識建模和知識治理。這,將是企業(yè)從數(shù)字化邁向智能化的關(guān)鍵基石,也是AI在專業(yè)領(lǐng)域發(fā)揮真正提效作用的必經(jīng)之路。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.