騰訊開源 WeKnora:基于大模型的智能知識庫,輕松部署全攻略 前言
在企業(yè)知識管理、科研文獻分析、技術(shù)支持、法律合規(guī)審查等場景中,傳統(tǒng)的全文檢索和關(guān)鍵詞匹配已經(jīng)無法滿足復(fù)雜、多模態(tài)的文檔理解需求。
騰訊近期開源的 WeKnora 框架,將大語言模型(LLM)與語義檢索、智能推理深度融合,為結(jié)構(gòu)復(fù)雜、內(nèi)容異構(gòu)的文檔提供高質(zhì)量的問答與分析能力。
本文將帶你快速了解 WeKnora 的核心特性,并手把手演示如何在 飛牛 NAS 上通過 Docker 部署,讓你的私有知識庫秒變“智能問答專家”。
![]()
img WeKnora 項目介紹
WeKnora(維娜拉) 是一款基于大語言模型(LLM)的文檔理解與語義檢索框架,專為結(jié)構(gòu)復(fù)雜、內(nèi)容異構(gòu)的文檔場景而打造。
框架采用模塊化架構(gòu),融合多模態(tài)預(yù)處理、語義向量索引、智能召回與大模型生成推理,構(gòu)建起高效、可控的文檔問答流程。核心檢索流程基于 RAG(Retrieval-Augmented Generation) 機制,將上下文相關(guān)片段與語言模型結(jié)合,實現(xiàn)更高質(zhì)量的語義回答。
官網(wǎng): https://weknora.weixin.qq.com
核心特性
? 精準(zhǔn)理解 :支持 PDF、Word、圖片等文檔的結(jié)構(gòu)化內(nèi)容提取,統(tǒng)一構(gòu)建語義視圖
? 智能推理 :借助大語言模型理解文檔上下文與用戶意圖,支持精準(zhǔn)問答與多輪對話
? 靈活擴展 :從解析、嵌入、召回到生成全流程解耦,便于靈活集成與定制擴展
? ? 高效檢索 :混合多種檢索策略:關(guān)鍵詞、向量、知識圖譜
? 簡單易用 :直觀的Web界面與標(biāo)準(zhǔn)API,零技術(shù)門檻快速上手
? 安全可控 :支持本地化與私有云部署,數(shù)據(jù)完全自主可控
理論上,任何支持 Docker 的設(shè)備都可部署 WeKnora,這里以飛牛 NAS 為例。
確保本地已安裝以下工具:
Docker、Docker Compose、Git
1. 啟用 SSH 登錄
在飛牛 OS 中開啟 SSH 登錄 功能,并切換到 root 用戶:
sudo -i2. 創(chuàng)建部署目錄mkdir -p /docker/docker && cd /docker/docker3. 克隆項目# 克隆主倉庫 git clone https://github.com/Tencent/WeKnora.git cd WeKnora4. 配置環(huán)境變量cp .env.example .env # 編輯 .env 填寫對應(yīng)配置信息.env.example 文件中有詳細注釋,可根據(jù)實際情況修改。5.啟動服務(wù)
如果需要安裝ollama則執(zhí)行這個,我這邊不執(zhí)行,因為我已經(jīng)有安裝ollama了。
# 啟動全部服務(wù)(含 Ollama 與后端容器) ./scripts/start_all.sh # 或 make start-all5.啟動服務(wù)備選# 啟動服務(wù) docker compose up -d接下來就看網(wǎng)絡(luò)的情況了。
6.停止服務(wù)
./scripts/start_all.sh --stop # 或 make stop-all服務(wù)訪問地址啟動成功后,可訪問以下地址:
? Web UI:
http://localhost? 后端 API:
http://localhost:8080? 鏈路追蹤(Jaeger):
http://localhost:16686
首次進入需配置:
首次訪問會自動跳轉(zhuǎn)到初始化配置頁面,配置完成后會自動跳轉(zhuǎn)到知識庫頁面。請按照頁面提示信息完成模型的配置。
? 大模型(本地 ollama 或遠程 API)
? Embedding 模型
? Rerank 模型
? 多模態(tài)解析
? 文檔分割策略
1. 上傳文檔
支持批量上傳,系統(tǒng)會自動解析并生成知識庫索引。2. 智能問答
輸入問題,WeKnora 會結(jié)合知識庫內(nèi)容進行精準(zhǔn)回答,并給出引用來源。3. 多輪對話
支持上下文關(guān)聯(lián)的連續(xù)提問,適合深度分析與探索。
WeKnora 提供了一系列 RESTful API,用于創(chuàng)建和管理知識庫、檢索知識,以及進行基于知識的問答。本文檔詳細描述了這些 API 的使用方式。
如何查看日志?
# 查看 主服務(wù) 日志 docker exec -it WeKnora-app tail -f /var/log/WeKnora.log # 查看 文檔解析模塊 日志 docker exec -it WeKnora-docreader tail -f /var/log/docreader.log如何啟動和停止服務(wù)?# 啟動服務(wù) ./scripts/start_all.sh # 停止服務(wù) ./scripts/start_all.sh --stop # 清空數(shù)據(jù)庫 ./scripts/start_all.sh --stop && make clean-db應(yīng)用場景? 企業(yè)內(nèi)部知識管理
? 科研文獻分析
? 產(chǎn)品技術(shù)支持
? 法律合規(guī)審查
? 醫(yī)療知識輔助
WeKnora 作為騰訊開源的 智能知識庫框架,在文檔解析、語義檢索、智能推理等方面表現(xiàn)出色。 結(jié)合飛牛 NAS(其他的服務(wù)器也可以) 的本地化部署能力,你可以輕松構(gòu)建一個 安全可控、功能強大 的私有知識庫系統(tǒng)。
如果你正在尋找一款 可本地部署、支持多模態(tài)、基于大模型的知識庫解決方案,WeKnora 值得一試。
寫文不易,如果你都看到了這里,請點個贊和在看,分享給更多的朋友;也別忘了關(guān)注星哥玩云!這里有滿滿的干貨分享,還有輕松有趣的技術(shù)交流~點個贊、分享給身邊的小伙伴,一起成長,一起玩轉(zhuǎn)技術(shù)世界吧!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.