![]()
行業(yè)首創(chuàng)!泛娛樂(lè)賽道終于迎來(lái)專屬開(kāi)源大模型。
![]()
元象正式開(kāi)源聚焦泛娛樂(lè)場(chǎng)景的底座大模型 XVERSE-Ent,包含中、英文雙版本。模型深度適配泛娛樂(lè)(Entertainment)核心領(lǐng)域,覆蓋社交互動(dòng)、游戲敘事、文化創(chuàng)作(含小說(shuō)、劇本)等關(guān)鍵場(chǎng)景,支持輕量化部署與垂直場(chǎng)景深度落地,填補(bǔ)了泛娛樂(lè)領(lǐng)域?qū)匍_(kāi)源大模型的空白。
XVERSE-Ent 在通用大模型能力基礎(chǔ)上,依托元象AI 泛娛樂(lè)產(chǎn)品服務(wù)全球千萬(wàn)級(jí)用戶的實(shí)踐經(jīng)驗(yàn),經(jīng)稀缺的垂直領(lǐng)域數(shù)據(jù)深度訓(xùn)練與優(yōu)化,在角色一致性、劇情邏輯等方面能更精準(zhǔn)地契合泛娛樂(lè)場(chǎng)景的真實(shí)需求,為中小開(kāi)發(fā)者與泛娛樂(lè)企業(yè)提供了低成本、高效率的泛娛樂(lè)創(chuàng)新底座模型。模型特色主要體現(xiàn)為:
? 角色一致性強(qiáng)化:能長(zhǎng)期保持虛擬角色人設(shè)、記憶與說(shuō)話風(fēng)格穩(wěn)定,有效優(yōu)化“遺忘”或“出戲”的問(wèn)題。
? 長(zhǎng)劇情精準(zhǔn)理解:精準(zhǔn)把握復(fù)雜故事線、人物關(guān)系與伏筆,生成邏輯合理的劇情。
? 多元語(yǔ)境適配:針對(duì)不同題材(古風(fēng)、科幻、都市等)具備豐富的風(fēng)格化表達(dá)與背景知識(shí)。
01
中英雙開(kāi)源,核心技術(shù)創(chuàng)新
依托兩大核心技術(shù)創(chuàng)新,XVERSE-Ent實(shí)現(xiàn)“通用能力穩(wěn)、領(lǐng)域適配準(zhǔn)、部署成本低” 的核心優(yōu)勢(shì),分別開(kāi)源中英雙版本模型,精準(zhǔn)滿足多語(yǔ)言泛娛樂(lè)創(chuàng)作與全球化出海需求,形成 “技術(shù)筑基 + 多語(yǔ)言拓展” 的完整泛娛樂(lè)開(kāi)源方案。技術(shù)創(chuàng)新如下:
1、MoE 熱啟動(dòng)技術(shù):基于一個(gè) Dense 模型改造出一個(gè) MoE 模型。第一步,將 Dense 模型的 FFN 部分進(jìn)行細(xì)粒度拆分,得到多個(gè)子網(wǎng)絡(luò),每個(gè)子網(wǎng)絡(luò)作為 MoE 模型的一個(gè)專家;結(jié)合推理時(shí)的顯存大小,對(duì)專家子網(wǎng)絡(luò)進(jìn)行一定次數(shù)的復(fù)制。第二步,復(fù)用 Dense 模型的 attention 部分。
FFN 部分的細(xì)粒度拆分方式如下圖所示。圖中,完整的 FFN 被拆分為 2 個(gè)子網(wǎng)絡(luò)。
![]()
相對(duì)的,完整 FFN 不做拆分作為一個(gè)專家的方式,稱為粗粒度,如下圖所示。在實(shí)踐中,細(xì)粒度拆分方式的效果更好,也能更靈活地根據(jù)硬件配置進(jìn)行模型結(jié)構(gòu)的設(shè)計(jì)。
![]()
2、多階段訓(xùn)練策略:通過(guò) S0 能力重建、S1 語(yǔ)言傾斜、S2 領(lǐng)域增強(qiáng)三個(gè)階段的訓(xùn)練,構(gòu)建適用于特定語(yǔ)言、特定領(lǐng)域的專用模型。前 2 個(gè)階段的數(shù)據(jù)為通用數(shù)據(jù),后 1 個(gè)階段的數(shù)據(jù)為通用數(shù)據(jù)和領(lǐng)域數(shù)據(jù)的混合。
整體流程示意如下:
![]()
本次開(kāi)源包含兩大文本模態(tài)模型,滿足多語(yǔ)言應(yīng)用落地需求:
? 中文:XVERSE-Ent-A4.2B,總參數(shù)量25B,由通用底座 XVERSE-MoE-A4.2B 經(jīng)過(guò) S2 領(lǐng)域增強(qiáng)獲得,針對(duì)中文語(yǔ)境下的角色扮演、故事生成、對(duì)話互動(dòng)進(jìn)行了極致優(yōu)化,文化契合度高。
? 英文:XVERSE-Ent-A5.7B,總參數(shù)量36B,依托成熟的出海應(yīng)用經(jīng)驗(yàn)打造,在英文創(chuàng)意寫作、游戲?qū)υ捈翱缥幕涣鲌?chǎng)景中表現(xiàn)優(yōu)異。
中英文模型的上下文窗口大小均為8K,經(jīng)過(guò)了近萬(wàn)億 token 數(shù)據(jù)的訓(xùn)練。
模型現(xiàn)已在Github、Huggingface與魔搭開(kāi)源:
? HuggingFace:
https://huggingface.co/xverse/XVERSE-Ent-A4.2B
https://huggingface.co/xverse/XVERSE-Ent-A5.7B
? ModelScope:
https://modelscope.cn/models/xverse/XVERSE-Ent-A4.2B
https://modelscope.cn/models/xverse/XVERSE-Ent-A5.7B
? Github:https://github.com/xverse-ai/XVERSE-Ent
02
性能卓越,低成本部署
評(píng)測(cè)結(jié)果顯示,XVERSE-Ent 泛娛樂(lè)模型不僅在小說(shuō)與對(duì)話生成等泛娛樂(lè)核心任務(wù)上表現(xiàn)卓越,更在MMLU、數(shù)學(xué)、代碼等通用能力上基本不下降,能力保留98%以上。這標(biāo)志著模型成功實(shí)現(xiàn)了“專精”與“通用”的平衡:既成為特定領(lǐng)域的專家,又保持了應(yīng)對(duì)多樣任務(wù)的全能選手潛力,從根本上規(guī)避了能力單一化的風(fēng)險(xiǎn)。
![]()
![]()
XVERSE-Ent 中英文模型評(píng)測(cè)結(jié)果
(*X開(kāi)頭的為領(lǐng)域能力相關(guān)的指標(biāo),數(shù)值越低越好;
fiction:小說(shuō)類文本構(gòu)成的測(cè)試集
conversation:對(duì)話類文本構(gòu)成的測(cè)試集
webcc:通用文本構(gòu)成的測(cè)試集)
模型支持高并發(fā)低成本部署方案,支持云端單卡部署,實(shí)現(xiàn)推理成本與處理效率的平衡,大幅降低開(kāi)發(fā)者的部署門檻與運(yùn)維成本。
03
落地成效顯著,賦能產(chǎn)品全球化布局
泛娛樂(lè)產(chǎn)業(yè)作為數(shù)字經(jīng)濟(jì)的重要增長(zhǎng)體,市場(chǎng)空間巨大,模型應(yīng)用量極高。根據(jù)前不久OpenRouter 與 a16z 聯(lián)合發(fā)布的基于全球300多個(gè)模型的百萬(wàn)億級(jí) token 數(shù)據(jù)分析報(bào)告顯示,角色扮演已成為開(kāi)源模型最主要的落地場(chǎng)景,占據(jù)超過(guò)50%的開(kāi)源模型使用量,尤其在游戲化互動(dòng)、創(chuàng)意敘事等泛娛樂(lè)場(chǎng)景中備受青睞。
![]()
角色扮演在2025年開(kāi)源模型應(yīng)用中占比最高
源自:《State of AI:An Empirical 100 Trillion Token Study with OpenRouter》
元象將聚焦泛娛樂(lè)的模型 XVERSE-Ent開(kāi)源,正精準(zhǔn)契合這一市場(chǎng)需求,以開(kāi)源模型賦能千行百業(yè),旨在與全球開(kāi)發(fā)者共建繁榮、共享進(jìn)步的泛娛樂(lè) AI 生態(tài)。
目前,XVERSE-Ent已成功落地 AI 社交產(chǎn)品 “Saylo”。依托模型在泛娛樂(lè)場(chǎng)景的深度技術(shù)賦能,Saylo在全球幾十個(gè)國(guó)家和地區(qū)登上免費(fèi)榜單和暢銷榜單前列,在美國(guó)、德國(guó)、法國(guó)、意大利、拉美地區(qū)均收獲海量用戶和穩(wěn)健商業(yè)回報(bào)。模型在劇情連貫性、角色人設(shè)統(tǒng)一性、多輪交互趣味性等核心指標(biāo)上表現(xiàn)突出,驗(yàn)證了技術(shù)創(chuàng)新與商業(yè)落地的高效融合。
元象始終堅(jiān)信開(kāi)源是加速技術(shù)創(chuàng)新與產(chǎn)業(yè)普及的最有效路徑。作為長(zhǎng)期深耕開(kāi)源生態(tài)的踐行者,元象已相繼成功開(kāi)源、、等重量級(jí)通用底座大模型,及,能夠進(jìn)行多樣化的場(chǎng)景適配,構(gòu)建起覆蓋通用能力、輕量化部署等多維度的開(kāi)源模型全家桶。
此次 XVERSE-Ent 泛娛樂(lè)大模型的發(fā)布與開(kāi)源,將進(jìn)一步完善元象開(kāi)源生態(tài)布局,為中小開(kāi)發(fā)者與泛娛樂(lè)企業(yè)降低創(chuàng)新門檻,未來(lái)元象還將探索多模態(tài)生成能力,持續(xù)拓展泛娛樂(lè) AI 的應(yīng)用邊界,讓開(kāi)源成果惠及更多場(chǎng)景與用戶。
未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.