业内首发泛娱乐底座大模型!元象开源XVERSE-Ent中英双模型,单卡部署超低门槛

简介: 元象开源首款聚焦泛娱乐场景的大模型XVERSE-Ent,含中英双版本,专精角色一致性、长剧情理解与多元语境适配,支持轻量化部署,助力开发者低成本打造AI社交、游戏与创意内容应用。

元象正式开源聚焦泛娱乐场景的底座大模型 XVERSE-Ent,包含中、英文双版本。模型深度适配泛娱乐(Entertainment)核心领域,覆盖社交互动、游戏叙事、文化创作(含小说、剧本)等关键场景,支持轻量化部署与垂直场景深度落地,填补了泛娱乐领域专属开源大模型的空白。


XVERSE-Ent 在通用大模型能力基础上,依托元象 AI 泛娱乐产品服务全球千万级用户的实践经验,经稀缺的垂直领域数据深度训练与优化,在角色一致性、剧情逻辑等方面能更精准地契合泛娱乐场景的真实需求,为中小开发者与泛娱乐企业提供了低成本、高效率的泛娱乐创新底座模型。模型特色主要体现为:


角色一致性强化:能长期保持虚拟角色人设、记忆与说话风格稳定,有效优化“遗忘”或“出戏”的问题。

长剧情精准理解:精准把握复杂故事线、人物关系与伏笔,生成逻辑合理的剧情。

多元语境适配:针对不同题材(古风、科幻、都市等)具备丰富的风格化表达与背景知识。


中英双开源,核心技术创新

依托两大核心技术创新,XVERSE-Ent 实现 “通用能力稳、领域适配准、部署成本低” 的核心优势,分别开源中英双版本模型,精准满足多语言泛娱乐创作与全球化出海需求,形成 “技术筑基 + 多语言拓展” 的完整泛娱乐开源方案。技术创新如下:


1、MoE 热启动技术:基于一个 Dense 模型改造出一个 MoE 模型。第一步,将 Dense 模型的 FFN 部分进行细粒度拆分,得到多个子网络,每个子网络作为 MoE 模型的一个专家;结合推理时的显存大小,对专家子网络进行一定次数的复制。第二步,复用 Dense 模型的 attention 部分。


FFN 部分的细粒度拆分方式如下图所示。图中,完整的 FFN 被拆分为了 2 个子网络。

相对的,完整 FFN 不做拆分作为一个专家的方式,称为粗粒度,如下图所示。在实践中,细粒度拆分方式的效果更好,也能更灵活地根据硬件配置进行模型结构的设计。

2、多阶段训练策略:通过 S0 能力重建、S1 语言倾斜、S2 领域增强三个阶段的训练,构建适用于特定语言、特定领域的专用模型。前 2 个阶段的数据为通用数据,后 1 个阶段的数据为通用数据和领域数据的混合。


整体流程示意如下:

本次开源包含两大文本模态模型,满足多语言应用落地需求:


● 中文:XVERSE-Ent-A4.2B,总参数量25B,由通用底座 XVERSE-MoE-A4.2B 经过 S2 领域增强获得,针对中文语境下的角色扮演、故事生成、对话互动进行了极致优化,文化契合度高。


● 英文:XVERSE-Ent-A5.7B,总参数量36B,依托成熟的出海应用经验打造,在英文创意写作、游戏对话及跨文化交流场景中表现优异。


中英文模型的上下文窗口大小均为8K,经过了近万亿 token 数据的训练。


模型现已开源:

● ModelScope:

https://modelscope.cn/models/xverse/XVERSE-Ent-A4.2B

https://modelscope.cn/models/xverse/XVERSE-Ent-A5.7B


● Github:https://github.com/xverse-ai/XVERSE-Ent


性能卓越,低成本部署

评测结果显示,XVERSE-Ent 泛娱乐模型不仅在小说与对话生成等泛娱乐核心任务上表现卓越,更在MMLU、数学、代码等通用能力上基本不下降,能力保留98%以上。这标志着模型成功实现了“专精”与“通用”的平衡:既成为特定领域的专家,又保持了应对多样任务的全能选手潜力,从根本上规避了能力单一化的风险。


XVERSE-Ent 中英文模型评测结果

(*X开头的为领域能力相关的指标,数值越低越好

fiction:小说类文本构成的测试集

conversation:对话类文本构成的测试集;

webcc:通用文本构成的测试集)


模型支持高并发低成本部署方案,支持云端单卡部署,实现推理成本与处理效率的平衡,大幅降低开发者的部署门槛与运维成本。


落地成效显著,赋能产品全球化布局

泛娱乐产业作为数字经济的重要增长体,市场空间巨大,模型应用量极高。根据前不久OpenRouter 与 a16z 联合发布的基于全球300多个模型的百万亿级 token 数据分析报告显示,角色扮演已成为开源模型最主要的落地场景,占据超过50%的开源模型使用量,尤其在游戏化互动、创意叙事等泛娱乐场景中备受青睐。

角色扮演在2025年开源模型应用中占比最高

源自:《State of AI:An Empirical 100 Trillion Token Study with OpenRouter》


元象将聚焦泛娱乐的模型 XVERSE-Ent 开源,正精准契合这一市场需求,以开源模型赋能千行百业,旨在与全球开发者共建繁荣、共享进步的泛娱乐 AI 生态。


目前,XVERSE-Ent已成功落地 AI 社交产品 “Saylo”。依托模型在泛娱乐场景的深度技术赋能,Saylo在全球几十个国家和地区登上免费榜单和畅销榜单前列,在美国、德国、法国、意大利、拉美地区均收获海量用户和稳健商业回报。模型在剧情连贯性、角色人设统一性、多轮交互趣味性等核心指标上表现突出,验证了技术创新与商业落地的高效融合。


元象始终坚信开源是加速技术创新与产业普及的最有效路径。作为长期深耕开源生态的践行者,元象已相继成功开源国内最大参数Dense模型XVERSE-65B(2023年)、国内最大参数MoE模型XVERSE-MoE-A36B(2024年)、世界最长上下文模型XVERSE-Long(2024年)等重量级通用底座大模型,及 XVERSE-V 多模态模型,能够进行多样化的场景适配,构建起覆盖通用能力、轻量化部署等多维度的开源模型全家桶。


此次 XVERSE-Ent 泛娱乐大模型的发布与开源,将进一步完善元象开源生态布局,为中小开发者与泛娱乐企业降低创新门槛,未来元象还将探索多模态生成能力,持续拓展泛娱乐 AI 的应用边界,让开源成果惠及更多场景与用户。

目录
相关文章
|
7天前
|
人工智能 自然语言处理 数据可视化
告别高成本定制:友盟U-AgentBox上线,开发者可一键集成行业模板,3天打造专属企业Agent
12月29日,蚂蚁百宝箱与友盟联合推出面向开发者的智能体产品U-AgentBox,聚焦低门槛、高效率集成专属智能体。通过模板化构建、可视化编辑与轻量级部署,助力开发者快速实现业务智能化升级。
103 9
|
2天前
|
机器学习/深度学习 测试技术 数据中心
九坤量化开源IQuest-Coder-V1,代码大模型进入“流式”训练时代
2026年首日,九坤创始团队成立的至知创新研究院开源IQuest-Coder-V1系列代码大模型,涵盖7B至40B参数,支持128K上下文与GQA架构,提供Base、Instruct、Thinking及Loop版本。采用创新Code-Flow训练范式,模拟代码演化全过程,提升复杂任务推理能力,在SWE-Bench、LiveCodeBench等基准领先。全阶段checkpoint开放,支持本地部署与微调,助力研究与应用落地。
336 1
|
20天前
|
机器学习/深度学习 缓存 物联网
打造社交APP人物动漫化:通义万相wan2.x训练优化指南
本项目基于通义万相AIGC模型,为社交APP打造“真人变身跳舞动漫仙女”特效视频生成功能。通过LoRA微调与全量训练结合,并引入Sage Attention、TeaCache、xDIT并行等优化技术,实现高质量、高效率的动漫风格视频生成,兼顾视觉效果与落地成本,最终优选性价比最高的wan2.1 lora模型用于生产部署。(239字)
776 101
|
2月前
|
机器学习/深度学习 人工智能 缓存
让AI评测AI:构建智能客服的自动化运营Agent体系
大模型推动客服智能化演进,从规则引擎到RAG,再到AI原生智能体。通过构建“评估-诊断-优化”闭环的运营Agent,实现对话效果自动化评测与持续优化,显著提升服务质量和效率。
1305 81
让AI评测AI:构建智能客服的自动化运营Agent体系
|
19天前
|
机器学习/深度学习 数据采集 自然语言处理
BOSS直聘3B超越Qwen3-32B,更多训练数据刷新小模型极限
BOSS直聘Nanbeige实验室开源Nanbeige4-3B模型,仅30亿参数却在数学、推理、代码等多领域超越320亿参数大模型。通过23万亿高质量token训练、千万级指令微调及双重蒸馏强化学习,实现小模型性能跃升,为端侧部署与低成本推理提供新范式。
273 5
|
13天前
|
缓存 前端开发 测试技术
GLM-4.7开源!交出“生产级代码”
智谱今日发布并开源GLM-4.7,专注Coding场景,显著提升编程、推理与工具协同能力,在多项基准测试中位居开源模型前列。已上线z.ai与智谱清言,支持API调用。
442 3
|
14天前
|
数据采集 人工智能 分布式计算
只靠国产算力与开源数据,端侧模型预训练行不行?我们做到了全流程开源
鹏城实验室与清华联合发布全流程开源大模型“开元-2B”,基于国产算力实现高效端侧训练。涵盖数据、代码、训练框架与技术报告,推动开放AI生态发展。
112 1
|
20天前
|
设计模式 人工智能 架构师
面对"祖传代码"不敢动?用这条指令让AI做你的首席重构架构师
面对"屎山"代码不敢动?本文介绍了一套专业的AI重构指令,化身拥有15年经验的首席架构师。它能精准识别代码异味,提供基于设计模式的重构方案,并生成验证清单,帮助开发者安全高效地偿还技术债务。
173 7