业内首发泛娱乐底座大模型!元象开源XVERSE-Ent中英双模型,单卡部署超低门槛

简介: 元象开源首款聚焦泛娱乐场景的大模型XVERSE-Ent,含中英双版本,专精角色一致性、长剧情理解与多元语境适配,支持轻量化部署,助力开发者低成本打造AI社交、游戏与创意内容应用。

元象正式开源聚焦泛娱乐场景的底座大模型 XVERSE-Ent,包含中、英文双版本。模型深度适配泛娱乐(Entertainment)核心领域,覆盖社交互动、游戏叙事、文化创作(含小说、剧本)等关键场景,支持轻量化部署与垂直场景深度落地,填补了泛娱乐领域专属开源大模型的空白。


XVERSE-Ent 在通用大模型能力基础上,依托元象 AI 泛娱乐产品服务全球千万级用户的实践经验,经稀缺的垂直领域数据深度训练与优化,在角色一致性、剧情逻辑等方面能更精准地契合泛娱乐场景的真实需求,为中小开发者与泛娱乐企业提供了低成本、高效率的泛娱乐创新底座模型。模型特色主要体现为:


角色一致性强化:能长期保持虚拟角色人设、记忆与说话风格稳定,有效优化“遗忘”或“出戏”的问题。

长剧情精准理解:精准把握复杂故事线、人物关系与伏笔,生成逻辑合理的剧情。

多元语境适配:针对不同题材(古风、科幻、都市等)具备丰富的风格化表达与背景知识。


中英双开源,核心技术创新

依托两大核心技术创新,XVERSE-Ent 实现 “通用能力稳、领域适配准、部署成本低” 的核心优势,分别开源中英双版本模型,精准满足多语言泛娱乐创作与全球化出海需求,形成 “技术筑基 + 多语言拓展” 的完整泛娱乐开源方案。技术创新如下:


1、MoE 热启动技术:基于一个 Dense 模型改造出一个 MoE 模型。第一步,将 Dense 模型的 FFN 部分进行细粒度拆分,得到多个子网络,每个子网络作为 MoE 模型的一个专家;结合推理时的显存大小,对专家子网络进行一定次数的复制。第二步,复用 Dense 模型的 attention 部分。


FFN 部分的细粒度拆分方式如下图所示。图中,完整的 FFN 被拆分为了 2 个子网络。

相对的,完整 FFN 不做拆分作为一个专家的方式,称为粗粒度,如下图所示。在实践中,细粒度拆分方式的效果更好,也能更灵活地根据硬件配置进行模型结构的设计。

2、多阶段训练策略:通过 S0 能力重建、S1 语言倾斜、S2 领域增强三个阶段的训练,构建适用于特定语言、特定领域的专用模型。前 2 个阶段的数据为通用数据,后 1 个阶段的数据为通用数据和领域数据的混合。


整体流程示意如下:

本次开源包含两大文本模态模型,满足多语言应用落地需求:


● 中文:XVERSE-Ent-A4.2B,总参数量25B,由通用底座 XVERSE-MoE-A4.2B 经过 S2 领域增强获得,针对中文语境下的角色扮演、故事生成、对话互动进行了极致优化,文化契合度高。


● 英文:XVERSE-Ent-A5.7B,总参数量36B,依托成熟的出海应用经验打造,在英文创意写作、游戏对话及跨文化交流场景中表现优异。


中英文模型的上下文窗口大小均为8K,经过了近万亿 token 数据的训练。


模型现已开源:

● ModelScope:

https://modelscope.cn/models/xverse/XVERSE-Ent-A4.2B

https://modelscope.cn/models/xverse/XVERSE-Ent-A5.7B


● Github:https://github.com/xverse-ai/XVERSE-Ent


性能卓越,低成本部署

评测结果显示,XVERSE-Ent 泛娱乐模型不仅在小说与对话生成等泛娱乐核心任务上表现卓越,更在MMLU、数学、代码等通用能力上基本不下降,能力保留98%以上。这标志着模型成功实现了“专精”与“通用”的平衡:既成为特定领域的专家,又保持了应对多样任务的全能选手潜力,从根本上规避了能力单一化的风险。


XVERSE-Ent 中英文模型评测结果

(*X开头的为领域能力相关的指标,数值越低越好

fiction:小说类文本构成的测试集

conversation:对话类文本构成的测试集;

webcc:通用文本构成的测试集)


模型支持高并发低成本部署方案,支持云端单卡部署,实现推理成本与处理效率的平衡,大幅降低开发者的部署门槛与运维成本。


落地成效显著,赋能产品全球化布局

泛娱乐产业作为数字经济的重要增长体,市场空间巨大,模型应用量极高。根据前不久OpenRouter 与 a16z 联合发布的基于全球300多个模型的百万亿级 token 数据分析报告显示,角色扮演已成为开源模型最主要的落地场景,占据超过50%的开源模型使用量,尤其在游戏化互动、创意叙事等泛娱乐场景中备受青睐。

角色扮演在2025年开源模型应用中占比最高

源自:《State of AI:An Empirical 100 Trillion Token Study with OpenRouter》


元象将聚焦泛娱乐的模型 XVERSE-Ent 开源,正精准契合这一市场需求,以开源模型赋能千行百业,旨在与全球开发者共建繁荣、共享进步的泛娱乐 AI 生态。


目前,XVERSE-Ent已成功落地 AI 社交产品 “Saylo”。依托模型在泛娱乐场景的深度技术赋能,Saylo在全球几十个国家和地区登上免费榜单和畅销榜单前列,在美国、德国、法国、意大利、拉美地区均收获海量用户和稳健商业回报。模型在剧情连贯性、角色人设统一性、多轮交互趣味性等核心指标上表现突出,验证了技术创新与商业落地的高效融合。


元象始终坚信开源是加速技术创新与产业普及的最有效路径。作为长期深耕开源生态的践行者,元象已相继成功开源国内最大参数Dense模型XVERSE-65B(2023年)、国内最大参数MoE模型XVERSE-MoE-A36B(2024年)、世界最长上下文模型XVERSE-Long(2024年)等重量级通用底座大模型,及 XVERSE-V 多模态模型,能够进行多样化的场景适配,构建起覆盖通用能力、轻量化部署等多维度的开源模型全家桶。


此次 XVERSE-Ent 泛娱乐大模型的发布与开源,将进一步完善元象开源生态布局,为中小开发者与泛娱乐企业降低创新门槛,未来元象还将探索多模态生成能力,持续拓展泛娱乐 AI 的应用边界,让开源成果惠及更多场景与用户。

目录
相关文章
|
2月前
|
人工智能 自然语言处理 数据可视化
告别高成本定制:友盟U-AgentBox上线,开发者可一键集成行业模板,3天打造专属企业Agent
12月29日,蚂蚁百宝箱与友盟联合推出面向开发者的智能体产品U-AgentBox,聚焦低门槛、高效率集成专属智能体。通过模板化构建、可视化编辑与轻量级部署,助力开发者快速实现业务智能化升级。
266 9
|
1月前
|
人工智能 定位技术
不读完这3000篇文献就没法写论文?你的"穷举法"正在拖垮你的科研生涯
针对科研人员面临的"文献海量增长"困境,本文提出了一种基于系统性综述方法论的AI指令方案。通过"认知跃迁"和"三种实战模式",帮助研究者从机械阅读转向精密过滤,利用AI构建高质量的学术综述框架。
185 8
|
2月前
|
机器学习/深度学习 缓存 物联网
打造社交APP人物动漫化:通义万相wan2.x训练优化指南
本项目基于通义万相AIGC模型,为社交APP打造“真人变身跳舞动漫仙女”特效视频生成功能。通过LoRA微调与全量训练结合,并引入Sage Attention、TeaCache、xDIT并行等优化技术,实现高质量、高效率的动漫风格视频生成,兼顾视觉效果与落地成本,最终优选性价比最高的wan2.1 lora模型用于生产部署。(239字)
1204 103
|
1月前
|
机器学习/深度学习 测试技术 数据中心
九坤量化开源IQuest-Coder-V1,代码大模型进入“流式”训练时代
2026年首日,九坤创始团队成立的至知创新研究院开源IQuest-Coder-V1系列代码大模型,涵盖7B至40B参数,支持128K上下文与GQA架构,提供Base、Instruct、Thinking及Loop版本。采用创新Code-Flow训练范式,模拟代码演化全过程,提升复杂任务推理能力,在SWE-Bench、LiveCodeBench等基准领先。全阶段checkpoint开放,支持本地部署与微调,助力研究与应用落地。
928 2
|
2月前
|
IDE 开发工具 C++
Python 初学者常见 10 大误区与避坑指南
本文总结Python初学者易犯的10大编码误区,如缩进错误、混淆“==”与“is”、修改迭代列表等,结合典型案例解析原因并提供实用解决方案,帮助新手规避常见陷阱,建立正确的Python编程思维,提升代码质量与可读性。
|
1月前
|
数据采集 自然语言处理 算法
重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0
智元机器人发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0,基于NVIDIA Isaac Sim,实现高保真数字孪生环境,支持自然语言生成万级场景,分钟级构建与泛化。平台开源上万小时真实机器人作业数据集,覆盖200+任务,构建10万+场景评估体系,推动具身智能从研发到落地的全链路创新,助力开发者零硬件部署、高效训练与评测。
245 4
|
1月前
|
机器学习/深度学习 存储 人工智能
国内首个全国产化千亿参数细粒度 MoE:开源!
TeleChat3-105B-A4.7-Thinking,国内首个全国产化千亿参数细粒度MoE大模型,开源!代码、数学、Agent等多能力比肩头部,支持高效任务拆解与代码生成。
204 2
国内首个全国产化千亿参数细粒度 MoE:开源!
|
3月前
|
机器学习/深度学习 人工智能 缓存
让AI评测AI:构建智能客服的自动化运营Agent体系
大模型推动客服智能化演进,从规则引擎到RAG,再到AI原生智能体。通过构建“评估-诊断-优化”闭环的运营Agent,实现对话效果自动化评测与持续优化,显著提升服务质量和效率。
2060 86
让AI评测AI:构建智能客服的自动化运营Agent体系
|
1月前
|
人工智能 数据可视化 物联网
《显卡 4090 就能跑!小白也能炼出私有大模型》
大模型微调是AI落地的关键技术,通过定向训练让通用模型在特定领域“从会到精”。本文详解微调原理、LoRA/QLoRA等高效方法,并提供评估与实操建议,助力新手快速上手,实现低成本、高精度的模型定制。
375 4
|
1月前
|
人工智能 自然语言处理 数据挖掘
Qwen3-VL-Embedding & Qwen3-VL-Reranker:统一多模态表征与排序
通义千问Qwen团队于2025年1月8日推出多模态模型新成员:Qwen3-VL-Embedding与Qwen3-VL-Reranker,基于Qwen3-VL构建,支持文本、图像、视频等多模态统一表示与跨模态检索,在图文匹配、视觉问答等任务中表现卓越,具备高精度、多语言、易集成等优势,助力全球开发者构建高效多模态应用。
1172 4

热门文章

最新文章