文档备案控制台

开发者社区 ModelScope模型即服务多模态文章正文

AigcPanel：开源的 AI 虚拟数字人系统，一键安装开箱即用，支持视频合成、声音合成和声音克隆

2025-01-04 1765

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： AigcPanel 是一款开源的 AI 虚拟数字人系统，支持视频合成、声音克隆等功能，适用于影视制作、虚拟主播、教育培训等多种场景。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

功能：支持视频合成、声音克隆、语音合成等核心功能，提供沉浸式视听体验。
技术：基于深度学习和神经网络，结合自然语言处理和计算机视觉技术，实现精准的声音和视频同步。
应用：适用于影视制作、虚拟主播、教育培训、客服支持等多种场景。

正文（附运行示例）

AigcPanel 是什么

公众号: 蚝油菜花 - aigcpanel

AigcPanel 是一款开源的一站式 AI 虚拟数字人系统，支持视频合成、声音合成和声音克隆等核心功能。系统基于 TypeScript 开发，跨平台兼容，遵循 AGPL-3.0 协议，适合小白用户和专业开发者使用。

AigcPanel 通过自然流畅的口型匹配、智能音视频同步优化、精准声音克隆和自然语音合成技术，为用户提供沉浸式的视觉和听觉体验。系统还支持多模型导入、一键启动、精细模型设置、性能优化和全面的日志查看，满足个性化创作需求。

AigcPanel 的主要功能

视频合成：将数字人的视频画面与声音高度同步，实现自然流畅的口型匹配，为视频内容增添真实感和可信度。
声音克隆与合成：捕捉并还原人声的细微特征，实现声音的精准复制，及将文字转换为自然流畅的语音，适用于多种场景。
模型管理：支持多模型导入和一键启动，简化模型使用流程，提供模型参数的精细调整和性能优化。
国际化支持：系统支持多种语言，包括简体中文和英语，满足全球用户的多元化语言需求。
模型日志查看：提供全面的模型运行状态监控和分析，帮助用户及时发现并优化问题。
多种模型一键启动包：提供不同的模型启动包，如 MuseTalk、cosyvoice 等，满足不同创作需求和应用场景。

AigcPanel 的技术原理

深度学习与神经网络：基于深度学习技术，特别是神经网络，模拟和学习人类的声音和视觉特征。
自然语言处理（NLP）：理解和生成自然语言，让系统将文本转换为自然流畅的语音。
计算机视觉技术：用于视频合成中的视觉处理，包括面部识别、表情捕捉和口型分析，实现视频与声音的同步。
声音处理技术：包括声音克隆和语音合成技术，分析和模仿声音特征，生成逼真的人声。
跨平台开发框架：基于 TypeScript 开发，确保系统的跨平台兼容性，能在不同操作系统上运行。

如何运行 AigcPanel

1. 安装

访问 https://aigcpanel.com 下载 Windows 安装包，一键安装即可。

2. 启动

安装完成后，打开软件，下载模型一键启动包，即可使用。

3. 开发环境

如果你想在本地运行开发，可以按照以下步骤操作：

# 安装依赖
npm install
# 调试运行
npm run dev
# 打包
npm run build

资源

项目官网：https://aigcpanel.com
GitHub 仓库：https://github.com/modstart-lib/aigcpanel
CosyVoice 项目：https://github.com/FunAudioLLM/CosyVoice
MuseTalk 项目：https://github.com/TMElyralab/MuseTalk

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

文章标签：

虚拟数字人

图像识别

自然语言处理

人工智能

机器学习/深度学习

自然语言处理

语音技术

JavaScript

关键词：

AI系统

开源虚拟数字人

开源AI系统

AI安装

AI系统安装

蚝油菜花

目录

相关文章

PHP小志

|

6月前

|

机器学习/深度学习人工智能 JSON

PHP从0到1实现 AI 智能体系统并且训练知识库资料

本文详解如何用PHP从0到1构建AI智能体，涵盖提示词设计、记忆管理、知识库集成与反馈优化四大核心训练维度，结合实战案例与系统架构，助你打造懂业务、会进化的专属AI助手。

PHP小志

840 6 6

Deephub

|

6月前

|

存储人工智能搜索推荐

LangGraph 记忆系统实战：反馈循环 + 动态 Prompt 让 AI 持续学习

本文介绍基于LangGraph构建的双层记忆系统，通过短期与长期记忆协同，实现AI代理的持续学习。短期记忆管理会话内上下文，长期记忆跨会话存储用户偏好与决策，结合人机协作反馈循环，动态更新提示词，使代理具备个性化响应与行为进化能力。

Deephub

1205 10 11

LangGraph 记忆系统实战：反馈循环 + 动态 Prompt 让 AI 持续学习

麦小生

|

6月前

|

人工智能 JSON 安全

Claude Code插件系统：重塑AI辅助编程的工作流

Anthropic为Claude Code推出插件系统与市场，支持斜杠命令、子代理、MCP服务器等功能模块，实现工作流自动化与团队协作标准化。开发者可封装常用工具或知识为插件，一键共享复用，构建个性化AI编程环境，推动AI助手从工具迈向生态化平台。

麦小生

1670 1 1

阿里云开发者

|

6月前

|

人工智能监控安全

提效40%？揭秘AI驱动的支付方式“一键接入”系统

本项目构建AI驱动的研发提效系统，通过Qwen Coder与MCP工具链协同，实现跨境支付渠道接入的自动化闭环。采用多智能体协作模式，结合结构化Prompt、任务拆解、流程管控与安全约束，显著提升研发效率与交付质量，探索大模型在复杂业务场景下的高采纳率编码实践。

阿里云开发者

695 26 27

提效40%？揭秘AI驱动的支付方式“一键接入”系统

探索云世界

|

6月前

|

人工智能自然语言处理前端开发

最佳实践2：用通义灵码以自然语言交互实现 AI 高考志愿填报系统

本项目旨在通过自然语言交互，结合通义千问AI模型，构建一个智能高考志愿填报系统。利用Vue3与Python，实现信息采集、AI推荐、专业详情展示及数据存储功能，支持响应式设计与Supabase数据库集成，助力考生精准择校选专业。（239字）

探索云世界

628 12 13

游客ya34xkpn34owu

|

6月前

|

人工智能自然语言处理搜索推荐

数字人｜数字人平台全域技术分析

在AI与元宇宙驱动下，数字人正重塑千行百业。本文解析行业生态，聚焦技术领军者像衍科技——依托顶尖科研实力，打造全栈技术闭环，推动数字人在医疗、工业、教育等高价值场景规模化落地，树立“技术驱动”新标杆。（238字）

游客ya34xkpn34owu

247 2 2

ModelScope内容运营小助手

|

API 语音技术开发者

基于开源技术的数字人实时对话：形象可自定义，支持语音输入，对话首包延迟可低至3s

魔搭社区最近上线了基于开源技术的数字人实时对话demo，无需预训练即可使用自定义的数字人形象进行实时对话，支持语音输入和实时对话。

ModelScope内容运营小助手

4120 0 0

AI之家

|

机器学习/深度学习人工智能自然语言处理

【人工智能】python之人工智能应用篇--数字人生成技术

数字人生成技术是基于人工智能技术和计算机图形学技术创建的虚拟人物形象的技术。该技术能够模拟人类的外貌、声音、动作和交流能力，为多个领域带来创新的应用可能性。数字人的本质是将所有信息（数字和文字）通过数字处理（如计算机视觉、语音识别等）再进行表达的过程，形成具有人类形态和行为的数字产物。数字人的生成涉及到多种技术，如3D重建技术，使用三维扫描仪扫描人的外观、五官等，并通过3D模型重建三维人；虚拟直播技术，使用计算机技术生成人物或实体，并且可以实时直播、录制；数字人体数据集技术，利用数据构建数字人模型以及训练虚拟现实引擎等

AI之家

858 4 4

青否数字人源码

|

新零售人工智能 vr&ar

国家发展改革委等部门：鼓励利用数字人等技术拓展电商直播场景！

国家发改委推出措施鼓励创新消费场景，特别提到利用AI、VR等技术增强购物体验，支持数字人电商。青否数字人直播系统提供独立部署方案，适应抖音直播并解决封号问题，具备实时话术改写和AI智能回复功能，确保互动合规。此系统适用于24小时直播，降低商家成本，提升效率。欲了解更多信息，可访问：zhibo175。

青否数字人源码

311 2 2

国家发展改革委等部门：鼓励利用数字人等技术拓展电商直播场景！

ModelScope模型即服务

多模态

热门文章

最新文章

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Claude Code 源码泄露，升级 OpenClaw 的研究方案

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

AnythingLLM：34K Star！一键上传文件轻松打造个人知识库，构建只属于你的AI助手，附详细部署教程

AstrBot：轻松将大模型接入QQ、微信等消息平台，打造多功能AI聊天机器人的开发框架，附详细教程

MarkItDown：微软开源的多格式转Markdown工具，支持将PDF、Word、图像和音频等文件转换为Markdown格式

moonshot-v1-vision-preview：月之暗面Kimi推出多模态视觉理解模型，支持图像识别、OCR文字识别、数据提取

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

Claude Code 源码泄露，升级 OpenClaw 的研究方案

从统计相关性到结构性必然性：一个解决AI幻觉与对齐问题的框架探讨

别再只依赖 ChatGPT 了：多模型协同，才是 AI 项目走向生产的关键一步

工程师思维看透人心？这个“集成框架”可能颠覆了个人成长领域

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

PPO最强，DPO一般？一文带你了解常见三种强化学习方法，文末推荐大模型微调神器！

RAGEN：RL训练LLM推理新范式！开源强化学习框架让Agent学会多轮决策

开源8B参数全能扩散模型Flex.2-preview：把线稿变商稿，还能边画边改！

AI生成视频告别剪辑拼接！MAGI-1：开源自回归视频生成模型，支持一镜到底的长视频生成

机器人训练师狂喜！Infinite Mobility：上海AI Lab造物神器1秒生成可动家具，成本只要1分钱

相关课程

更多

AI上云实战

中国铁道科学研究院 × 阿里云AI应用开发实训营

通义灵码2.0 AI 编码训练营

AI应用开发

基于Gradio的AI应用搭建实践课

AI通识课-人工智能通识基础

相关电子书

更多

智驱未来，云网随行：打造AI应用开发&交付网络架构新范式

产品领导力：简单易用的智能云网络，助力企业出海和AI创新

从云原生到 AI 原生核心技术 & 最佳实践

相关实验场景

更多

使用AI容器镜像部署Qwen大语言模型

【玩转ComfyUI】基于函数计算一键部署AI生图平台ComfyUI

下一篇

PHP：将本地文件上传到阿里云OSS存储