用Fay搭建了数字人

简介: 用Fay搭建了数字人

流程

大概是这么一个流程,先去配置server端,然后去配置ue端代码,再接着去android端的。一步一步来,一起学习学习。

server端

去git下载开源代码,然后按照指引一步一个脚印往下走。如下图:

我的python版本有点高,还专门做了个降级。然后就是安装依赖,不好意思,开了梯子,搞了半个小时。突然发现是开了梯子。看我之前写的文章。然后是去配置文件,配置自己需要的参数,如下图,

还有个阿里云的,如下图:

这块申请好,配对了,就可以出现如下图了。

可以看右侧的聊天;还有就是语音聊天,左边的麦克风这些配置。server端基本上就这么多了。接下来看看ue的客户端。

ue端

很多小伙伴都卡在ue的客户端这了,因为ue更新,很多库都不支持了。还好我这有之前版本的库存。哈哈哈。先看一下运行效果,如下图:

,加上一些聊天内容吧,如下图:

手机控制音频没有开。大概吧,就是这样的。抽空想想把一些内容加入到实际项目中,做点什么。

小结

还好吧,关键是流程,流程对了,有些东西就是时间的问题,这边所有内容调试完,也就不到2day吧,时间再多,也许就不合适了。OK,结束了。接下来,开启新的模块。

相关文章
|
数据采集 人工智能 Rust
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
2867 0
|
Web App开发 人工智能 Android开发
5.3K star!硅基生命新纪元,这个开源数字人框架要火!
"只需3分钟视频素材,就能打造专属数字分身!" "开源免费商用,支持安卓/iOS/Web全平台运行" "法律咨询、虚拟陪伴、教育导师...解锁AI数字人无限可能"
1435 5
|
存储 人工智能 前端开发
vue3.5接入deepseek-v3网页版ai流式多轮聊天问答助手
vue3-deepseek-webai:原创新作vite6+vue3.5+deepseek-v3+arco-design实战一款高颜值网页版ai多轮输出对话小助手。
1520 14
|
6月前
|
人工智能 自然语言处理 语音技术
智谱开源GLM-ASR:动动嘴,活就干了
智谱发布并开源GLM-ASR系列语音识别模型,推出桌面端AI输入法。包含云端旗舰模型GLM-ASR-2512与端侧轻量版GLM-ASR-Nano-2512(仅1.5B参数),实现高精度、低延迟、强隐私保护的语音转写。输入法集成大模型能力,支持语音指令、翻译、改写、人设切换、Vibe Coding等功能,让用户“动嘴干活”,提升办公效率。现已免费开放体验。
1672 0
|
10月前
|
人工智能 前端开发 JavaScript
前端实现多方言实时转写:VAD端点检测+流式ASR接入,识别准确率提升300%
本文面向前端工程师,详解多方言中文自动语音识别(ASR)的完整落地接入方案,涵盖录音采集、音质增强、编码传输、流式识别、结果合并等关键技术环节,助力实现“即录即识、边说边出字”的实时交互体验。
|
API 语音技术 开发者
基于开源技术的数字人实时对话:形象可自定义,支持语音输入,对话首包延迟可低至3s
魔搭社区最近上线了基于开源技术的数字人实时对话demo,无需预训练即可使用自定义的数字人形象进行实时对话,支持语音输入和实时对话。
|
人工智能 Java 决策智能
Java版Manus实现来了,Spring AI Alibaba发布开源OpenManus实现
此次官方发布的 Spring AI Alibaba OpenManus 实现,包含完整的多智能体任务规划、思考与执行流程,可以让开发者体验 Java 版本的多智能体效果。它能够根据用户的问题进行分析,操作浏览器,执行代码等来完成复杂任务等。
2456 57
|
开发者 异构计算
高效部署通义万相Wan2.1:ComfyUI文生/图生视频实战,工作流直取!
通义万相Wan2.1开源不到一周,已登顶HuggingFace Model 和 Space 榜双榜首,在HuggingFace和ModelScope平台的累计下载量突破100万次,社区热度持续攀升!为响应小伙伴们对ComfyUI工作流运行Wan2.1的强烈需求,社区开发者整理了实战教程👇
13349 23
高效部署通义万相Wan2.1:ComfyUI文生/图生视频实战,工作流直取!