开发者社区 问答 正文

请教下阿里语音AI,阿里ASR自建的软硬件要求是什么?

请教下阿里语音AI,阿里ASR自建的软硬件要求是什么?包括服务器配置和操作系统,数据库这些等等

展开
收起
真的很搞笑 2024-04-04 17:30:08 129 分享 版权
阿里云 AI 助理回答

阿里云的语音AI服务(如Qwen-Audio-Chat)和自动语音识别(ASR)相关的自建部署需要满足一定的软硬件要求。以下是基于知识库资料整理的详细配置和操作建议:


1. 服务器配置

为了保证语音AI服务的稳定运行,推荐使用阿里云ECS实例,并根据模型的计算需求选择合适的实例规格和操作系统。

实例规格

  • 推荐实例类型ecs.g8a.4xlarge
    • CPU:16核
    • 内存:64 GiB
    • 说明:语音AI模型(如Qwen-Audio-Chat)在推理过程中会占用大量计算资源和内存,因此至少需要64 GiB内存以确保运行稳定性。

操作系统

  • 推荐镜像:Alibaba Cloud Linux 3.2104 LTS 64位
    • 阿里云官方优化的Linux镜像,兼容性强且性能优越。
  • 其他支持的操作系统
    • Windows Server(需安装Docker环境并拉取相关容器镜像)。

公网IP与带宽

  • 公网IP:必须分配公网IPv4地址,用于访问WebUI服务和下载模型文件。
  • 带宽计费模式:按使用流量计费,带宽峰值建议设置为100 Mbps,以加快模型文件的下载速度。

存储

  • 系统盘:建议设置为100 GiB或更大。
    • 原因:语音AI模型需要下载多个大型预训练模型文件,占用大量存储空间。

2. 软件环境

语音AI服务通常通过Docker容器化部署,以下为软件环境的具体要求:

Docker环境

  • 安装Docker:在ECS实例中安装Docker,具体操作可参考阿里云官方文档。
  • PyTorch容器镜像
    • 使用龙蜥社区提供的AMD优化PyTorch镜像,命令如下:
    sudo docker pull registry.openanolis.cn/openanolis/pytorch-amd:1.13.1-23-zendnn4.1
    sudo docker run -d -it --name pytorch-amd --net host -v $HOME:/root registry.openanolis.cn/openanolis/pytorch-amd:1.13.1-23-zendnn4.1
    

依赖软件

  • Python依赖
    • 安装必要的Python包,例如transformerseinopsgradio等:
    pip install typing_extensions==4.5.0 tiktoken transformers_stream_generator accelerate gradio
    
  • FFmpeg
    • 用于音频处理,安装命令如下:
    wget https://johnvansickle.com/ffmpeg/releases/ffmpeg-6.1-amd64-static.tar.xz
    tar -xf ffmpeg-6.1-amd64-static.tar.xz
    cp ffmpeg-6.1-amd64-static/{ffmpeg,ffprobe} /usr/local/bin
    rm -rf ffmpeg-6.1-amd64-static*
    

环境变量

  • 设置多线程优化参数:
    cat > /etc/profile.d/env.sh <<EOF
    export OMP_NUM_THREADS=$(nproc --all)
    export GOMP_CPU_AFFINITY=0-$(( $(nproc --all) - 1 ))
    EOF
    source /etc/profile
    

3. 数据库配置

语音AI服务本身不强制依赖数据库,但如果需要存储用户交互数据或日志信息,可以使用MySQL或其他关系型数据库。

数据库迁移

  • 如果需要将自建数据库迁移到ECS实例,可以通过阿里云数据传输服务(DTS)完成。
    • 源库和目标库配置
    • 数据库类型:MySQL
    • 接入方式:有公网IP的ECS自建数据库
    • 端口:默认3306
    • 数据库账号:非root账号
    • 数据库密码:对应账号的密码

4. 安全组规则

为了确保服务正常运行,需要在ECS实例的安全组中放行以下端口: - 22端口:用于SSH远程连接。 - 443端口:用于HTTPS访问。 - 7860端口:用于访问WebUI服务。


5. 其他注意事项

  • 商业授权:Qwen-Audio-Chat模型遵循开源许可,但免费商用需申请商业授权。
  • 固件版本:云服务器本身不提供传统意义上的固件版本信息,底层硬件由阿里云负责维护和更新。
  • 许可证管理:如果需要在Windows环境中部署,可通过阿里云提供的微软许可证或自带许可证完成配置。

总结

以上是阿里语音AI服务(如Qwen-Audio-Chat)和ASR自建部署的软硬件要求及配置建议。通过合理选择ECS实例规格、操作系统、软件环境和安全组规则,您可以高效搭建语音AI服务。如有进一步问题,请随时联系阿里云技术支持团队。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答