服务端部署时,遵循以下关键步骤和注意事项以确保顺利进行:
1. 服务器配置准备
- 磁盘空间: 确保服务器的磁盘空间充足。根据应用需求,如Qwen-1.8B-Chat模型运行至少需要40 GiB系统盘,而宝塔面板安装虽未明确磁盘大小,但需考虑应用后续扩展所需空间。
- 内存与CPU: 针对特定应用选择合适的实例规格。例如,Qwen-1.8B-Chat推荐至少32 GiB内存的ecs.c8i.4xlarge实例;宝塔面板建议至少2 GiB内存。
- 操作系统: 根据应用要求选择操作系统镜像,如Alibaba Cloud Linux 3.2104 LTS 64位对于Qwen-1.8B-Chat,或选择带有宝塔Linux面板的镜像。
2. 部署前检查
- 系统配置: 确认操作系统版本兼容性及内核版本是否满足应用需求。
- 公网IP: 确保ECS实例分配了公网IP,以便外部访问。如果未分配,需手动绑定弹性公网IP。
- 端口占用: 检查并确认所需端口(如宝塔面板默认8888端口、Qwen-1.8B-Chat的7860端口)未被其他服务占用,并在安全组中放行这些端口。
- 磁盘检查: 使用
df -h
和du -sh *
命令检查磁盘使用情况,解决可能的空间不一致或满载问题。
3. 遵循官方文档操作
- 宝塔面板部署: 通过阿里云市场镜像创建ECS实例,选择宝塔镜像,完成购买流程后,登录获取面板地址、用户名和密码,设置安全组规则允许访问。
- 特定应用部署: 如Qwen-1.8B-Chat,创建符合内存要求的ECS实例,安装必要容器环境,按照项目指南下载和配置模型。
注意事项
- 安全合规: 在使用任何第三方服务或模型(如Qwen-1.8B-Chat)时,遵守其LICENSE和用户协议,确保合法合规使用。
- 数据备份: 在进行任何修改或升级前,创建快照或备份数据,以防意外丢失。
- 性能监控: 部署后持续监控应用性能和资源使用情况,适时调整资源配置以优化性能。
综上所述,严格按照官方文档指引,细致地进行前期准备和检查,是确保服务端部署成功的关键。