机器学习PAI这里有个“镜像保存记录”是未保存状态,我实例内的内容不会有丢失的风险吧?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在阿里云人工智能平台PAI中,实例内的内容是否会因“镜像保存记录”处于未保存状态而丢失,取决于以下几个关键点:
镜像保存是将当前实例的工程环境及配置保存为一个镜像,以便后续可以重新部署该镜像来恢复环境。如果“镜像保存记录”显示为未保存状态,则表示当前实例的环境和配置尚未被保存为镜像。
PAI支持将数据存储到对象存储OSS、文件存储NAS等介质中,这些存储介质具备高可用性和可靠性,能够确保数据的安全。如果您已经将实例内的数据写入到这些存储介质中,则即使实例本身出现问题,数据也不会丢失。
如果实例正在运行且未保存镜像,但您已经在实例内完成了必要的数据处理并将结果存储到外部存储(如OSS或NAS),则实例内的内容丢失风险较低。然而,以下情况可能导致数据丢失: - 实例异常终止或被删除。 - 未将数据写入外部存储,而是仅保存在实例的本地磁盘中。
为了避免因未保存镜像而导致的数据丢失,您可以采取以下措施: 1. 保存镜像:通过PAI平台提供的功能,将当前实例的环境和配置保存为镜像。具体操作可参考相关文档。 2. 定期备份数据:将实例内的数据定期写入OSS或NAS等外部存储介质中,确保数据安全。 3. 使用EasyCkpt框架:如果您正在进行大模型训练,可以使用PAI提供的EasyCkpt框架,实现接近零开销的模型保存与恢复,避免训练进度丢失。
通过以上措施,您可以有效降低数据丢失的风险,保障机器学习任务的连续性和安全性。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。