机器学习PAI这里有个“镜像保存记录”是未保存状态,我实例内的内容不会有丢失的风险吧?

机器学习PAI这里有个“镜像保存记录”是未保存状态,我实例内的内容不会有丢失的风险吧?image.png

展开
收起
真的很搞笑 2024-04-06 08:45:23 71 分享 版权
阿里云 AI 助理回答

在阿里云人工智能平台PAI中,实例内的内容是否会因“镜像保存记录”处于未保存状态而丢失,取决于以下几个关键点:

1. 镜像保存的作用

镜像保存是将当前实例的工程环境及配置保存为一个镜像,以便后续可以重新部署该镜像来恢复环境。如果“镜像保存记录”显示为未保存状态,则表示当前实例的环境和配置尚未被保存为镜像。

  • 重要提醒:未保存镜像的情况下,如果实例发生异常(如被删除或重启),您可能会丢失实例中的自定义环境配置和未持久化的数据。

2. 数据存储的安全性

PAI支持将数据存储到对象存储OSS、文件存储NAS等介质中,这些存储介质具备高可用性和可靠性,能够确保数据的安全。如果您已经将实例内的数据写入到这些存储介质中,则即使实例本身出现问题,数据也不会丢失。

  • 建议操作:确保您的重要数据已保存到OSS或NAS等外部存储中,而不是仅依赖实例本地存储。

3. 实例运行时的数据保护

如果实例正在运行且未保存镜像,但您已经在实例内完成了必要的数据处理并将结果存储到外部存储(如OSS或NAS),则实例内的内容丢失风险较低。然而,以下情况可能导致数据丢失: - 实例异常终止或被删除。 - 未将数据写入外部存储,而是仅保存在实例的本地磁盘中。

  • 重要提醒:实例的本地磁盘数据在实例停止或删除后可能会丢失,请务必定期将数据备份到外部存储。

4. 如何降低数据丢失风险

为了避免因未保存镜像而导致的数据丢失,您可以采取以下措施: 1. 保存镜像:通过PAI平台提供的功能,将当前实例的环境和配置保存为镜像。具体操作可参考相关文档。 2. 定期备份数据:将实例内的数据定期写入OSS或NAS等外部存储介质中,确保数据安全。 3. 使用EasyCkpt框架:如果您正在进行大模型训练,可以使用PAI提供的EasyCkpt框架,实现接近零开销的模型保存与恢复,避免训练进度丢失。

5. 总结与建议

  • 如果“镜像保存记录”显示为未保存状态,且实例内的数据未写入外部存储,则存在一定的数据丢失风险。
  • 强烈建议:尽快将实例内的数据备份到OSS或NAS,并保存当前实例的镜像以确保环境和配置的安全。

通过以上措施,您可以有效降低数据丢失的风险,保障机器学习任务的连续性和安全性。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

还有其他疑问?
咨询AI助理