机器学习PAI导出模型命令,会把模型导出到一个带时间戳的目录下面,比如oss://easyrec/easy_rec_test/export/1684488401这个目录是动态生成的,怎么在DataStudio里面能够以编程的方式拿到这个目录的地址呢? 没有这个动态生成的地址,就没办法每天自动训练然后更新模型。我是想说离线预测的时候,目前需要手动填写动态生成的那个时间戳目录,导致我没有办法自动化训练和使用最新模型做预测。
您可以在机器学习 PAI 的训练作业中,使用变量 ${ExportModel} 来获取导出模型的目录地址。这个变量会被替换为实际的导出目录地址,可以在训练作业的输出日志中查看。
例如,您可以在训练作业中使用以下命令来输出导出目录地址:
echo "Exported model directory: ${ExportModel}" 这将在训练作业的输出日志中输出导出目录地址。您可以在训练作业完成后,在机器学习 PAI 的控制台上查看训练作业的输出日志,以获取导出目录地址。
在 DataStudio 中,您可以使用 Python 的 os 模块来获取导出目录地址。具体来说,您可以使用以下代码来获取导出目录地址:
python import os
export_dir = os.environ.get('ExportModel') print("Exported model directory:", export_dir) 这将从环境变量中获取导出目录地址,并输出到控制台中。请注意,这段代码必须在机器学习 PAI 的训练作业中运行,才能获取到正确的导出目录地址。
一旦您获取了导出目录地址,就可以在 DataStudio 中使用它来进行离线预测,或者进行其他操作。
您可以使用 DataStudio 的代码组件,在代码中调用 PAI 的 API 来获取模型导出的地址。具体步骤为:
在 DataStudio 中打开您的工程,新建一个代码组件。
在代码组件中,使用 Python 或者其他适当的语言调用 PAI 的 API 来获取最新导出模型的地址。PAI 的 API 可以通过访问控制台进行查看。
获取模型地址后,您可以将其写入一个指定的文件或者打印到控制台上。如果您希望使用该模型进行预测,则可以将模型地址作为参数传递给预测组件。
将代码组件与其他组件(如预测组件)连接,以便在运行时自动获取最新的模型地址并进行预测。
请注意,在使用代码组件调用 PAI API 时,您需要先配置 API 的访问密钥,以确保安全性和访问控制。同时,还需要确保代码组件中的代码能够正确地捕获错误并进行处理。
更新的命令里 填写到export那一层目录即可,你填写到 model-export/ ,应该就可以跑起来,但是要确保这个目录下只有这一个时间戳的目录,此回答整理自钉群“【EasyRec】推荐算法交流群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。