开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

DataWorks机器学习PAI使用maxcompute数据?

DataWorks机器学习PAI使用maxcompute数据?

展开
收起
真的很搞笑 2023-09-05 12:44:45 91 0
1 条回答
写回答
取消 提交回答
  • 在 DataWorks 机器学习 PAI 中,您可以使用 MaxCompute(原名为ODPS)作为数据源来进行机器学习任务。

    MaxCompute 是阿里云提供的大数据计算平台,可以存储和处理大规模的结构化和非结构化数据。通过 DataWorks 机器学习 PAI,您可以直接连接 MaxCompute,将 MaxCompute 中的数据用于机器学习任务。

    要在 DataWorks 机器学习 PAI 中使用 MaxCompute 数据,您可以按照以下步骤操作:

    在 DataWorks 中创建 MaxCompute 存储账号:在 DataWorks 的项目中,创建一个 MaxCompute 存储账号,并配置账号的访问密钥(Access Key)和访问密钥密钥(Access Key Secret)。

    创建 MaxCompute 数据表:在 MaxCompute 中创建数据表,用于存储机器学习任务所需的数据。您可以使用 MaxCompute 的 SQL 语句来创建表,并将数据加载到表中。

    创建机器学习任务:在 DataWorks 机器学习 PAI 中,创建一个机器学习任务,并选择 MaxCompute 作为数据源。在任务配置中,指定要使用的 MaxCompute 数据表。

    开发机器学习算法:根据机器学习任务的需求,编写相应的机器学习算法代码。您可以使用 DataWorks 机器学习 PAI 提供的可视化编辑器或者使用 Python/R 等常用的机器学习编程语言进行开发。

    运行任务并分析结果:配置好任务后,提交任务并执行。DataWorks 机器学习 PAI 将会使用 MaxCompute 中的数据进行机器学习训练和分析,并生成相应的结果。

    通过以上步骤,您可以在 DataWorks 机器学习 PAI 中使用 MaxCompute 数据来进行机器学习任务。请注意,在使用 MaxCompute 数据之前,需要确保您的 DataWorks 项目中已经成功关联了 MaxCompute 存储账号,并且您具有相应的访问权限。

    如需更详细的指导和支持,建议您参考阿里云 DataWorks 的官方文档或联系阿里云的技术支持团队。

    2023-10-18 14:43:14
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载