MaxCompute是阿里云提供的一种快速、完全托管的GB/TB/PB级数据仓库解决方案,可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务。MaxCompute的主要功能包括:
数据导入:MaxCompute提供了完善的数据导入方案,支持多种经典分布式计算模型,能够更快速地解决海量数据计算问题,有效降低企业成本,并保障数据安全。 数据处理:MaxCompute支持多种数据处理模型,可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务。 数据导出:MaxCompute支持将数据导出到多种文件格式,包括Excel、CSV、Parquet等。 数据同步:MaxCompute提供了数据同步功能,可以将数据实时同步到其他数据源。 任务管理:MaxCompute提供了任务管理功能,可以方便地管理MaxCompute上的各种任务。 数据工作流开发:MaxCompute提供了数据工作流开发功能,可以方便地开发复杂的数据处理流程。 数据管理和数据运维:MaxCompute提供了完善的数据管理和数据运维功能,包括数据备份、恢复、监控等。 总的来说,MaxCompute是一款功能强大的大数据计算和处理工具,可以满足企业各种数据处理和分析需求。
MaxCompute Reader插件实现了从MaxCompute读取数据的功能,有关MaxCompute的详细介绍请参见MaxCompute简介。根据您配置的源头项目、表、分区和表字段等信息,可以通过Tunnel从MaxCompute系统中读取数据。常用的Tunnel命令请参见Tunnel命令操作。MaxCompute Reader支持读取分区表、非分区表,不支持读取虚拟视图。DataWorks不支持对MaxCompute分区表进行字段映射,您需要对分区字段进行单独配置。例如,读取t0表,其分区为pt=1,ds=hangzhou,则您需要在配置中配置该值。表字段既可以依序指定全部列、部分列,也可以调整列顺序、指定常量字段和指定分区列(分区列不是表字段)。说明MaxCompute Reader不支持数据过滤功能。如果您在数据同步过程中,需要过滤符合条件的数据,请创建新表并写入过滤数据后,同步新表中的数据。MaxCompute Reader不支持同步外部表。 https://help.aliyun.com/document_detail/137465.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。