DataWorks 中 DataStudio(数据开发)节点类型都有什么?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
离线同步节点 数据同步功能
ODPS SQL
ODPS SQL采用类似SQL的语法,适用于海量数据(TB级)但实时性 要求不高的分布式处理场景。
SQL组件节点
SQL组件是一种带有多个输入参数和输出参数的SQL代码过程模板,SQL代码的处理过程通常是引入一到多个源数据表,通过过滤、连接和聚合等操作,加工出新的业务需要的目标表。
ODPS Spark
以JAR类型的资源,操作spark
PyODPS
可以在DataWorks的PyODPS节点上,直接编辑Python代码,用于操作MaxCompute
ODPS Script
ODPS Script节点的SQL开发模式是MaxCompute基于2.0的SQL引擎提供的脚本开发模式。
ODPS MR
ODPS MR类型节点可以使用MapReduce Java API编写MapReduce程序来处理MaxCompute中的数据。
表
管理MaxCompute中的表
资源
jar包等资源管理
函数
支持Python和Java两种语言接口