DataWorks问题之操作新增数据源如何解决

本文涉及的产品
大数据开发治理平台 DataWorks,不限时长
简介: DataWorks数据源是指DataWorks中配置的用于数据集成的外部数据源;本合集将讲解如何在DataWorks中配置和管理数据源,以及处理数据源连接和集成过程中的问题。

问题一:咨询一下,dataworks数据集成中遇到的一个同库分表的同步问题,数据源是mysql, 表是按月生成的, 比如xxx_202303,一个月新增一张表,这种应该怎么配置离线同步任务啊,似乎脚本模式里也只能按指定范围来配置?


咨询一下,dataworks数据集成中遇到的一个同库分表的同步问题,数据源是mysql, 表是按月生成的, 比如xxx_202303,一个月新增一张表,这种应该怎么配置离线同步任务啊,似乎脚本模式里也只能按指定范围来配置?


参考回答:

建议是将同步任务转脚本 表名用 xxx_${参数名} 来代替 配置好日期的调度参数 上线以后参数会替换成具体的日期值拼接成表名。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/496308?spm=5176.8068049.0.0.77566d19PXNmxo


问题二:如何操作dataworks数据集成新增数据源?


如何操作dataworks数据集成新增数据源?


参考回答:

登录DataWorks控制台,单击目标项目栏中的进入数据集成。在数据集成页面,单击左侧导航栏的数据源,然后单击新增数据源。在新增数据源页面,选择HDFS。在新增HDFS数据源页面,按照页面提示进行参数配置。//help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/0766944851/p85488.jpg参数 说明 数据源名称 数据源名称必须包含字母、数字、下划线,但不能以数字和下划线开头。 数据源描述 对数据源进行简单描述,不得超过80个字符。 DefaultFS nameNode节点地址,格式为hdfs://ServerIP:Port。单击测试连通性。测试连通性通过后,单击完成。测试连通性说明经典网络ECS上自建的数据源,建议使用数据集成自定义资源组,默认资源组不保证网络可通。专有网络目前不支持数据源连通性测试,直接单击完成。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/492813?spm=5176.8068049.0.0.77566d19PXNmxo


问题三:如何使用DataWorks数据集成从MySQL导入数据到GDB配置同步任务脚本?


如何使用DataWorks数据集成从MySQL导入数据到GDB配置同步任务脚本?


参考回答:

在DataWorks对应工作空间(相同区域)的数据开发环境,创建离线同步节点,创建方法请参见创建离线同步节点。在选择数据源>数据来源步骤选择数据源为MySQL和您配置好的MySQL数据源,以及需要导入到GDB中的数据库表。


 


在选择数据源>数据去向步骤选择GDB和您配置好的GDB数据源。目前GDB只支持通过脚本模式配置任务,单击工具栏中的转换脚本再编辑同步任务参数。以下示例配置是同步数据源mysql_loader中数据表comment到GDB数据源gdb_loader中,将表数据转换成GDB的点,表中部分列映射为点的属性。 {"type": "job","steps": [{"stepType": "mysql", // 数据来源类型"parameter": {"datasource": "mysql_loader", // mysql数据源"column": [ // 读取的数据表列名"node_id","node_label","m_id","imagefile","creationDate"],"connection": [ // 连接信息{"datasource": "mysql_loader","table": [ // 读取的数据库表"post"]}],"where": "","splitPk": "","encoding": "UTF-8"},"name": "Reader","category": "reader"},{"stepType": "gdb", // 数据去向类型"parameter": {"datasource": "gdb_loader", // gdb数据源"session": true, // 使用GDB的批量事务模式"column": [ // 到GDB数据的映射规则{"columnType": "primaryKey", // 主键ID映射"name": "id","type": "string", // 主键值类型,配置为非string类型会导致异常。"value": "#{0}" // 主键映射列序号},{"columnType": "vertexProperty


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/492802?spm=5176.8068049.0.0.77566d19PXNmxo


问题四:DataWorks数据集成这块可以切换成原来的那个版本样式吗?


DataWorks数据集成这块可以切换成原来的那个版本样式吗?现在这种页面配置,用着不舒服参考回答:

新版的可以将网络问题 提前在开发态的时候就发现和规避 避免在运维中心才发现哈


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/491486?spm=5176.8068049.0.0.77566d19PXNmxo


问题五:DataWorks数据集成可以跨业务流程引用表吗?


DataWorks数据集成可以跨业务流程引用表吗?


参考回答:

可以的


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/491141?spm=5176.8068049.0.0.77566d19PXNmxo

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
目录
相关文章
|
1月前
|
SQL 运维 DataWorks
DataWorks常见问题之DataWorks调用数据源服务失败如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
SQL 分布式计算 DataWorks
DataWorks报错问题之集成hive数据源报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
DataWorks 关系型数据库 大数据
DataWorks常见问题之数据源使用连接串模式新增 postgres 数据源报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
32 1
|
2月前
|
分布式计算 DataWorks Oracle
DataWorks问题之支持argodb的数据源如何解决
DataWorks数据源是指DataWorks中配置的用于数据集成的外部数据源;本合集将讲解如何在DataWorks中配置和管理数据源,以及处理数据源连接和集成过程中的问题。
29 3
|
2月前
|
分布式计算 DataWorks 关系型数据库
DataWorks数据源问题之参数“连接Url”如何解决
DataWorks数据源是指DataWorks中配置的用于数据集成的外部数据源;本合集将讲解如何在DataWorks中配置和管理数据源,以及处理数据源连接和集成过程中的问题。
29 5
|
2月前
|
SQL DataWorks 关系型数据库
DataWorks数据源问题之数据集成报错如何解决
DataWorks数据源是指DataWorks中配置的用于数据集成的外部数据源;本合集将讲解如何在DataWorks中配置和管理数据源,以及处理数据源连接和集成过程中的问题。
39 4
|
1月前
|
SQL 存储 DataWorks
DataWorks常见问题之dataworks数据源配置跨项目克隆失败如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
SQL 分布式计算 DataWorks
DataWorks报错问题之dataworks配置数据源报UnknownHostException如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
DataWorks 关系型数据库 MySQL
DataWorks报错问题之dataworks配置mysql数据源报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
分布式计算 DataWorks 调度
DataWorks报错问题之DataWorks测试连接数据源报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。

热门文章

最新文章

相关产品

  • 大数据开发治理平台 DataWorks