DataHub 3月份新增功能介绍

简介: 针对DataHub 3月份新增功能的一些介绍

背景

DataHub 3月份页面新增功能介绍

新增设置TimeStampUnit单位

介绍

DataHub在进行数据同步时,针对timestamp类型的数据,由于下游timestamp类型默认数据类型不一致,datahub会对timestamp类型数据做转转换,以Datahub同步到Maxcompute为例,datahub同步默认timestamp类型为微秒,而Maxcompute默认为毫秒,所以在进行同步时DataHub会对timestamp类型数据转化为毫秒同步到MaxCompute

问题

DataHub Timestamp类型实质是Long类型,所以用户如果写入时间是毫秒格式或者秒格式,DataHub也会默认按照微妙同步到下游进行转换,这样就会造成下游数据格式异常,如下图所示,显示为1970-01-19开头


解决方案

  • 旧的解决方案是使用SDK重新设置TimestampUnit单位
  •        SinkOdpsConfig config = (SinkOdpsConfig) datahubClient.getConnector(projectName, topicName, connectorId).getConfig(); //将TimeStampUnit类型设置为秒 config.setTimestampUnit(ConnectorConfig.TimestampUnit.SECOND);
  • 缺点:较为繁琐,还需要重新写代码编译运行,而且对于非编程开发人员不够友好
  • 新的解决方案
  • 同步页面上支持TimestampUnit设置,用户可根据Timestamp字段格式进行设置,无需代码,较为简洁




相关文章
|
7月前
|
消息中间件 分布式计算 DataWorks
DataWorks常见问题之kafka数据导入datahub失败如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
SQL 关系型数据库 数据管理
Datahub实践——Sqllineage解析Sql实现端到端数据血缘
Datahub实践——Sqllineage解析Sql实现端到端数据血缘
1477 1
|
数据采集 JSON 关系型数据库
将 MySQL 数据抽取并写入 DataHub,您可以按照以下步骤进行
将 MySQL 数据抽取并写入 DataHub,您可以按照以下步骤进行
556 2
|
6月前
|
数据采集 DataWorks 监控
DataWorks产品使用合集之mysql-cdc读取数据写入到datahub中,datahub如何转换时区
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
61 1
|
7月前
|
存储 监控 Apache
Flink整库同步 如何把数据丢入到 datahub 中
Flink整库同步 如何把数据丢入到 datahub 中
|
数据采集 大数据 数据挖掘
企业级数据治理工作怎么开展?Datahub这样做
企业级数据治理工作怎么开展?Datahub这样做
177 0
|
数据采集 JSON 关系型数据库
将 MySQL 数据抽取并写入 DataHub
将 MySQL 数据抽取并写入 DataHub
268 3
|
Java API Maven
Fink在处理DataHub数据源时无法正确识别RecordData类的字段
Fink在处理DataHub数据源时无法正确识别RecordData类的字段
108 1
|
JSON 物联网 数据格式
物联网平台数据流转到datahub时报错
记录一次物联网平台数据流转到datahub时的报错
545 0
物联网平台数据流转到datahub时报错
|
SQL 消息中间件 NoSQL
数据治理方案技术调研 Atlas VS Datahub VS Amundsen
数据治理意义重大,传统的数据治理采用文档的形式进行管理,已经无法满足大数据下的数据治理需要。而适合于Hadoop大数据生态体系的数据治理就非常的重要了。 大数据下的数据治理作为很多企业的一个巨大的难题,能找到的数据的解决方案并不多,但是好在近几年,很多公司已经进行了尝试并开源了出来,本文将详细分析这些数据发现平台,在国外已经有了十几种的实现方案。
1584 0
数据治理方案技术调研 Atlas VS Datahub VS Amundsen