Datahub 0.8.5发布! 通用的元数据搜索和发现工具

简介: Datahub 发布了最新的版本0.8.5,作为LinkedIn开源的通用的元数据搜索和发现工具。Datahub近一年来有了巨大的发展,也成为了很多公司进行元数据管理的调研方向并进行使用的选择。

新功能


0.8.5版本中datahub修复了各种稳定性的修复,并改进了多个数据源的元数据获取方式,包括mongodb、looker、hive、snowflake。

在采用React重构前端以后,datahub的可视化功能得到了极大的提高。

微信图片_20220528162045.gif

但对于功能方面的改进,DataHub 也没有停止。


功能简介


Datahub目前提供了如下功能:

  • 搜索:全文和高级搜索,搜索排名
  • 浏览:浏览可配置的层次结构
  • 架构:表格和 JSON 格式的表和文档架构
  • 粗粒谱系:支持数据集级别的谱系,下游/上游的表格和图形可视化
  • 所有权:显示数据集的所有者,查看您拥有的数据集
  • 数据集生命周期管理:弃用/取消弃用,表面删除的数据集并用“已删除”标记它
  • 机构知识:支持向任何数据集添加自由格式的文档

微信图片_20220528162049.png

而新的功能也在开发当中。根据开发路线图,细粒度的血缘关系也将会很快推出。


架构


不得不提到datahub的架构。

datahub由datahub ingestion,datahub fraontend,datahub serving三部分构成。

分为负责元数据的采集,存储与可视化展示。

这种架构让datahub可以非常灵活的进行各种数据源的对接与功能改进。

微信图片_20220528162053.png

相信随着社区的不断活跃,datahub将在元数据管理领域大放异彩!

相关文章
|
7月前
|
关系型数据库 Linux Docker
datahub元数据管理平台从安装到使用一站式指南(未完)_datahub安装
datahub元数据管理平台从安装到使用一站式指南(未完)_datahub安装
datahub元数据管理平台从安装到使用一站式指南(未完)_datahub安装
|
7月前
|
消息中间件 分布式计算 DataWorks
DataWorks常见问题之kafka数据导入datahub失败如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
SQL 关系型数据库 数据管理
Datahub实践——Sqllineage解析Sql实现端到端数据血缘
Datahub实践——Sqllineage解析Sql实现端到端数据血缘
1470 1
|
数据采集 JSON 关系型数据库
将 MySQL 数据抽取并写入 DataHub,您可以按照以下步骤进行
将 MySQL 数据抽取并写入 DataHub,您可以按照以下步骤进行
551 2
|
6月前
|
数据采集 DataWorks 监控
DataWorks产品使用合集之mysql-cdc读取数据写入到datahub中,datahub如何转换时区
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
61 1
|
7月前
|
存储 监控 Apache
Flink整库同步 如何把数据丢入到 datahub 中
Flink整库同步 如何把数据丢入到 datahub 中
|
数据采集 大数据 数据挖掘
企业级数据治理工作怎么开展?Datahub这样做
企业级数据治理工作怎么开展?Datahub这样做
177 0
|
数据采集 JSON 关系型数据库
将 MySQL 数据抽取并写入 DataHub
将 MySQL 数据抽取并写入 DataHub
265 3
|
Java API Maven
Fink在处理DataHub数据源时无法正确识别RecordData类的字段
Fink在处理DataHub数据源时无法正确识别RecordData类的字段
108 1
|
JSON 物联网 数据格式
物联网平台数据流转到datahub时报错
记录一次物联网平台数据流转到datahub时的报错
545 0
物联网平台数据流转到datahub时报错

热门文章

最新文章

下一篇
无影云桌面