不同的业务场景对数据访问和使用有着各自独特的需求,从简单的数据下载到复杂的跨系统集成,选择合适的数据共享与访问方式至关重要。本文旨在探讨几种常见的Dataphin上的数据共享与访问机制——包括数据复制、数据下载、视图创建、行级及列级权限控制、API数据服务以及JDBC连接等,并分析它们各自的适用场景、优势及限制,以帮助企业更好地根据自身需求做出合理的选择。
什么是数据共享
数据共享,旨在将数据资源应用与多个应用系统、用户或组织。这个过程不仅要包括技术层面上性能和可维护性的考虑,也要考虑管理诉求和安全合规的诉求。另外数据共享的便捷性是促进数据在各个业务流程中的应用的广度和深度的重要因素,也是组织效率的重要推动力。
数据共享有哪些方式?
Dataphin提供了丰富的数据共享方式,包括数据复制、视图、接口及SDK的方式。您可根据场景的需求进行选择。
类别 |
共享方式 |
适用场景 |
优势 |
限制 |
数据复制 |
数据下载 进行即席查询后,下载样例数据或完整数据到本地 |
|
|
|
数据集成 配置周期或实时的数据集成任务,将数据从源端系统复制到目标端数据系统 |
比如在BI分析中,将数据从大数据平台复制到OLAP引擎,以提供快速的分析查询服务。 |
|
|
|
视图 |
视图 通过在数据库内创建视图,增加数据的行列级管控 |
适用于在存储可共享的场景,数据不脱离原有体系,对数据的安全和隐私有较高要求的场景。 一般用于在Dataphin内使用,将某个表拆分出一个视图提供给下游的特定场景使用 |
|
|
行级权限 + 列级权限 通过配置行级权限及列级权限,将权限点分配给不同的账号,数据访问时,进行自动的权限校验及控制 |
比如
|
|
|
|
接口及SDK |
API数据服务 通过提供数据API的方式,提供在线等数据查询,可进行字段级的权限管控 |
需要实时获取数据并进行应用集成,比如
|
|
|
Dataphin JDBC 通过JDBC的方式访问Dataphin管控范围内大数据平台的数据及数据库的数据,并支持行列级权限管控及安全脱敏规则的管控 |
|
|
|
每种数据共享与访问方法都有其特定的应用场合及其优缺点。对于小型或临时性的数据分析任务而言,直接的数据下载可能是最简便快捷的方式;而当涉及到大规模数据处理或是需要长期稳定运行的数据管道时,则应考虑采用更高级别的解决方案如数据集成或者通过API进行在线服务调用。此外,在保护敏感信息方面,设置细粒度的访问控制(例如基于行/列级别的权限管理)显得尤为重要。最终选择哪种方案取决于具体业务需求、技术条件以及组织内部的安全政策等因素。