带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(三)资产治理:标准、质量、安全、资源(7)

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(三)资产治理:标准、质量、安全、资源(7)

《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——二、Dataphin 演进之路:产品大图及核心功能详解——(三)资产治理:标准、质量、安全、资源(6) https://developer.aliyun.com/article/1229582?groupCode=dataphin



4. 每年节约数亿元成本,阿里巴巴资源治理如何做到


数据环境下,不下数据存储计算,是一个企业数化转型过程中绕不开题。阿里巴巴也遇到题,凭借套沉淀下的方法论和产品,每年为阿里巴巴下数亿元存储计算本。本,我们聊聊阿里巴巴的资源治理方法论和产品 Dataphin 在这一领域的能


1) 资源成本暴涨与阿里巴巴的应对之道


量的数据为业务造了的价值,同时也带来了不升的计算成存储甚至会出现“IT 速大于业务增来的钱都在了服务情况


在阿里巴巴的发展道,也遇到过这些题:

数据资源完全黑盒

数据资源量

数据价值链路层。


为了解上问题,阿里巴巴建了数据资源管理平台(于数据中台),用于对整个集团数据计算和数据存储进行成化。节约亿元的数据成本,阿里巴巴是做的呢?


阿里巴巴了以下施来实现数据资源的管理:


好数据资源的包括理解数据资源内,和建资源。需要理解全部数据资源的业务性,的资源,做数据的分级,总之是数据资源


好数据资源成本的评估包括追数据应价值估数据价值需要数据应的全链路,盘点数据资源的连接度、贡献度;价值主要从数据计算存储个维度来


阿里巴巴过以,将数据成、业务到清晰,从而可

对性的对数据资源行运数据成,提升数据益。


2) Dataphin 资源治理概述


在方法论的基础,我们还需要一个成的产品,来帮助我们速的建立资源治理体系,在数据技术建设中的成


Dataphin 的治理能,是阿里巴巴的数据资源管理平台的业化版,具强大的资源统计分析识别系统内价值的数据资源和数据务,并进行优化提示。


image.png


包括主要包括资源管理、治理、治理工作台、治理管理、能:


资源管理主要用于资源分析

治理由治理分析和治理成。

治理工作台由我的治理和治理成。

治理管理由数据注、治理管理、管理、务管理组成。

将在治理工作台中线格暂来,以作。


优势


内置治理项,开箱即Dataphin Dataphin 系统内部的数据生产和存储都进行了数据的集,同时内了最存储计算治理确保开用,可以的资源情况,并应的分析


治理项支持灵活自定义Dataphin 同时支持定义治理数据和治理项,支持更加灵活的治理场景,比如小表检测可以新建治理【小于 1MB ,从而自验出这部的数据,并对性治理。


密切结合数据产场景Dataphin 的治理模和数据研发模、数据资源模块行了紧密合。验出来的治理事项,可以直接在治理工作台进行处理,直接在研发务和资产存储等方面生,从而做式做好资源治理工作。


3) 资源治理典型应用场景


以下是Dataphin 实现资源治理的一些型的场景。


场景 1:存储优化长期无人使用的表


企业往往随着业务的变更和的流,一些业务渐无人使,同时为多个存储,会一用大量的存储资源。比如一些公司的原始数据,一个可能1T是业务最新的导致大量的历史分存储浪费,可以设的过期略,对历史分行下线作。


Dataphin 资源治理能,可以自发现无人使用的数据他异数据表,并在治理工作台行提示。同时可以在治理工作台查看应数据,并线、设命周期等施。


场景 2:计算优化异常计算任务

计算资源的重价值和昂贵需要每需使用。而在实际的业务开发过程中,量的常计算任务,浪费量的计算资源,描大)、数据膨胀(数据产出远远于输)、数据倾(部分节处理时间过长)等情况


Dataphin 的资源治理能,对务的行了全链路的,自发现这些异常的计算任务,并在治理工作台行提示。可以在治理工作台查看任务,并应的代码优化、下线措施。


image.png

相关文章
|
5月前
|
安全 Shell Python
Dataphin功能Tips系列(9)-Dataphin中安全的使用账号密码(2)
在Dataphin中, 经常遇到需要连接外部服务来实现一些特定的功能, 如连接外部FTP检测FTP服务的连通性. 实现此类功能, 一般是使用shell或者Python代码任务. 由于外部服务大多都有访问鉴权, 就需要在shell/Python代码中向服务端发送账号密码(密钥),如何在shell或者Python任务中安全的使用账号密码?
|
5月前
|
安全 Shell Python
Dataphin功能Tips系列(8)-Dataphin中安全的使用账号密码(1)
在Dataphin中, 经常遇到需要连接外部服务来实现一些特定的功能, 如连接外部FTP检测FTP服务的连通性. 实现此类功能, 一般是使用shell或者Python代码任务. 由于外部服务大多都有访问鉴权, 就需要在shell/Python代码中向服务端发送账号密码(密钥),如何在shell或者Python任务中安全的使用账号密码?
195 1
|
1月前
|
消息中间件 Kafka
|
1月前
|
安全
|
1月前
|
安全
|
3月前
|
SQL 关系型数据库 MySQL
如何在Dataphin中构建Flink+Paimon流式湖仓方案
当前大数据处理工业界非常重要的一个大趋势是一体化,尤其是湖仓一体架构。与过去分散的数据仓库和数据湖不同,湖仓一体架构通过将数据存储和处理融为一体,不仅提升了数据访问速度和处理效率,还简化了数据管理流程,降低了资源成本。企业可以更轻松地实现数据治理和分析,从而快速决策。paimon是国内开源的,也是最年轻的成员。 本文主要演示如何在 Dataphin 产品中构建 Flink+Paimon 的流式湖仓方案。
7610 10
如何在Dataphin中构建Flink+Paimon流式湖仓方案
|
4月前
|
存储 SQL 多模数据库
多模数据库Lindorm再升级:对接Dataphin,打通数据治理“最后一公里”
Lindorm通过与Dataphin的深度整合,进一步解决了数据集成和数据治理的问题,为企业提供更加高效和更具性价比的方案。
多模数据库Lindorm再升级:对接Dataphin,打通数据治理“最后一公里”
|
4月前
|
资源调度 运维 Kubernetes
Dataphin实时研发任务资源预估与资源配置
在企业用户使用Dataphin的实时研发模块时,有两个基本问题是必须考虑的: 1. 短期上线一个实时业务,需要准备多少资源?企业在未来一年中,需要提前准备多少服务器/云资源? 2. 上线实时任务时,怎么配置需要的资源? 本文对这两个问题做简单介绍,期望企业用户能够快速理解资源预估原理和资源配置方法。
|
3月前
|
机器学习/深度学习 分布式计算 大数据
MaxCompute产品使用合集之如何从Dataphin使用界面查看版本
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3月前
|
监控 数据可视化 BI
基于Dataphin+Flink构建期货交易监察实时应用
新一代证券交易监察系统利用大数据和实时计算技术强化风险控制、交易数据处理、识别异常交易等能力。通过Dataphin与Flink结合,构建期货交易监察实时数据应用;借助QuickBI用于打造实时看板和预警体系,实现期货交易监察的实时可视化分析和自动化预警。
263 0

热门文章

最新文章

相关产品

  • 智能数据建设与治理 Dataphin