数据湖构建的搜索结果_热门-阿里云开发者社区

云原生数据湖分析DLA

|

博文

一步即可！阿里云数据湖分析服务构建MySQL低成本分析方案

通过一键建湖能简单便捷的构建Mysql分析。它的特性是易用，分析能力强，成本极低，对源库影响很低。

# 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 数据湖构建 # SQL # 存储 # 分布式计算 # 关系型数据库 # MySQL # 数据挖掘 # 大数据 # 数据库 # HIVE # BI

游客vue2tkys3v2fi

|

19天前

|

博文

阿里云数据湖构建DLF完整对接指南：从元数据管理到多引擎集成实践

本文系统介绍了阿里云数据湖构建（DLF）的核心功能与对接使用方法。DLF作为全托管统一元数据管理平台，提供了元数据管理、权限控制、数据入湖、存储优化等核心能力。文章详细阐述了DLF的架构设计、Catalog/数据库/表的三层元数据模型，以及如何与EMR、Flink、MaxCompute、Hologres、DataWorks等主流计算引擎无缝对接。重点涵盖：DLF服务开通与角色授权、Catalog创建与配置、EMR集群切换DLF元数据的具体配置步骤、Flink通过DLF Catalog实现数据入湖的完整流程与代码示例、DataWorks数据集成同步至DLF的配置方法、MaxCompute湖仓一体

# 数据湖构建 # 数据管理 # 存储 # 分布式计算 # 数据管理 # MaxCompute # 流计算

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

百草味基于“ EMR+Databricks+DLF ”构建云上数据湖的最佳实践

本文介绍了百草味大数据平台从 IDC 自建 Hadoop 到阿里云数据湖架构的迁移方案和落地过程。重点从 IDC 自建集群的痛点分析，云上大数据方案的选型以及核心模块的建设过程几个方面做了详细的介绍，希望给想了解和实践数据湖架构的企业和朋友一个参考。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 数据安全中心 # 存储 # SQL # 分布式计算 # 运维 # 大数据 # Hadoop # 调度 # 对象存储 # 数据安全/隐私保护 # Spark

SelectDB

|

博文

|

来自：数据库

Apache Doris 3.0 里程碑版本｜存算分离架构升级、湖仓一体再进化

从 3.0 系列版本开始，Apache Doris 开始支持存算分离模式，用户可以在集群部署时选择采用存算一体模式或存算分离模式。基于云原生存算分离的架构，用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离，并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。

# 云原生数据仓库AnalyticDB MySQL版 # 数据湖构建 # 对象存储 # 存储 # SQL # 缓存 # Apache # 索引

扬流

|

博文

|

来自：大数据与机器学习

数据湖架构及概念简介

本文整理自阿里云开源大数据技术专家陈鑫伟在7月17日阿里云数据湖技术专场交流会的分享。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # SQL # 分布式计算 # Cloud Native # Hadoop # 大数据 # 对象存储 # HIVE # Spark # 流计算

扬流

|

博文

|

来自：大数据与机器学习

关于 Data Lake 的概念、架构与应用场景介绍

本文详细介绍了 Data Lake 的概念、架构与应用场景介绍。

# 开源大数据平台 E-MapReduce # 数据管理 # 实时计算 Flink版 # 对象存储 # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 大数据开发治理平台 DataWorks # 云原生数据仓库AnalyticDB MySQL版 # 存储 # 数据采集 # 运维 # 分布式计算 # 大数据 # 数据管理 # MaxCompute # 对象存储 # 流计算 # 数据格式

skin778

|

博文

|

来自：数据库

“数据湖”：概念、特征、架构与案例

作者：惊玄

# 云原生大数据计算服务 MaxCompute # 终端访问控制系统 # 日志服务 # 云原生数据仓库AnalyticDB MySQL版 # 数据集成 Data Integration # 数据湖构建 # 数据管理 # 函数计算 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 对象存储 # 实时计算 Flink版 # 访问控制 # 存储 # SQL # 分布式计算 # 大数据 # 数据挖掘 # 数据处理 # 数据库 # 对象存储 # Spark # 流计算

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

官宣！阿里云重磅发布云原生数据湖体系

介绍如何基于阿里云 OSS 、JindoFS 和数据湖构建（Data Lake Formation，DLF）等基础服务，同时结合阿里云上丰富的计算引擎，打造一个全新云原生数据湖体系。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # SQL # 分布式计算 # Cloud Native # 大数据 # Hadoop # 数据挖掘 # 对象存储 # Spark # 数据安全/隐私保护

云起实验室小助手

|

博文

数据湖构建DLF数据探索快速入门-淘宝用户行为分析

本教程通过使⽤数据湖构建（DLF）产品对于淘宝⽤户⾏为样例数据的分析，介绍DLF产品的数据发现和数据探索功能。教程内容包括：1. 服务开通：开通阿⾥云账号及DLF/OSS相关服务2. 样例数据集下载和导⼊：下载样例数据（csv⽂件），并上传⾄OSS3. DLF数据发现：使⽤DLF⾃动识别⽂件Schema并创建元数据表4. DLF数据探索：使⽤DLF数据探索，对⽤户⾏为进⾏分析，包括⽤户活跃度、漏⽃模型等

# 数据湖构建 # 对象存储 # SQL # 数据采集 # 数据挖掘 # 数据库 # 对象存储 # 存储 # 分布式计算 # 关系型数据库 # Spark # 数据格式

扬流

|

博文

|

来自：大数据与机器学习

数据湖统一元数据与权限

本文整理自阿里云数据湖构建与分析研发熊佳树在7月17日阿里云数据湖技术专场交流会的分享。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 数据管理 # 云原生数据仓库AnalyticDB MySQL版 # 表格存储 # SQL # 存储 # 分布式计算 # 大数据 # 数据管理 # API # 开发工具 # HIVE # 数据安全/隐私保护 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据湖构建