数据湖构建的搜索结果_热门-阿里云开发者社区

扬流

|

博文

|

本文整理自阿里云开源大数据技术专家陈鑫伟在7月17日阿里云数据湖技术专场交流会的分享。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # SQL # 分布式计算 # Cloud Native # Hadoop # 大数据 # 对象存储 # HIVE # Spark # 流计算

skin778

|

博文

|

来自：数据库

“数据湖”：概念、特征、架构与案例

作者：惊玄

# 云原生大数据计算服务 MaxCompute # 终端访问控制系统 # 日志服务 # 云原生数据仓库AnalyticDB MySQL版 # 数据集成 Data Integration # 数据湖构建 # 数据管理 # 函数计算 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 对象存储 # 实时计算 Flink版 # 访问控制 # 存储 # SQL # 分布式计算 # 大数据 # 数据挖掘 # 数据处理 # 数据库 # 对象存储 # Spark # 流计算

阿里云E-MapReduce团队

|

博文

数禾云上数据湖最佳实践

数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展，大数据团队承担的责任也越来越重，实时数仓需求，日志分析需求，即席查询需求，数据分析需求等，每个业务提出的需求都极大的考验这个Cloudera Hadoop集群的能力。为了减轻Cloudera集群的压力，我们结合自身业务情况，在阿里云上落地一个适合数禾当前现实状况的数据湖。

# 对象存储 # 云原生数据仓库AnalyticDB MySQL版 # 云监控 # 数据湖构建 # 云原生大数据计算服务 MaxCompute # 日志服务 # 负载均衡 # 数据管理 # 云服务器 ECS # 弹性伸缩 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云数据库 RDS MySQL 版 # 专有网络VPC # 云解析DNS # 存储 # SQL # 弹性计算 # 分布式计算 # 对象存储 # 监控 # 大数据 # 调度 # MaxCompute # HIVE

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

官宣！阿里云重磅发布云原生数据湖体系

介绍如何基于阿里云 OSS 、JindoFS 和数据湖构建（Data Lake Formation，DLF）等基础服务，同时结合阿里云上丰富的计算引擎，打造一个全新云原生数据湖体系。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # SQL # 分布式计算 # Cloud Native # 大数据 # Hadoop # 数据挖掘 # 对象存储 # Spark # 数据安全/隐私保护

扬流

|

博文

|

来自：大数据与机器学习

关于 Data Lake 的概念、架构与应用场景介绍

本文详细介绍了 Data Lake 的概念、架构与应用场景介绍。

# 开源大数据平台 E-MapReduce # 数据管理 # 实时计算 Flink版 # 对象存储 # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 大数据开发治理平台 DataWorks # 云原生数据仓库AnalyticDB MySQL版 # 存储 # 数据采集 # 运维 # 分布式计算 # 大数据 # 数据管理 # MaxCompute # 对象存储 # 流计算 # 数据格式

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

DLF +DDI 一站式数据湖构建与分析最佳实践

本文由阿里云数据湖构建 DLF 团队和 Databricks 数据洞察团队联合撰写，旨在帮助您更深入地了解阿里云数据湖构建（DLF）+Databricks 数据洞察（DDI）构建一站式云上数据入湖。

# 数据湖构建 # 云原生大数据计算服务 MaxCompute # 日志服务 # 对象存储 # 云数据库 RDS MySQL 版 # 数据管理 # 云消息队列 Kafka 版 # DataV数据可视化 # 存储 # 消息中间件 # 分布式计算 # 关系型数据库 # Kafka # 数据库 # 对象存储 # Spark # 流计算 # RDS

最佳实践小文

|

博文

数禾云上数据湖最佳实践

数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展，大数据团队承担的责任也越来越重，实时数仓需求，日志分析需求，即席查询需求，数据分析需求等，每个业务提出的需求都极大的考验这个Cloudera Hadoop集群的能力。为了减轻Cloudera集群的压力，我们结合自身业务情况，在阿里云上落地一个适合数禾当前现实状况的数据湖。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 数据湖构建 # 云监控 # 云原生数据仓库AnalyticDB MySQL版 # 数据管理 # 弹性伸缩 # 云原生大数据计算服务 MaxCompute # 负载均衡 # 日志服务 # 专有网络VPC # 云服务器 ECS # 对象存储 # 云数据库 RDS MySQL 版 # 云解析DNS # 存储 # SQL # 弹性计算 # 分布式计算 # 监控 # 大数据 # 调度 # MaxCompute # 对象存储 # HIVE

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

云原生数据湖构建、分析与开发治理最佳实践及案例分享

什么是数据湖？又如何对对数据湖进行分析与开发治理？本文深入浅出的介绍了云原生数据湖构建、分析与开发治理最佳实践及案例分享。

# 数据湖构建 # 对象存储 # 云原生数据仓库AnalyticDB MySQL版 # 数据集成 Data Integration # 大数据开发治理平台 DataWorks # 弹性伸缩 # 云原生大数据计算服务 MaxCompute # 数据安全中心 # 终端访问控制系统 # 日志服务 # 实时计算 Flink版 # 云数据库 RDS MySQL 版 # 访问控制 # 存储 # 弹性计算 # 分布式计算 # DataWorks # Cloud Native # 大数据 # BI # 调度 # 对象存储 # 监控

skin778

|

博文

|

来自：数据库

一步即可！阿里云数据湖分析服务构建MySQL低成本分析方案

作为最为流行的开源数据库，MYSQL正成为越来越多企业的选择。MySQL数据库大量应用在各种业务系统，除了在线业务逻辑的读写，还会有一些额外的数据分析需求，如BI报表、可视化大屏、大数据应用等。但受限于MySQL架构等问题，在面对数据分析场景时，其往往力不从心。

# 云数据库 RDS MySQL 版 # 数据湖构建 # 云原生大数据计算服务 MaxCompute # SQL # 存储 # 分布式计算 # 关系型数据库 # MySQL # 数据挖掘 # 大数据 # BI # 数据库 # HIVE

带你读小助手

|

博文

|

来自：云存储

数据湖构建DLF快速入门

本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析，介绍数据湖构建DLF产品的数据发现和数据探索功能。

# 数据湖构建 # 对象存储 # SQL # 存储 # 数据采集 # 数据库 # 对象存储

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据湖构建