数据湖构建的搜索结果_热门_第3页-阿里云开发者社区

周周的奇妙编程

|

博文

阿里云EMR Serverless Spark是基于Spark的全托管大数据处理平台，融合云原生弹性与自动化，提供任务全生命周期管理，让数据工程师专注数据分析。它内置高性能Fusion Engine，性能比开源Spark提升200%，并有成本优化的Celeborn服务。支持计算存储分离、OSS-HDFS兼容、DLF元数据管理，实现一站式的开发体验和Serverless资源管理。适用于数据报表、科学项目等场景，简化开发与运维流程。用户可通过阿里云控制台快速配置和体验EMR Serverless Spark服务。

# 实时计算 Flink版 # 对象存储 # 云原生大数据计算服务 MaxCompute # 函数计算 # 数据湖构建 # 分布式计算 # Hadoop # Serverless # 数据处理 # Spark

最佳实践小文

|

博文

数禾云上数据湖最佳实践

数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展，大数据团队承担的责任也越来越重，实时数仓需求，日志分析需求，即席查询需求，数据分析需求等，每个业务提出的需求都极大的考验这个Cloudera Hadoop集群的能力。为了减轻Cloudera集群的压力，我们结合自身业务情况，在阿里云上落地一个适合数禾当前现实状况的数据湖。

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 数据湖构建 # 云监控 # 云原生数据仓库AnalyticDB MySQL版 # 数据管理 # 弹性伸缩 # 云原生大数据计算服务 MaxCompute # 负载均衡 # 日志服务 # 专有网络VPC # 云服务器 ECS # 对象存储 # 云数据库 RDS MySQL 版 # 云解析DNS # 存储 # SQL # 弹性计算 # 分布式计算 # 监控 # 大数据 # 调度 # MaxCompute # 对象存储 # HIVE

带你读小助手

|

博文

|

来自：云存储

数据湖构建DLF快速入门

本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析，介绍数据湖构建DLF产品的数据发现和数据探索功能。

# 数据湖构建 # 对象存储 # SQL # 存储 # 数据采集 # 数据库 # 对象存储

阿里云大数据Al技术

|

博文

|

来自：大数据与机器学习

大数据& AI 产品月刊【2024年12月】

大数据& AI 产品技术月刊【2024年12月】，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

# 大数据开发治理平台 DataWorks # 数据湖构建 # GPU云服务器 # 检索分析服务 Elasticsearch版 # 函数计算 # 云原生大数据计算服务 MaxCompute # 智能开放搜索 OpenSearch # 实时计算 Flink版 # 人工智能 # 分布式计算 # DataWorks # 大数据 # 异构计算

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

多引擎集成挖掘湖上数据价值

在 EMR 集群创建阶段已经自动安装了数据构建服务的相关SDK，同时EMR上的开源计算引擎 Spark、Hive 和 Presto 都完成了对数据湖构建服务的兼容支持，所以用户通过 EMR 引擎可获得数据湖分析的最佳体验。

# 开源大数据平台 E-MapReduce # 对象存储 # 数据湖构建 # 云原生大数据计算服务 MaxCompute # 实时数仓 Hologres # 存储 # SQL # 分布式计算 # Cloud Native # MaxCompute # 数据库 # 对象存储 # HIVE # Spark # 流计算

阿里云E-MapReduce团队

|

博文

数禾云上数据湖最佳实践

数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展，大数据团队承担的责任也越来越重，实时数仓需求，日志分析需求，即席查询需求，数据分析需求等，每个业务提出的需求都极大的考验这个Cloudera Hadoop集群的能力。为了减轻Cloudera集群的压力，我们结合自身业务情况，在阿里云上落地一个适合数禾当前现实状况的数据湖。

# 对象存储 # 云原生数据仓库AnalyticDB MySQL版 # 云监控 # 数据湖构建 # 云原生大数据计算服务 MaxCompute # 日志服务 # 负载均衡 # 数据管理 # 云服务器 ECS # 弹性伸缩 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云数据库 RDS MySQL 版 # 专有网络VPC # 云解析DNS # 存储 # SQL # 弹性计算 # 分布式计算 # 对象存储 # 监控 # 大数据 # 调度 # MaxCompute # HIVE

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

云原生数据湖构建、分析与开发治理最佳实践及案例分享

什么是数据湖？又如何对对数据湖进行分析与开发治理？本文深入浅出的介绍了云原生数据湖构建、分析与开发治理最佳实践及案例分享。

# 数据湖构建 # 对象存储 # 云原生数据仓库AnalyticDB MySQL版 # 数据集成 Data Integration # 大数据开发治理平台 DataWorks # 弹性伸缩 # 云原生大数据计算服务 MaxCompute # 数据安全中心 # 终端访问控制系统 # 日志服务 # 实时计算 Flink版 # 云数据库 RDS MySQL 版 # 访问控制 # 开源大数据平台 E-MapReduce # 存储 # 弹性计算 # 分布式计算 # DataWorks # Cloud Native # 大数据 # BI # 调度 # 对象存储 # 监控

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

如何构建云原生的开源大数据平台 | 云原生开源大数据应用实战

随着开源技术与云原生的高度融合，阿里云开源大数据平台在功能性、易用性、安全性上积累了丰富的实践经验，已成功服务数千家企业，助力其聚焦自身核心业务优势，缩短开发周期、简化运维难度，拓展更多业务创新。10月29日，阿里云发布“如何构建云原生的开源大数据平台”解决方案，邀请到了来自阿里云、微淼、Inmobi的技术专家为大家现身说法，呈现上云实践。

auqbllxiu

|

博文

《哈啰出行基于阿里云数据湖构建实践》电子版地址

哈啰出行基于阿里云数据湖构建实践

# 数据湖构建

扬流

|

博文

|

来自：大数据与机器学习

阿里云E-MapReduce产品新动态及开源大数据前沿技术 2023-3月刊

开源大数据EMR产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 日志服务 # 函数计算 # 存储 # 分布式计算 # 运维 # 监控 # 大数据 # Serverless # BI # 流计算 # Spark # 弹性计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据湖构建