数据湖构建的搜索结果_热门_第2页-阿里云开发者社区

skin778

|

博文

|

作为最为流行的开源数据库，MYSQL正成为越来越多企业的选择。MySQL数据库大量应用在各种业务系统，除了在线业务逻辑的读写，还会有一些额外的数据分析需求，如BI报表、可视化大屏、大数据应用等。但受限于MySQL架构等问题，在面对数据分析场景时，其往往力不从心。

# 云数据库 RDS MySQL 版 # 数据湖构建 # 云原生大数据计算服务 MaxCompute # SQL # 存储 # 分布式计算 # 关系型数据库 # MySQL # 数据挖掘 # 大数据 # BI # 数据库 # HIVE

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

数据湖构建服务搭配Delta Lake玩转CDC实时入湖

Change Data Capture(CDC)用来跟踪捕获数据源的数据变化，并将这些变化同步到目标存储(如数据湖或数据仓库)，用于数据备份或后续分析，同步过程可以是分钟/小时/天等粒度，也可以是实时同步。CDC方案分为侵入式(intrusive manner)和非倾入性(non-intrusive manner)两种。

# 数据湖构建 # 日志服务 # SQL # 存储 # 分布式计算 # Java # 数据库连接 # 分布式数据库 # HIVE # 流计算 # Spark # Hbase

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

DLF +DDI 一站式数据湖构建与分析最佳实践

本文由阿里云数据湖构建 DLF 团队和 Databricks 数据洞察团队联合撰写，旨在帮助您更深入地了解阿里云数据湖构建（DLF）+Databricks 数据洞察（DDI）构建一站式云上数据入湖。

# 数据湖构建 # 云原生大数据计算服务 MaxCompute # 日志服务 # 对象存储 # 云数据库 RDS MySQL 版 # 数据管理 # 云消息队列 Kafka 版 # DataV数据可视化 # 存储 # 消息中间件 # 分布式计算 # 关系型数据库 # Kafka # 数据库 # 对象存储 # Spark # 流计算 # RDS

云起实验室小助手

|

博文

数据湖构建DLF数据探索快速入门-淘宝用户行为分析

本教程通过使⽤数据湖构建（DLF）产品对于淘宝⽤户⾏为样例数据的分析，介绍DLF产品的数据发现和数据探索功能。教程内容包括：1. 服务开通：开通阿⾥云账号及DLF/OSS相关服务2. 样例数据集下载和导⼊：下载样例数据（csv⽂件），并上传⾄OSS3. DLF数据发现：使⽤DLF⾃动识别⽂件Schema并创建元数据表4. DLF数据探索：使⽤DLF数据探索，对⽤户⾏为进⾏分析，包括⽤户活跃度、漏⽃模型等

# 数据湖构建 # 对象存储 # SQL # 数据采集 # 数据挖掘 # 数据库 # 对象存储 # 存储 # 分布式计算 # 关系型数据库 # Spark # 数据格式

扬流

|

博文

|

来自：大数据与机器学习

国内首批！阿里云云原生数据湖产品通过信通院评测认证

国内首批！得分排名第一！

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 对象存储 # 数据管理 # 数据湖构建 # 大数据开发治理平台 DataWorks # 存储 # 弹性计算 # 运维 # DataWorks # Cloud Native # 安全 # 大数据 # 数据管理 # 对象存储 # 容器

SelectDB

|

博文

|

来自：数据库

Apache Doris 3.0 里程碑版本｜存算分离架构升级、湖仓一体再进化

从 3.0 系列版本开始，Apache Doris 开始支持存算分离模式，用户可以在集群部署时选择采用存算一体模式或存算分离模式。基于云原生存算分离的架构，用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离，并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。

# 云原生数据仓库AnalyticDB MySQL版 # 数据湖构建 # 对象存储 # 存储 # SQL # 缓存 # Apache # 索引

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

如何构建云原生的开源大数据平台 | 云原生开源大数据应用实战

随着开源技术与云原生的高度融合，阿里云开源大数据平台在功能性、易用性、安全性上积累了丰富的实践经验，已成功服务数千家企业，助力其聚焦自身核心业务优势，缩短开发周期、简化运维难度，拓展更多业务创新。10月29日，阿里云发布“如何构建云原生的开源大数据平台”解决方案，邀请到了来自阿里云、微淼、Inmobi的技术专家为大家现身说法，呈现上云实践。

aly109u0

|

博文

阿里云数据湖构建

# 数据湖构建 # Cloud Native # 安全 # 数据管理 # 关系型数据库 # 数据安全/隐私保护

温柔的养猫人

|

博文

|

来自：大数据与机器学习

重磅下载！首次揭秘如何构建阿里云云原生数据湖体系

《阿里云云原生数据湖体系全解读》涵盖数据湖存储、加速、构建、计算、治理，一站搭建全新云原生数据湖体系，完成企业大数据架构转型。速度下载收藏！

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # 数据湖构建 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # 缓存 # 分布式计算 # Kubernetes # Cloud Native # 大数据 # 数据管理 # 对象存储 # Spark # 容器

阿里云E-MapReduce团队

|

博文

数禾云上数据湖最佳实践

数禾科技从成立伊始就组建了大数据团队并搭建了大数据平台。并在ECS上搭建了自己的Cloudera Hadoop集群。但随着公司互联网金融业务的快速扩张发展，大数据团队承担的责任也越来越重，实时数仓需求，日志分析需求，即席查询需求，数据分析需求等，每个业务提出的需求都极大的考验这个Cloudera Hadoop集群的能力。为了减轻Cloudera集群的压力，我们结合自身业务情况，在阿里云上落地一个适合数禾当前现实状况的数据湖。

# 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 弹性伸缩 # 云服务器 ECS # 数据管理 # 数据湖构建 # 云监控 # 云原生数据仓库AnalyticDB MySQL版 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 对象存储 # 负载均衡 # 日志服务 # 专有网络VPC # 云解析DNS # 存储 # SQL # 弹性计算 # 分布式计算 # 对象存储 # 监控 # 大数据 # 调度 # MaxCompute # HIVE

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据湖构建