开源大数据平台 E-MapReduce的搜索结果_文章

扬流

|

博文

|

来自：大数据与机器学习

Delta Lake基础介绍（开源版）【Databricks 数据洞察公开课】

针对社区版本Delta Lake提供的几大核心特性进行讲解，并通过示例演示如何使用这些特性。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 日志服务 # 存储 # SQL # JSON # 分布式计算 # 大数据 # 数据管理 # 数据处理 # 数据库 # Spark # 数据格式

扬流

|

博文

|

来自：大数据与机器学习

深度解析数据湖存储方案Lakehouse架构【Databricks 数据洞察公开课】

从数据仓库、数据湖的优劣势，湖仓一体架构的应用和优势等多方面深度解析Lakehouse架构。

# 开源大数据平台 E-MapReduce # 对象存储 # 日志服务 # 云解析DNS # 存储 # 数据采集 # 机器学习/深度学习 # 分布式计算 # 大数据 # BI # 数据库 # 对象存储 # Spark # 数据格式

扬流

|

博文

|

来自：大数据与机器学习

Databricks 企业版 Spark&Delta Lake 引擎助力 Lakehouse 高效访问

本文介绍了Databricks企业版Delta Lake的性能优势，借助这些特性能够大幅提升Spark SQL的查询性能，加快Delta表的查询速度。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # SQL # 存储 # 人工智能 # 分布式计算 # 算法 # 大数据 # Apache # 数据库 # Spark # 索引

扬流

|

博文

|

来自：大数据与机器学习

Delta Lake的演进历史及现状【Databricks 数据洞察公开课】

从大数据平台架构的演进、Delta Lake关键特性、版本迭代、重要功能等多方面，介绍Delta Lake的演进和优势。

# 开源大数据平台 E-MapReduce # 对象存储 # 日志服务 # 数据管理 # 云原生数据仓库AnalyticDB MySQL版 # 云原生大数据计算服务 MaxCompute # SQL # 存储 # 分布式计算 # 大数据 # 数据管理 # 数据库 # 对象存储 # HIVE # Spark # Python

灵杰开发者

|

博文

|

来自：大数据与机器学习

使用Databricks进行零售业需求预测的应用实践【Databricks 数据洞察公开课】

本文从零售业需求预测痛点、商店商品模型预测的实践演示，介绍Databricks如何助力零售商进行需求、库存预测，实现成本把控和营收增长。

# 开源大数据平台 E-MapReduce # 对象存储 # SQL # 分布式计算 # 资源调度 # 数据可视化 # 算法 # 大数据 # 对象存储 # Spark

灵杰开发者

|

博文

|

来自：大数据与机器学习

如何使用Delta Lake构建批流一体数据仓库【Databricks 数据洞察公开课】

Delta Lake是一个开源存储层，它为数据湖带来了可靠性。Delta Lake提供了ACID事务、可扩展的元数据处理，并统一了流式处理和批处理数据处理。Delta-Lake运行在现有数据湖之上，并且与Apache Spark API完全兼容。希望本篇能让大家更深入了解Delta Lake，最终可以实践到工作当中。

# 开源大数据平台 E-MapReduce # 存储 # SQL # 人工智能 # 分布式计算 # 大数据 # 数据处理 # API # Apache # Spark # 流计算

灵杰开发者

|

博文

|

来自：大数据与机器学习

Delta Lake基础介绍（商业版）【Databricks 数据洞察公开课】

介绍 Lakehouse 搜索引擎的设计思想，探讨其如何使用缓存，辅助数据结构，存储格式，动态文件剪枝，以及 vectorized execution 达到优越的处理性能。

# 开源大数据平台 E-MapReduce # 存储 # SQL # 缓存 # 搜索推荐 # 固态存储 # 数据管理 # Scala # 文件存储 # 索引 # Python

扬流

|

博文

|

来自：大数据与机器学习

数据湖揭秘—Delta Lake

Delta Lake 是 DataBricks 公司开源的、用于构建湖仓架构的存储框架。能够支持 Spark，Flink，Hive，PrestoDB，Trino 等查询/计算引擎。作为一个开放格式的存储层，它在提供了批流一体的同时，为湖仓架构提供可靠的，安全的，高性能的保证。

# 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # 云原生数据仓库AnalyticDB MySQL版 # SQL # 存储 # 分布式计算 # 安全 # 关系型数据库 # MaxCompute # HIVE # 流计算 # Spark # RDS

扬流

|

博文

|

来自：大数据与机器学习

技术揭秘 | 阿里云EMR StarRocks 线上发布会预约开启！

2022年5月11日14：00，阿里云EMR StarRocks 产品线上发布会重磅开启，精彩不容错过！

# 开源大数据平台 E-MapReduce # 云原生数据仓库AnalyticDB MySQL版 # 数据挖掘 # OLAP # BI

灵杰开发者

|

博文

|

来自：大数据与机器学习

使用Databricks进行零售业需求预测的应用实践【Databricks 数据洞察公开课】

本文从零售业需求预测痛点、商店商品模型预测的实践演示，介绍Databricks如何助力零售商进行需求、库存预测，实现成本把控和营收增长。

# 开源大数据平台 E-MapReduce # 对象存储 # SQL # 分布式计算 # 资源调度 # 数据可视化 # 算法 # 大数据 # 对象存储 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce