开源大数据平台 E-MapReduce的搜索结果_文章

灵杰开发者

|

博文

|

来自：大数据与机器学习

Delta Lake基础介绍（商业版）【Databricks 数据洞察公开课】

介绍 Lakehouse 搜索引擎的设计思想，探讨其如何使用缓存，辅助数据结构，存储格式，动态文件剪枝，以及 vectorized execution 达到优越的处理性能。

# 开源大数据平台 E-MapReduce # 存储 # SQL # 缓存 # 搜索推荐 # 固态存储 # 数据管理 # Scala # 文件存储 # 索引 # Python

扬流

|

博文

|

来自：大数据与机器学习

数据湖揭秘—Delta Lake

Delta Lake 是 DataBricks 公司开源的、用于构建湖仓架构的存储框架。能够支持 Spark，Flink，Hive，PrestoDB，Trino 等查询/计算引擎。作为一个开放格式的存储层，它在提供了批流一体的同时，为湖仓架构提供可靠的，安全的，高性能的保证。

# 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # 云原生数据仓库AnalyticDB MySQL版 # SQL # 存储 # 分布式计算 # 安全 # 关系型数据库 # MaxCompute # HIVE # 流计算 # Spark # RDS

扬流

|

博文

|

来自：大数据与机器学习

技术揭秘 | 阿里云EMR StarRocks 线上发布会预约开启！

2022年5月11日14：00，阿里云EMR StarRocks 产品线上发布会重磅开启，精彩不容错过！

# 开源大数据平台 E-MapReduce # 云原生数据仓库AnalyticDB MySQL版 # 数据挖掘 # OLAP # BI

灵杰开发者

|

博文

|

来自：大数据与机器学习

使用Databricks进行零售业需求预测的应用实践【Databricks 数据洞察公开课】

本文从零售业需求预测痛点、商店商品模型预测的实践演示，介绍Databricks如何助力零售商进行需求、库存预测，实现成本把控和营收增长。

# 开源大数据平台 E-MapReduce # 对象存储 # SQL # 分布式计算 # 资源调度 # 数据可视化 # 算法 # 大数据 # 对象存储 # Spark

扬流

|

博文

|

来自：大数据与机器学习

阿里云RemoteShuffleService 新功能：AQE 和流控

阿里云EMR 自2020年推出 Remote Shuffle Service(RSS)以来，帮助了诸多客户解决 Spark 作业的性能、稳定性问题，并使得存算分离架构得以实施。为了更方便大家使用和扩展，RSS 在2022年初开源(https://github.com/alibaba/RemoteShuffleService)，欢迎各路开发者共建: )

# 开源大数据平台 E-MapReduce # SQL # 分布式计算 # 负载均衡 # 监控 # 算法 # 测试技术 # Spark # 开发者 # 混合部署 # 索引

扬流

|

博文

|

来自：大数据与机器学习

阿里云发布中国云原生数据湖应用洞察白皮书

近日，阿里云发布《中国云原生数据湖应用洞察白皮书》。云原生数据湖主要应用于泛互联网行业（40.7%）及传统行业的互联网场景（泛政务、金融、工业、医疗、汽车等），未来将向更多具有大数据和高价值属性的行业拓展。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # Cloud Native # 大数据 # 开发者

灵杰开发者

|

博文

|

来自：大数据与机器学习

如何使用Delta Lake构建批流一体数据仓库【Databricks 数据洞察公开课】

Delta Lake是一个开源存储层，它为数据湖带来了可靠性。Delta Lake提供了ACID事务、可扩展的元数据处理，并统一了流式处理和批处理数据处理。Delta-Lake运行在现有数据湖之上，并且与Apache Spark API完全兼容。希望本篇能让大家更深入了解Delta Lake，最终可以实践到工作当中。

# 开源大数据平台 E-MapReduce # 存储 # SQL # 人工智能 # 分布式计算 # 大数据 # 数据处理 # API # Apache # Spark # 流计算

灵杰开发者

|

博文

|

来自：大数据与机器学习

Delta Lake基础介绍（商业版）【Databricks 数据洞察公开课】

介绍 Lakehouse 搜索引擎的设计思想，探讨其如何使用缓存，辅助数据结构，存储格式，动态文件剪枝，以及 vectorized execution 达到优越的处理性能。

# 开源大数据平台 E-MapReduce # 存储 # SQL # 缓存 # 搜索推荐 # 固态存储 # 数据管理 # Scala # 文件存储 # 索引 # Python

扬流

|

博文

|

来自：大数据与机器学习

EMR StarRocks 测试指南

日前，阿里云 E-MapReduce 与 StarRocks 社区合作，推出了首款 StarRocks 云上产品。同时，面向新老用户提供了99元指定机型（ecs.c6.xlarge）首月试用的优惠活动，欢迎感兴趣的用户前来测试。

# 开源大数据平台 E-MapReduce # 专有网络VPC # 云服务器 ECS # 弹性计算 # 数据挖掘 # 网络安全

灵杰开发者

|

博文

|

来自：大数据与机器学习

基于Confluent+Flink的实时数据分析最佳实践

在实际业务使用中，需要经常实时做一些数据分析，包括实时PV和UV展示，实时销售数据，实时店铺UV以及实时推荐系统等，基于此类需求，Confluent+实时计算Flink版是一个高效的方案。

# 云消息队列 Kafka 版 # 开源大数据平台 E-MapReduce # 实时计算 Flink版 # 实时数仓 Hologres # 专有网络VPC # 云数据库 RDS MySQL 版 # 消息中间件 # SQL # 搜索推荐 # 关系型数据库 # 数据挖掘 # Kafka # Apache # 数据库 # 流计算 # RDS

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce