什么是神龙大数据加速引擎MRACC

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: MRACC

神龙大数据加速引擎MRACC是基于阿里云IaaS资源推出的大数据加速引擎,用于优化基于大数据主流计算框架搭建的大数据框架,能显著提升数据湖及数据仓库性能。配合资源管理工具FastMR快速构建大数据计算集群,全面提升研发效率。

使用MRACC加速大数据应用

一个使用MRACC加速的大数据应用的基础架构如下图所示。

其中:

  • 资源层(阿里云IaaS资源):在资源层使用阿里云IaaS资源,按需开启,满足大规模大数据集群的计算、存储、网络资源的弹性需求,并支持FPGA/GPU等异构计算。
  • 性能分析(神龙大数据应用性能分析):在分析层使用MRACC自研的可视化应用分析和资源监控工具,支持用户快速定位应用瓶颈,充分发挥资源能力。
  • 框架层(神龙大数据加速引擎):在框架层使用MRACC实现多框架统一加速。MRACC主要利用了ERDMA高性能网络进行了shuffle组件优化,提升分布式系统的数据交换能力;使用向量化等手段对SQL引擎进行了深度优化。并针对数据湖场景对alluxio进行了深度优化。
  • 调度层(神龙大数据加速任务调度):在调度层使用FastMR构建大数据计算任务并管理大规模大数据集群相关的资源,并支持ACK容器调度。
  • 应用层(神龙大数据加速参考解决方案):在应用层实现针对各种应用场景的大数据应用,覆盖数据湖、内容推荐、商业智能、用户画像等常见场景。由于在框架层使用MRACC实现统一加速,您只需调整少量代码即可大幅提升应用性能。

产品优势

使用MRACC加速大数据应用具有以下优势:

  • 基于阿里云IaaS资源,资源易用性和稳定性有保障。
  • 配合FastMR一键构建任务,缩短创建和配置资源的时间并提高节点资源利用率与弹性功能,大大降低成本。
  • 支持多种大数据常用组件,针对阿里云IAAS做了大量软硬件优化,提升了大数据整体的性价比。

神龙大数据计算加速引擎MRACC-SPARK

MRACC-SPARK是阿里云神龙计算加速团队基于阿里云IaaS资源层研发和维护的高效SPARK加速组件,旨在实现开源兼容以及无感地加速您的大数据任务。

  • MRACC-SPARK支持基于开源SPARK主流模块开发的分布式大数据计算任务。
  • 在接口层面上,MRACC-SPARK兼容了开源SPARK,对于原生的SPARK任务实现了无感的性能加速。
  • 针对大数据任务重IO特性,MRACC-Spark在网络和存储方面结合云上的架构优势进行软硬件加速。

MRACC-SPARK(MRACC计算加速)支持的加速特性包括但不限于:

  • SQL引擎优化,使用缓存、文件裁剪、索引等优化手段;
  • 网络加速,使用eRDMA进行网络加速,将shuffle阶段的数据交换运行在eRDMA网络,使得延时降低、CPU利用率大幅提升。
  • 算子卸载,将压缩等运算卸载到异构器件

MRACC-SPARK(MRACC计算加速)的计算速度与计算成本具有显著优势。更多详细测试数据,请参见TPCXBB。

神龙大数据存储加速引擎MRACC-ALLUXIO

MRACC-ALLUXIO是阿里云神龙计算加速团队基于阿里云IaaS资源层研发和维护的高效ALLLUXIO加速组件,旨在实现开源兼容以及无感地加速您的大数据任务。

MRACC-Allxio 结合云上网络和存储方面的架构优势进行硬件加速并针对OSS等UFS实现读写优化;并且在元数据缓存管理、缓存命中率、缓存读写性能等方面进行优化。目前相对于开源Alluxio在TPCx-HS上有40%性能提升。

MRACC-ALLXIO(MRACC缓存/存储加速)支持的加速特性包括但不限于:

  • OSS写优化
  • OSS读优化
  • 缓存命中率优化
  • 调度优化
  • 近存储计算异构卸载

MRACC-ALLUXIO(MRACC缓存/存储加速)的训练速度与训练成本具有显著优势。

效果量化

如何应用

收费

使用神龙大数据加速引擎MRACC不需要额外支付费用,您只需为执行计算任务过程中使用的阿里云资源付费。

如果您需要了解执行计算任务涉及到的阿里云资源的计费标准,请参见相关产品文档的计费章节。例如云服务器ECS计费对象存储OSS计费文件存储NAS计费

落地(部署)

1、手动安装

下载 Alluxio

wget https://downloads.alluxio.io/downloads/files/2.8.0/alluxio-2.8.0-bin.tar.gz -P /root/alluxio

配置 Alluxio

解压alluxio压缩包

tar -xvf alluxio-2.8.0-bin.tar.gz

在主节点上创建conf/alluxio-site.properties,配置主节点主机名及挂载点:

alluxio.master.hostname=<MASTER_HOSTNAME>

alluxio.master.mount.table.root.ufs=<STORAGE_URI>

将每个Alluxio主节点的主机名附加到conf/masters中,并将每个worker节点的主机名附加到conf/worers中。

分发alluxio包到各个worker节点中

scp -r alluxio-2.8.0 root@120.24.245.139:/root

格式化

格式化日志将从Alluxio删除所有元数据。但是,存储在存储器中的数据将不受影响。

./bin/alluxio formatMasters

启动Alluxio集群

在主节点上,用以下命令启动Alluxio集群:

./bin/alluxio-start.sh all SudoMount


优势

  • 提供内存级I/O吞吐率,同时降低具有弹性扩张特性的数据驱动型应用的成本开销。
  • 简化云存储和对象存储接入。
  • 简化数据管理,提供对多数据源的单点访问。
  • 应用程序部署简易。

2、fastmr拉起

·选用vm镜像通过fastmr创建ALLUXIO集群。fastmr使用详见最佳用户指南文档。

3、容器交付

·conda环境下,跟数据湖解决方案一同创建。


兼容性

     1、现有集群(使用方案1)

     2、全新集群(使用方案2.3)

用户指南文档

客户自建高性能大数据集群在进行ECS 选型时,测试各种ECS集群大数据E2E性能是一件较为复杂繁琐的工作。FastMR仅需要通过简单配置,便能自动拉起spark/hadoop大数据集群,实现集群互联和组件部署及监控,并完成TPC-DS、TPCx-HS等具有较高认可度的大数据基础测试,输出该集群的大数据性能分析报告。用户可以通过性能分析报告和火焰图、资源监控等信息,助力完成大数据业务ECS性能选型。

前提条件

集群支持python 3.x环境

下载并安装FASTMR

wget -P /root https://fastmr.oss-cn-shenzhen.aliyuncs.com/yunqi_Lab/fastmr.tar.gz

cd /root && tar -zxvf fastmr.tar.gz && cd fastmr

pip3 install --upgrade pip

pip3 install wheel setuptools_rust

pip3 install --force-reinstall fastmr-1.0.0-py3-none-any.whl

配置集群

参数

属性名称

缺省

含义

model

DT

CDT:自动化创建ECS集群、部署大数据环境、完成TPC性能测试。
DT:使用现有ECS集群、部署大数据环境、完成TPC性能测试。

public_ip

/

服务器的公网ip。分为masters和workers的公网ip,每一台服务器的ip都需要填写

usr

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
目录
相关文章
|
6月前
|
人工智能 安全 算法
AI与大数据:智慧城市安全的护航者与变革引擎
AI与大数据:智慧城市安全的护航者与变革引擎
216 1
|
6月前
|
存储 数据采集 大数据
大数据处理与分析技术:驱动智能决策的引擎
本文介绍了大数据处理与分析技术在现代社会中的重要性和应用。从数据采集、存储、处理到分析决策,大数据技术为我们提供了深入洞察和智能决策的能力,推动着各行各业的创新和发展。
274 0
|
1月前
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
178 1
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
1月前
|
存储 数据采集 分布式计算
大数据技术:开启智能时代的新引擎
【10月更文挑战第5天】大数据技术:开启智能时代的新引擎
|
6月前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之DataWorks体验案例绑定如何绑定到正确的maxcomputer引擎上
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
3月前
|
Java Spring 安全
Spring 框架邂逅 OAuth2:解锁现代应用安全认证的秘密武器,你准备好迎接变革了吗?
【8月更文挑战第31天】现代化应用的安全性至关重要,OAuth2 作为实现认证和授权的标准协议之一,被广泛采用。Spring 框架通过 Spring Security 提供了强大的 OAuth2 支持,简化了集成过程。本文将通过问答形式详细介绍如何在 Spring 应用中集成 OAuth2,包括 OAuth2 的基本概念、集成步骤及资源服务器保护方法。首先,需要在项目中添加 `spring-security-oauth2-client` 和 `spring-security-oauth2-resource-server` 依赖。
52 0
|
3月前
|
消息中间件 数据挖掘 Kafka
揭秘大数据时代的极速王者!Flink:颠覆性流处理引擎,让实时数据分析燃爆你的想象力!
【8月更文挑战第29天】Apache Flink 是一个高性能的分布式流处理框架,适用于高吞吐量和低延迟的实时数据处理。它采用统一执行引擎处理有界和无界数据流,具备精确状态管理和灵活窗口操作等特性。Flink 支持毫秒级处理和广泛生态集成,但学习曲线较陡峭,社区相对较小。通过实时日志分析示例,我们展示了如何利用 Flink 从 Kafka 中读取数据并进行词频统计,体现了其强大功能和灵活性。
72 0
|
3月前
|
大数据 RDMA
神龙大数据加速引擎MRACC问题之MRACC-Spark利用eRDMA近网络优化插件来提升性能如何解决
神龙大数据加速引擎MRACC问题之MRACC-Spark利用eRDMA近网络优化插件来提升性能如何解决
42 0
|
3月前
|
SQL 存储 分布式计算
神龙大数据加速引擎MRACC问题之RDMA技术帮助大数据分布式计算优化如何解决
神龙大数据加速引擎MRACC问题之RDMA技术帮助大数据分布式计算优化如何解决
56 0
|
4月前
|
分布式计算 Apache Spark