EMR Serverless StarRocks体验测评

本文涉及的产品
EMR Serverless Spark 免费试用,1000 CU*H 有效期3个月
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 【8月更文挑战第14天】EMR Serverless StarRocks体验测评

定义

EMR Serverless StarRocks,为了通俗易懂,需要进行拆分,EMR、Serverless StarRocks、EMR是云原生开源大数据平台E-MapReduce,Serverless StarRocks只是EMR的一个产品规格,是开源MPP架构的OLAP分析引擎,是StarRocks在阿里云上的全托管服务,而Serverless是一种部署形态。通过如下架构图,你就会很直观的了解到StarRocks是啥了。

入门

E-MapReduce_EMR_大数据框架

EMR Serverless StarRocks

猿辅导基于 EMR StarRocks 的 OLAP 演进之路

水滴筹基于阿里云 EMR StarRocks 实战分享

基于StarRocks构建数仓场景-增量数据实时统计

基于EMR Serverless StarRocks构建分钟级准实时分析

产品的文档支持还是蛮全的,除了基本文档中心的帮助文档外,还提供了多种实战案例分享和应用场景分析,此外还有社区支持。产品试用的每一个步骤都有小问号?,点击就可以前往寻找帮助。唯一的不足的就是对当前浏览器的支持不是很友好,我用windows系统自带的Edge浏览器,在操作SQL Editor时始终无法编写SQL;而Chrome就非常友好的支持。因为EMR Serverless StarRocks属于EMR的一个产品规格,对于EMR不了解的用户来说,入门还是蛮有挑战的,当前手把手在线实验还是空白的,建议是否安排几个实战小案例做成在线实验让用户体验。

试用

点击产品评测首页的的下面位置,即可申请开始试用。

开通试用前,需要选择好地域和可用区,因为阿里云的产品都是不支持创建后变更地域的;对于没有体验过阿里云其他产品的用户来说,这里还需要提前创建好VPC、交换机等信息,可以直接点击项目下方的超链接跳转到对应产品进行创建;给实例取一个容易识别并好记的名称,并提前设置好admin用户的密码,用于manager的登录。

需要服务关联角色,点击创建便可,无需跳转,随后勾选协议,点击立即试用,至此试用开通流程已完成。

点击前往控制台,即可看到我们刚才开通试用的实例了,如下图:

待实例状态变成运行中后,我们点击实例ID便可进入实例的详情页,如下图:

此外,实例详情页还可以看到实例的BE\FE配置信息以及监控告警(默认打开的是基础版,需要高级或企业级需要开通ARMS,点击告警设置即可开通),如下图:

体验

在实例详情页点击StarRocks Manager,即可打开StarRocks的数据管理控制台,首次进入需要输入创建实例时填写的密码,完成后点击测试连通性,显示成功,点击确定即可进入。如下图:

接下来通过SQL Editor完成简单的SQL执行,如下图:

这里有必要简单普及下SQL的语法,开整:

/**创建数据库**/

create database 数据库名;

/**创建数据表**/

create table table_name(column_name column_type);

/**查询数据库**/

第一种方式:select column_name,column_name from table_name;

第二种方式:select * from table_name;

/**插入数据库**/

第一种方式:insert into table_name values (value1,value2,value3,...);

第二种方式:insert into table_name (column1,column2,column3,...) values (value1,value2,value3,...);

/**更新数据库**/

update table_name set column1=value1,column2=value2,... where some_column=some_value;

/**删除数据库**/

delete from table_name where some_column=some_value;

在控制台的全部查询里,可以看到刚执行的结果,如下图:

单机控制台的元数据管理,可以看到当前账号下所有的数据库信息,如下图:

在刚才的SQL Editor过程中,我们实际上是实现了一个类似Mysql的INSERT INTO数据导入功能,在EMR StarRocks Manager控制台,单击元数据管理,再单击数据库名称,点击任务,即可在其他导入页签查看到SQL的执行状态。如下图:

此外,除了通过上面的StarRocks Manager来访问实例外,还可以使用EMR Notebook。在E-MapReduce的控制台页面可以看到,当前Notebook、Workflow尚处于公测阶段,如下图:

点击控制台的Notebook即可跳转到免费试用申请页面,如下图:

填入必要信息,等待审核。

上面体验的都是实例的基本使用,此外用户还可以根据业务的实际需求进行实例节点的扩缩容和升降配,如下图:

由于提供试用的是入门版,扩缩容和升降配功能暂时没有标配,需要升级到标准版才有。标准版收费如下图:

还可以操作版本的升级迭代,分大小版,均可以实现自动升级,可实现业务的平滑无缝迭代。要注意的是版本是不支持降级的,所以升级前一定要确认好,避免因为版本差异带来不必要的麻烦。如下图:

小结

通过EMR StarRocks Manager可以非常高效灵活地创建和管理StarRocks实例,提供了非常良好的交互式分析体验;同时StarRocks实例的构建不需要依赖任何其他组件,真正实现了快速部署、方便维护、高效运行;此外通过控制台,用户还可以无缝扩缩、升降配实例节点、在线平滑升级,使得实例管理和维护更高效,维护人员仅需专注于实例本身。

通过对上述产品功能的体验,发现当前基本可以满足需求,但对于复杂度高、数据量大的企业级业务当前还缺乏足够的文档或者案例支持,当前支持的数据导入方式多样,基本涵盖了企业应用中能够使用到的数据类型,这点还是非常值得肯定的。

配合大数据数据迁移工具CloudCanal,EMR Serverless StarRocks可以更高效地获得数据源,非常好地解决了传统Hadoop体系组件强耦合的痛点,从而能应用于更丰富的业务场景,比如IOT领域、智慧城市、数字智能领域、异构、容灾等。

相关实践学习
【文生图】一键部署Stable Diffusion基于函数计算
本实验教你如何在函数计算FC上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。函数计算提供一定的免费额度供用户使用。本实验答疑钉钉群:29290019867
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
目录
打赏
0
0
0
0
1494
分享
相关文章
阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
面对机器学习场景下的训练瓶颈,微财选择基于阿里云 EMR Serverless Spark 建立数据平台。通过 EMR Serverless Spark,微财突破了单机训练使用的数据规模瓶颈,大幅提升了训练效率,解决了存算分离架构下 Shuffle 稳定性和性能困扰,为智能风控等业务提供了强有力的技术支撑。
175 15
美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台
美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台,实现了数据与 AI 技术的有效融合,解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台,最终实现不同场景下整体性能提升50%以上,同时综合成本下降30%。
阿里云 EMR Serverless StarRocks3.x,极速统一的湖仓新范式
阿里云 EMR Serverless StarRocks3.x,极速统一的湖仓新范式
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
EMR Serverless StarRocks 全面升级:重新定义实时湖仓分析
本文介绍了EMR Serverless StarRocks的发展路径及其架构演进。首先回顾了Serverless Spark在EMR中的发展,并指出2021年9月StarRocks开源后,OLAP引擎迅速向其靠拢。随后,EMR引入StarRocks并推出全托管产品,至2023年8月商业化,已有500家客户使用,覆盖20多个行业。 文章重点阐述了EMR Serverless StarRocks 1.0的存算一体架构,包括健康诊断、SQL调优和物化视图等核心功能。接着分析了存算一体架构的挑战,如湖访问不优雅、资源隔离不足及冷热数据分层困难等。
活动实践 | 基于EMR StarRocks实现游戏玩家画像和行为分析
基于阿里云EMR Serverless StarRocks,利用其物化视图和DLF读写Paimon等能力,构建游戏玩家画像和行为分析平台。通过收集、处理玩家行为日志,最终以报表形式展示分析结果,帮助业务人员决策。
基于OpenLake的Flink+Paimon+EMR StarRocks流式湖仓分析
阿里云OpenLake解决方案建立在开放可控的OpenLake湖仓之上,提供大数据搜索与AI一体化服务。通过元数据管理平台DLF管理结构化、半结构化和非结构化数据,提供湖仓数据表和文件的安全访问及IO加速,并支持大数据、搜索和AI多引擎对接。本文为您介绍以Flink作为Openlake方案的核心计算引擎,通过流式数据湖仓Paimon(使用DLF 2.0存储)和EMR StarRocks搭建流式湖仓。
706 5
基于OpenLake的Flink+Paimon+EMR StarRocks流式湖仓分析
活动实践 | 告别资源瓶颈,函数计算驱动多媒体文件处理测评
本方案介绍了一种高效处理文件的方法,适用于企业办公和社交媒体应用。通过阿里云的函数计算、对象存储OSS和轻量消息队列,实现文件的异步处理,如格式转换和水印添加,有效减轻了核心应用的负担,提高了业务稳定性和资源利用率。方案包括云服务器ECS、云数据库RDS、OSS存储等组件,支持快速部署和资源清理。
|
4月前
|
有奖实践,基于EMR StarRocks实现游戏玩家画像和行为分析
阿里云EMR-StarRocks联合镜舟科技,基于EMR-StarRocks实现游戏实时湖仓分析,免费试用物化视图、Paimon写入查询等新能力,前45位赢取StarRocks定制T恤、Lamy钢笔,小米充电宝,阿里云拍拍灯等活动礼品,前500位均可获得创意马克杯。
135 7
阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%
阿里云开源大数据平台 E-MapReduce 重磅推出托管弹性伸缩功能,基于 EMR 托管弹性伸缩功能,您可以指定集群的最小和最大计算限制,EMR 会持续对与集群上运行的工作负载相关的关键指标进行采样,自动调整集群大小,以获得最佳性能和资源利用率。
175 15
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等