冬季实战营第五期学习报告
第一天 基于EMR离线数据分析
本实验免费提供EMR集群,基于EMR集群进行离线数据分析。
体验收获
- 登录EMR集群。
- 上传数据到HDFS。
- 使用hive创建表,并从hadoop文件系统加载数据。
背景知识
E-MapReduce(简称“EMR”)是云原生开源大数据平台,向客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、Clickhouse、Delta、Hudi等开源大数据计算和存储引擎。EMR计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK、专有云平台。产品文档地址:https://www.aliyun.com/product/emapreduce
第二天 使用阿里云Elasticsearch快速搭建智能运维系
体验目标
本场景通过创建登录阿里云Elasticsearch集群,使用Beats采集器收集ECS上的系统数据和Nginx服务数据,配置基础的指标分析看板,简单展示数据采集、分析的过程和操作方式。
第三天 推荐系统入门之使用协同过滤实现商品推荐
本场景将使用机器学习PAI平台,指导您搭建一个基于协同过滤算法的商品推荐系统。
背景知识
数据挖掘的一个经典案例就是尿布与啤酒的例子。尿布与啤酒看似毫不相关的两种产品,但是当超市将两种产品放到相邻货架销售的时候,会大大提高两者销量。很多时候看似不相关的两种产品,却会存在这某种神秘的隐含关系,获取这种关系将会对提高销售额起到推动作用,然而有时这种关联是很难通过经验分析得到的。这时候我们需要借助数据挖掘中的常见算法-协同过滤来实现。这种算法可以帮助我们挖掘人与人以及商品与商品的关联关系。
第四天 直播实战
利用湖仓一体架构快速搭建企业数据中台
第五天 直播实战
基于Elasticsearch+Fink的日志全观测最佳实践