第一天是一个基于EMR集群的离线数据分析项目,这个项目其实在之前社区的云上漫步第二期就有体验过。主要内容就是使用EMR Hadoop集群,利用使用hive对数据进行加载,计算等操作。
第二天是使用阿里云平台的Elasticsearch集群,对ECS服务器上的数据进行采集、通过配置指标看板对数据进行分析的过程。这其实对于公司管理海量数据很有帮助。
第三天是使用PAI机器学习平台,搭建一个基于协同过滤算法的商品推荐系统。这个项目其实很有意思。通过数据挖掘,分析出大量数据之间的关联联系,这对于实际应用(如购物平台的商品推荐)都是由一定的实现价值。
第四天是直播带练,内容是利用湖仓一体架构快速搭建企业数据中台。直播时间比较短。技术方面使用的是基于Delta Lake。
第五天是最后一次直播带练,主要内容是基于Elasticsearch+Fink的日志全观测最佳实践。这个内容对于平时运维工作有一定的帮助,平时企业生产中系统会产生大量的日志文件,利用大数据技术对日志数据进行分析,有利于我们及时发现系统中存在的问题。
春天的脚步越来越近🌳,冬季实战营也落下了帷幕。感谢阿里云社区提供这么好的学习平台,实战营虽然结束了,但是学习的脚步也没有停下,阿里云社区还有许多优质的技术博文等着我们去发现和学习(ง •_•)ง