冬季实战营第五期学习报告
第一天 基于EMR离线数据分析
本实验免费提供EMR集群,基于EMR集群进行离线数据分析。
背景知识
E-MapReduce(简称“EMR”)是云原生开源大数据平台,向客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、Clickhouse、Delta、Hudi等开源大数据计算和存储引擎。EMR计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK、专有云平台。产品文档地址:https://www.aliyun.com/product/emapreduce
安全可靠:通过 VPC 和安全组设置集群网络安全策略,支持Kerberos身份认证和数据加密,使用Ranger数据访问控制。支持数据加密,保证数据安全
第二天 使用阿里云Elasticsearch快速搭建智能运维系
背景介绍
阿里云Elasticsearch兼容开源ELK功能,提供免运维全托管服务的弹性云搜索与分析引擎,致力于数据库加速、数据分析、信息检索、智能运维监控等场景服务;独有的云原生高性能内核、达摩院NLP分词、向量检索、智能运维、免费X-Pack高级商业特性等能力,全面提升企业应用效率,降低成本。
第三天 推荐系统入门之使用协同过滤实现商品推荐
本场景将使用机器学习PAI平台,指导您搭建一个基于协同过滤算法的商品推荐系统。
背景知识
协同过滤算法是一种基于关联规则的算法。以购物行为为例,如果用户甲和用户乙都购买了商品A和商品B,则可以假定用户甲和用户乙的购物品味相似。当用户甲购买了商品C,而用户乙未购买时,可以将商品C推荐给用户乙,这就是经典的User-Based,即以User的特性为关联。
第四天 直播实战
利用湖仓一体架构快速搭建企业数据中台
第五天 直播实战
基于Elasticsearch+Fink的日志全观测最佳实践