开源大数据分析

深度解析EMR、Elasticsearch的业务应用
3个实验
9658
6小时
8.9分
课程简介
可学习到
  • 开通阿⾥云账号及DLF/OSS相关服务
  • 下载样例数据(csv⽂件),并上传⾄OSS
  • 使⽤DLF⾃动识别⽂件Schema并创建元数据表
  • 了解并掌握数据湖构建DLF产品的数据发现和数据探索功能
展开更多
游客44yag4ft7nckq
使⽤数据湖构建(DLF)产品对于淘宝⽤户⾏为样例数据的分析,介绍DLF产品的数据发现和数据探索功能。
游客bl53zvy3izljy
使⽤数据湖构建(DLF)产品对于淘宝⽤户⾏为样例数据的分析,介绍DLF产品的数据发现和数据探索功能。
游客f2q4zoahsboz6
使⽤数据湖构建(DLF)产品对于淘宝⽤户⾏为样例数据的分析,介绍DLF产品的数据发现和数据探索功能。
1173488641776112
好多地方不一致,没有公共资源组权限,数据源无法检测,页面不一样,设置时选不了公共资源组,就这样第一次实验结束了
游客2hlc227ba3vmu
%1. 进入管理中心 %1. 新增数据源OSS %1. 进入数据开发 %1.
游客om2eii4tm4xg2
%1. 采集数据 做到新增mysql数据源就不行了,页面不一样,实验源和报告不一样,必选项也更多,而且上一步中的连接配置中没有可选的资源组
游客4ji7lp5zmsmka
登录集群: 开启自动创建索引功能: mysql数据同步,不能输入JDBC:
yr5oppbu43lv4
本实验在构建离线同步节点时始终未能有公共资源的选项,导致后续实操无法进行,请相关人员及时说明并进行调整,谢谢
yr5oppbu43lv4
通过本次试验了解了如何在dataworks中构建数据处理流程,包括虚拟节点、离线同步节点、sql节点等,还掌握了如何上传函数jar包,实现数据可视化的功能;本实验唯一不足的点在于在编辑离线同步节点时始终没有相应的公共资源选择项出现导致很难进行后续的实操部分,希望后续课程的运维人员及时在实验文档中说明和调整,谢谢
yr5oppbu43lv4
‒ 通过本实验完成了阿里云账号开通及DLF与OSS相关服务的基本操作 ‒ 完成了样例数据的下载与分析,并将最受欢迎的前10种商品的查询与结果保存了下来 ‒ 能够快速创建元数据表并学会了数据探索等功能
展示更多
扩展学习
  • PolarDB MySQL HTAP:实时数据分析加速
  • 通过GPU云服务器生成AIGC 3D模型
  • ECS云服务器新手上路
  • 使用DAS实现数据库SQL优化
  • 基于阿里云E-HPC和OpenFoam进行流体仿真实验
展开更多