课时1:实现淘宝母婴订单实时查询和可视化

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
简介: 课时1:实现淘宝母婴订单实时查询和可视化

Flink-Learning训练营:课时1:实现淘宝母婴订单实时查询和可视化

课程地址:https://developer.aliyun.com/trainingcamp/0bcc1ab57cf841a2af632d6252fecbab

淘宝母婴订单实时查询和可视化

 

内容简介

一、实验准备

二、实验重点内容

三、实验收获

 

今天我们将进行一个实验,实现淘宝母婴订单实时查询和可视化,在进行实验之前,我们需要开通阿里云实时计算flink版免费试用,开通阿里云数据库RDS免费试用,开通阿里云检索分析服务ela stic search,后面用es简称。考虑到数据的连通性,需要Fink,PDS,ela stic search需要开通在同一区域同VPC下的资源。在开通之后,我将和大家一起使用flink自带的MySQL Cnnector连接RDS云数据库实例。Elasticsearch connector连接Elasticsearch检索分析服务实例,并以一个淘宝母婴订单时查询的地址,尝试上手connected的数据捕获数据写入等功能

 

一、实验准备

要开通Flink版免费试用,首先需要进入阿里云试用中心。

图片1.png

点击上述链接

http://free.aliyun.com/?crowd=enterpise&pipCode=sc  打开链接之后,我们点击右下角的立即试用。按照操作引导开通实习生flink实例。还要类比于云数据库rds和检索分析服务Elasticsearch

 

二、实验内容

(1)婴儿出生和订单情况。

image.png

首先婴儿出生和订单情况包含两份文件,再点击下面的天使数据集查看。一份数据集csv文件,指的是某一订单信息的详情。第二份文下面是行情的介绍这里不再赘述,我们需要登录rts控制台,将两份文件拷入到推荐的表中。这是两份表的表结构分别是简单的一个数据集和婴儿的信息的数据集。

image.png

接下来我们进行数据开发,我们通过创建临时表,

image.png

通过使用MySQL的connector 后置相关的链接信息,连接到MySQL实例的对应的表中。所以需要注意的是其他类型和字段的名称需要准确对应。连接完MySQL的一个实例之后,我们需要通过circle Pro 6模式的筛选集群调试,确认我们能够正确的连接到。这样才能表示,我们上述的连接信息填接准确。

我们选中dl语句以及circle语句一起执行。可以看到,我们能正常的读取到数据,就表示我们的ddl信息准确。同样的另一张表也是如如此这里就不再演示。

(2)Elasticsearch查询分析

对于es我们需要确保我们的字段类型和字段名对应准确,大部分表示我们的索引,我们需要给对应的索引要跟据我们业务情况编写对应的作业思路逻辑,将两张表进行双流交易,然后将最终的结果写入到es中,进入Enrich the or这个缩影中,那么在写入之前,我们需要先确保es能够创建索引功能,我们进行rs集群配置,这地方有一个自动创建索引的一个功能,这里有一个允许自动创建索引,如果不支持的话,我们点击右上角的修改配置,然后选中,允许自动创建索引,打勾,然后自动确定,稍等一段时间,即可配置完成。

完成之后,我们将作业执行进行一个调试功能。但调试时,他不会真实的去将索引创建并使用数据,没有实际到生产中才会。点击右上角的上线功能我们点击作业进行启动。等待片刻作业启动之后,我们即可es登录进行查看。

一个作业中,我们主要是将两张表进行双流校验,确保不断进行一个打宽的处理,方便我们后续的分析和查询。启动之后,我们点击es控制台有一个control up分析,然后通过配置公网白名单,然后点击公网入口即可跳转到可以看到的一个登录界面。 在camera登录界面,我们点击manager,然后找到索引的管理。搜索我们刚刚自动创建的一个作业的索引。

点击dex pattern搜索刚刚创建的缩影,点击next step , 点击创建,此时我们点击Discover我们即可查看到将29971条数据消费过来。然后我们对数据进行调试。

首先我们加一条数据,点击执行,添加成功,然后我们返回skype界面。刷新要查看到我们刚刚新添加的那条数据已经存在我们也可以通过精准搜索可以查看到

之后我们对数据进行一个修改的操作。首先我们根据右转ID自传搜索到medi详情,可以查看到当前ID是2757,首先我们查看一下userid的详细信息。当前的aocial id 17429开头,然后我们勾选数据,在更新完后我们点击discover界面刷新。查看,能看到数据已经更新过来,接下来我们体验一下删除操作。

首先我们还是以这项数据为例,找到他的平台id ,他的ID32768,我们将这条数据进行删除,然后返回界面进行查看,查看到数据已经删除,我们已经查找不到。

3)分组统计的每月数据

首先还是在基于以前作业的基础上。在原表不变的情况下,我们根据相同的业务逻辑去编写对应的作业circle我们按照日期的准确到份,然后对每月的订单的总数和婴儿的总数进行一个统计,然后最终写入es的一个enraged order view索引中。然后我们进行调试作业。选中完全可以查看到我们的一个作业有异常,我们可以通过判断得出我们的一个订单表的一个表明有误。然后我们再次点击发现作业逻辑正常运行即可对作业进行上线发布。启动刚刚提交的一作业。等待片刻,启动之后,进行查看。

启动完成我们通过刚刚定的索引名称,我可以界面进行搜索。可以查看到,索引已经创建我们创建索引的pattern然后点击创建索引,点击下一步,点击创建。创建完成后我们点击discover 页面查看,切换刚刚创建Partern。然后点击左下角的一个Be number,然后右键点击vurlie我们进行试图界面的一个图表创建编辑,首先我们切换到斜线图,然后x轴我们选择时间。

时间的一个数量选择最大。时间的横轴名称我们自定义,这里我们定义为day-year-month选择完毕,编辑完成点击close。然后我们及y轴我们选择buy-number然后选择左侧编辑完成,点击close 。然后我们新添加一个图层,我们先切换它的图层的一个模式为折现线图。然后x轴依然选择时间轴名称和上一个图层一样。Y轴我们选择AB的number。这里我们value format选择百分比,位置选择右侧点击关闭。

(4)生育带动母婴行业发展

image.png

从此图我们可以看出,啥每月的订单数量和婴儿的出生。基本上成正比例关系,然后我们点击右上角的sell,保存当前图表名称,点击保存。

 

三、实验收获

做完本实验后,您将能够使用Flink实时计算平台创建并提交作业;编写基于FlinkTableAPI的SQL语句;使用MySQLConnector对数据库进行读取;使用ElasticsearchConnector对数据库进行写入点击关闭。
image.png

 

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
监控 小程序 安全
Uniapp使用GoEasy实现websocket实时通讯
GoEasy上架DCloud Uniapp插件市场已经有一个多月了,收到很多Uniapp开发人员的赞扬和好评。本篇文章将讲解在Uniapp下如何使用GoEasy完成第一个简单的实时通讯demo。
|
存储 网络安全
分布式存储glusterfs详解
1.什么是glusterfs glusterfs是一个开源分布式文件系统,具有强大的横向扩展能力,可支持数pb存储容量和数千客户端,通过网络互联成一个并行的网络文件系统,具有可扩展性、高性能、高可用等特点 常用资源:
1121 0
分布式存储glusterfs详解
|
API
【工具推荐】 Obsidian 插件 Obsidian to Flomo 一键同步内容到 Flomo 插件
Obsidian to Flomo 是一款可以一键发送内容到 Flomo 的Obsidian 插件。
1420 0
|
11月前
|
机器学习/深度学习 人工智能 文字识别
POINTS 1.5:腾讯微信开源的多模态大模型,超越了业界其他的开源视觉语言模型,具备强大的视觉和语言处理能力
POINTS 1.5是腾讯微信推出的多模态大模型,基于LLaVA架构,具备强大的视觉和语言处理能力。它在复杂场景的OCR、推理能力、关键信息提取等方面表现出色,是全球10B以下开源模型中的佼佼者。
570 58
POINTS 1.5:腾讯微信开源的多模态大模型,超越了业界其他的开源视觉语言模型,具备强大的视觉和语言处理能力
|
8月前
|
JSON 监控 网络协议
Bilibili直播信息流:连接方法与数据解析
本文详细介绍了自行实现B站直播WebSocket连接的完整流程。解析了基于WebSocket的应用层协议结构,涵盖认证包构建、心跳机制维护及数据包解析步骤,为开发者定制直播数据监控提供了完整技术方案。
|
机器学习/深度学习 搜索推荐 数据可视化
数据驱动方式在软件开发中的应用场景
【10月更文挑战第13天】总之,数据驱动方式在软件开发的各个领域都有着重要的应用,它使软件能够更好地适应动态变化的环境,提供更个性化、高效和智能的服务。随着技术的不断发展,数据驱动方式的应用场景还将不断拓展和深化。
398 57
|
小程序
微信小程序wx.navigateTo从子页面跳回父页面,页面如何刷新
要理解微信小程序的页面刷新问题,首先需要理解页面的生命周期,所以以下两个页面必须多看几遍页面生命周期页面路由 关于页面生命周期,重点在于理解onLoad,onShow. 从以上的第一个链接文档可以看到,页面create后,依次执行onLoad,onShow,onReady,但onLoad和onR.
4012 0
|
机器学习/深度学习 数据采集 存储
一文读懂蒙特卡洛算法:从概率模拟到机器学习模型优化的全方位解析
蒙特卡洛方法起源于1945年科学家斯坦尼斯劳·乌拉姆对纸牌游戏中概率问题的思考,与约翰·冯·诺依曼共同奠定了该方法的理论基础。该方法通过模拟大量随机场景来近似复杂问题的解,因命名灵感源自蒙特卡洛赌场。如今,蒙特卡洛方法广泛应用于机器学习领域,尤其在超参数调优、贝叶斯滤波等方面表现出色。通过随机采样超参数空间,蒙特卡洛方法能够高效地找到优质组合,适用于处理高维度、非线性问题。本文通过实例展示了蒙特卡洛方法在估算圆周率π和优化机器学习模型中的应用,并对比了其与网格搜索方法的性能。
1206 1
|
网络协议 Shell Linux
推荐一款开源跨平台的超级终端工具-windterm
一款风格独特、开源、且完全免费的SSH/Telnet/Serial/Shell/Sftp 客户端
推荐一款开源跨平台的超级终端工具-windterm
|
机器学习/深度学习 编解码 算法框架/工具
经典神经网络论文超详细解读(二)——VGGNet学习笔记(翻译+精读)
经典神经网络论文超详细解读(二)——VGGNet学习笔记(翻译+精读)
661 1
经典神经网络论文超详细解读(二)——VGGNet学习笔记(翻译+精读)