实时计算 Flink 训练营场景与应用|学习笔记(三)

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 快速学习实时计算 Flink 训练营场景与应用

开发者学堂课程【实时计算 Flink 实战课程实时计算 Flink 训练营场景与应用】学习笔记,与课程紧密联系,让用户快速学习知识。  

课程地址:https://developer.aliyun.com/learning/course/762/detail/13352


实时计算 Flink 训练营场景与应用

// 实时风控包括金融一些其他的带有止损的或者是侦查安全监控类的一些场景会比较常见,对于整个互联网时代的到来,实际上大量的数据用户访问请求大量的业务都会这个需求逼到一个非常极致的系统架构,而之前对于时效性来说,或者对于实时性要求没有如此高,对于很多的风控系统来说,用离线的数据可以进行规则的检测,实际上到目前越来越实时化之后,止损会因为若干时间的推延,导致产生巨大的咨询,此时往往需要用Flink 的实时计算引擎去实时的产生数据,实时产生业务结果至相关的系统规则引擎,此时操作时,规则引擎实时后数据再产生相应的一些规则的判断业务,判断一个客户是合法客户还是非法的客户就是观察操作,判断是合法的操作还是有止损产生的操作,整个实时计算的核心作用就是实时的计算用户到最新的用户的行为最新业务的系统的周边的结果实时化的进行计算,然后产生的数据规则引擎让规则引擎可以实时拿到这些数据,进而产生更加更加实时化的,或者是更加需要规则及调研的一个结果。

3、实时机器学习

实时计算Flink训练营场景与应用-7628053.png 

// 实时机器学习是一个更宽泛的概念,对于传统的单色就是传统态学习机械学,主要侧重于静态的模型和历史数据进行训练问题。其实大部分时候可以看到用户的短期行为,本质来说其实是对于模型的一些修正或者对业务的判断走向是有价值或者有必要去做的。对于这种系统来说,需要其他用户最近的一些行为进行采集,进行特征工程之后让实时机器学习的系统进行阅读学习。此时动态的实时一些新的规则,或者是需要产生一些新的广告等就会有极大的帮助

// 总结第三章内容:讲解了三个不带行业属性的、通用的,第一,实时数仓,第二,实时风控,第三,实时机器学习。本质上都是前面三个技术场景的网业务跨了一步后形成的业务上产品或者业务上的案例

 

四、行业案例

实时计算Flink训练营场景与应用-7628369.png

// 第四结合一些业务场景讲解在各个业务行业里的各个领域实时计算能够产生价值。举了4~5个实时计算在各个行业的具体案例,但因为受限于偏幅,并不会将每一个案例讲的特别的通透,更多的是描述案例产生的背景用户痛点需要用到实时计算的原因、实时计检查问题这次课程是一个新手训练营,更多的还是泛泛而论科普一下,或者是讨论具体的实时计算相关的一些案例场景使用方法等。

1、金融行业应用

实时计算Flink训练营场景与应用-7628572.png

// 对于金融行业来说,最近阿里云商业化客户在社区的客户都非常火爆的相关领域,因为金融领域实际上是在稍微传统的行业里尝试新技术最勇敢、创新的一个行业,所以大量大数据的相关业务都在金融行业进行有效开发,有业务有数据,同时也有技术产线的意识。现在实计算在金融行业里用的比较多其实核心的一个特点在于整个金融行业都开始在面向数字化的一个转型。重现一下,都在网线上传统网云上进行搬运

// 第一,由人决策机器决策到AI 决策的演化,业务会越来越复杂,之前为线下,现在同样有线上的业务,有终端,有APP服务到千家万户的比例也会越来越,同时业务变化也十分迅速。

// 第二其实越来越多的数据需要实时的决策,之前都是线下的业务线下有柜台例如银行的柜台或者保险的话是点对点的拜访,点对点清单,其实整个的数据实时的时效性要求没有如此高,甚至是隔一天或者隔一周去回顾这些数据其实都没有问题,但是现在随着业务线上化之后包括流量监控,销售的情况等,完全需要一个实实的报表结果,决策,需要越来越多的系统需要支持实时化。同时数据要求会越来越高。之前的业务系统其实大部分是人的决策,有很多线下柜台人员的决策或者是保险客户人员的决策,此时若数据出现错误,实际上不会影响业务。但是随着整个业务化数字化之后,此时数据将直接影响决策和线上运营的活动,所以需要数据质量越来越高。最后一个是传统的风控项实时化的一个转型,因为之前提及到几个点,包括信用违约账户完全贷款欺诈,这个整个线上化之后没有太多的客户去参与此时面临系统需要立刻放弹立刻出单立刻转型,此时会导致巨大的一个交易风险,其实针对这种情况,推荐考虑整个使用Flink 实时化计算。这种交互式分析,整个链路的一套系统可以帮助客户从远端的APP到柜台等,整个链路能够实时的采集实时的计算,最终实时的反馈到业务的线上结果,能够为风控业务实时报表业务实时推荐业务一些其他的支撑型运营的业务能够提供实时化的一个支持。能够解决金融行业目前普遍面临的实时化转型的一个诉求。

2、在线教育行业应用

实时计算Flink训练营场景与应用-7629456.png

// 在线教育行业,实际上也是因为疫情,在线行业变得非常火爆之前有大量传统教育行业最开始面向转型线行业进行转出,因为不希望把所有的学生集中集中到一个教室,增加了疫情传播的风险在线教育就变得火爆,现在目前来说整个教育也从线下搬到线上,传统的直接线上面临着很大的实时自动化的需求,主要体现在数量庞大,因为用户蜂拥而至数据量用户量,导致用户行为剧增。有越来越多的场景,推荐的场景运营的场景,实际上有非常强烈的实时化诉求,使用的角色也是多化的对于之前来说大部分的业务报表,实际上都是老板领导一起查看的,但是随着整个数据化转型逐步上道,各个中小企业都在实时化此时数据实际上已经开始逐步发挥价值,之前只有领导才能看到的数据,现在是整个民主化,所有的一线运营人员都能看到报表,能够运营相关的一些决策。最后还有需求的复杂,就是整个就业还是属于一个偏在线,因为是随着疫情爆发的行业,整个比较新颖的行业,能看到业务快速爆发式的增长。此时看到一些BI 的场景,其实也是处于一个快速变化的复杂的状态,因为业务在同步的发展,所以需要一套完整的实时解决方案,能够帮助客户去完成业务,数据的实时化和AI化的一个转型,实际上也是实时计算Flink 需要解决问题。能够帮助用户快速的使用解决业务的问题,因为 SQL 是一个非常简单易表达的一套语言,这套语言帮助离线的或者是对批处理的数仓已经支持了二三十年的业务,所以对于实时计算来说前沉睡的未被唤醒的实时计算的业务都可以用实时计算来解决。

3、在内容资讯行业应用

实时计算Flink训练营场景与应用-76210120.png

// 内容资讯行业应用比较广泛,是一个数据密集型行业,因为内容资讯不是一个固定的方式,已经实现了一种类似于像淘宝千人界面方式,都是完全个性化的推荐,例如今日头条抖音等,此时需要大量的数据来做实时化的决策推荐,其实这个行业里,看到客户面临数据量非常大且很猛大部分的公司在某个地方抓住了某一个时间段的客户抓住一个爆爆发式的增长率或者引爆点,就实现业务的快速增长。业务形态非常的复杂,因为对于某些公司来说,其实有UGC的内容些新闻的内容一些短视频的内容,有些直播形态差异万千,其实对于整个平台构建来说,构建实时化平台的人员平台的相关数据开发其实要求很高为了实时性要求现在目前来说大部分的内容分享的平台里就有个性化推荐广告也有分控系统,这些都需要实时化、离线,现有的离线已经无法满足这些行业对于数据快速变化产生业务价值的诉求。而这一部分能够实时的在线的业务系统用户的某些系统,用户行为能够实时的去获取、计算追踪产生结果,服务线上运营现场的风控和现场广告的业务

4、实时计算在电商行业应用

实时计算Flink训练营场景与应用-76210589.png

// 实时计算在电商行业应用,其实是Flink 在阿里第一个实施的是电商行业,而且行业已经非常成熟,可以出的例子也十分多,包括之前天猫双十一举例,一个店铺,一个商家老板需要实时知道整个天猫渠道出货的情况,广告投放的情况,调整相应的一些策略,能够保证天猫双十一短短的24小时能够创造最大的收益此时数据对决策来说十分关键。目前来说电商行业特别是有集中式爆发的大促的电商行业,对于时效性要求也是十分高的,这部分作详细讲解,因为整个阿里来说都是基于实时化的应用,实化的数据几乎都是基于Flink 实时计算之后进行构建的。

5、实时计算在广告行业应用

实时计算Flink训练营场景与应用-76210875.png

// 实时计算在广告行业的应用,广告行业从诞生之初,都是一个时效性要求十分高的行业。与之前的提到的教育金融的某些领域都不太一样。之前内容还能容忍非实时理想化,但对于广告来说,大部分的场景或者是核心的场景,最开始就是实时化的,因为整个用户行为不停的产生结果,不停给实时计算系统进行相应的计算。在线的反作弊广告的核心就是流量,流量作假直接会影响公司的营收在线的计费都是涉及到广告投放的计费在线社会中的定向广告的推荐在线点击的反馈实时的索引、实时的广告链接的检测等这些行业,这些其实之前都在使用偏流式系统甚至有些能在社区看到商业的话,甚至客户自己编写代码完成,其实从成本收益来说,价值不因为自己维护一套,特别是自己完全构建一套系统,投入会十分高,其实在大部分的广告场景里面,大部分的广告行业里面计算相应的一些任务指标的话,推荐Flink ,因为能够极大的减少业务人员业务开发人员架构人员在实际上操作遇到的各种各样不确定性,能够做到十分稳定的产生计算指标,最终服务广告的业务保证公司在广告这部分的收益实际上整个来说类似于广告最开始是一个实时密集型的公司领域扮演了这样一个角色。

 

五、总结

实时计算Flink训练营场景与应用-76211396.png

// 回顾整个内容,从最开始讲解的技术原理,从计算的四大分类到批处理流处理的对比,再到流处理的具体特点,最后以天猫双十一例,讲述引申出流计算流处理的业务价值 接下来内容非常关键的三个技术场景,所有的业务场景和行业案例都是基于技术场景做叠加、组合及转化包装的结果。个不带行业属性的业务场景实时数仓实时风控及实时机器学习,是Flink 在各个行业里应用十分多的抽象出来三个场景。 最后行业案例,举了五个行业案例实际上是之前三个业务场景在不同行业实施的最佳实践。然后从每个行业里展示讲述遇到的问题需要实时计算的原因以及实时计算能够解决挑战和困难等,同时利用抽象的架构图讲解实时计算在整个大数据或者实时处理链路在每个行业每个案例里所处的位置。

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
2月前
|
存储 分布式计算 流计算
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
本文介绍了阿里云开源大数据团队在实时计算领域的最新成果——向量化流计算引擎Flash。文章主要内容包括:Apache Flink 成为业界流计算标准、Flash 核心技术解读、性能测试数据以及在阿里巴巴集团的落地效果。Flash 是一款完全兼容 Apache Flink 的新一代流计算引擎,通过向量化技术和 C++ 实现,大幅提升了性能和成本效益。
1460 73
实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎
|
19天前
|
消息中间件 JSON 数据库
探索Flink动态CEP:杭州银行的实战案例
本文由杭州银行大数据工程师唐占峰、欧阳武林撰写,介绍Flink动态CEP的定义、应用场景、技术实现及使用方式。Flink动态CEP是基于Flink的复杂事件处理库,支持在不重启服务的情况下动态更新规则,适应快速变化的业务需求。文章详细阐述了其在反洗钱、反欺诈和实时营销等金融领域的应用,并展示了某金融机构的实际应用案例。通过动态CEP,用户可以实时调整规则,提高系统的灵活性和响应速度,降低维护成本。文中还提供了具体的代码示例和技术细节,帮助读者理解和使用Flink动态CEP。
362 2
探索Flink动态CEP:杭州银行的实战案例
zdl
|
2月前
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
176 56
|
13天前
|
存储 关系型数据库 BI
实时计算UniFlow:Flink+Paimon构建流批一体实时湖仓
实时计算架构中,传统湖仓架构在数据流量管控和应用场景支持上表现良好,但在实际运营中常忽略细节,导致新问题。为解决这些问题,提出了流批一体的实时计算湖仓架构——UniFlow。该架构通过统一的流批计算引擎、存储格式(如Paimon)和Flink CDC工具,简化开发流程,降低成本,并确保数据一致性和实时性。UniFlow还引入了Flink Materialized Table,实现了声明式ETL,优化了调度和执行模式,使用户能灵活调整新鲜度与成本。最终,UniFlow不仅提高了开发和运维效率,还提供了更实时的数据支持,满足业务决策需求。
|
1月前
|
流计算 开发者
【开发者评测】实时计算Flink场景实践和核心功能体验测评获奖名单公布!
【开发者评测】实时计算Flink场景实践和核心功能体验测评获奖名单公布!
|
2月前
|
运维 数据挖掘 网络安全
场景实践 | 基于Flink+Hologres搭建GitHub实时数据分析
基于Flink和Hologres构建的实时数仓方案在数据开发运维体验、成本与收益等方面均表现出色。同时,该产品还具有与其他产品联动组合的可能性,能够为企业提供更全面、更智能的数据处理和分析解决方案。
|
2月前
|
SQL 运维 数据可视化
阿里云实时计算Flink版产品体验测评
阿里云实时计算Flink基于Apache Flink构建,提供一站式实时大数据分析平台,支持端到端亚秒级实时数据分析,适用于实时大屏、实时报表、实时ETL和风控监测等场景,具备高性价比、开发效率、运维管理和企业安全等优势。
|
3月前
|
消息中间件 监控 数据可视化
实时计算Flink场景实践和核心功能体验
本文详细评测了阿里云实时计算Flink版,从产品引导、文档帮助、功能满足度等方面进行了全面分析。产品界面设计友好,文档丰富实用,数据开发和运维体验优秀,具备出色的实时性和动态扩展性。同时,提出了针对业务场景的改进建议,包括功能定制化增强、高级分析功能拓展及可视化功能提升。文章还探讨了产品与阿里云内部产品及第三方工具的联动潜力,展示了其在多云架构和跨平台应用中的广阔前景。
131 9
|
3月前
|
运维 数据可视化 数据处理
实时计算Flink场景实践和核心功能体验 评测
实时计算Flink场景实践和核心功能体验 评测
85 5
|
3月前
|
运维 监控 安全
实时计算Flink场景实践和核心功能体验
实时计算Flink场景实践和核心功能体验