FFA 2021 专场解读 - 行业实践

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 多位技术专家们将围绕业务场景、业务痛点、面临挑战、如何破局等,解读 Flink 在业内的应用与落地。

图片

GitHub 地址
https://github.com/apache/flink
欢迎大家给 Flink 点赞送 star~

12 月 4-5 日,北京国家会议中心,Flink Forward Asia 2021 重磅开启,全球 40+ 多行业一线厂商,80+ 干货议题,带来专属于开发者的技术盛宴。

其中,行业实践专场由字节跳动、网易、蔚来、中原银行、建信金融科技、中信建投等多行业实时计算领域专家详细解读 Flink 在业内的应用与落地,围绕业务场景、业务痛点、面临挑战、如何破局等宝贵实践经验倾囊相授。

点击链接了解完整大会议程:

https://Flink-forward.org.cn/

图片

中原银行实时风控体系建设实践

陈玉强|中原银行数据平台中心开发工程师

本次演讲将分享中原银行在实时风控领域中自主化探索与实践,包括以下方面:

  1. 介绍风控发展方向;
  2. 实时数据处理技术选型 - Flink;
  3. 整体技术架构:Flink + 智策 + 天机 + 数据服务的技术融合方案;
  4. 实施场景 1:申请与交易反欺诈;
  5. 实施场景 2:授信审批场景;
  6. 实时风控体系建设成效;
  7. 业务效果。

Flink 在国有大型银行智能运营场景下的应用

周耀|建信金融科技开发工程师,Apache Superset Contributor,Apache Kylin Contributor

现代的应用大都以前后端分离的模式开发,在建设银行新一代系统中每笔交易对应三条消息:前端的埋点信息,发送的 HTTP 请求,返回的 HTTP 响应。建设银行在全球有大量的网点和业务员,每天产生大量的金融业务交易,包含海量的消息报文,其中包含:运营配送,现金配送,信用卡审批等几百种应用场景。

而金融业务以复杂,稳定,要求高为特性,在银行业尤其如此。本次 proposal 将根据集约化运营团队使用流计算框架 Flink 的经验,围绕如何引入有状态流计算稳定,及时,高效的将埋点,请求,响应三条消息进行业务加工,合并,向后传递给应用消费,最终产生业务价值。向大家展示流计算架构在银行运营大数据中的演化过程,应对方案,及走过的弯路。希望能对金融企业使用流计算提供参考和借鉴。

Flink 流处理在中信建投证券的实践与应用

刘成龙|中信建投证券金融实时数仓项目负责人,大数据研发工程师

蔡跃|中信建投证券金融资讯数据研发工程师

  1. 证券行业实时计算意义;
  2. 实时流处理平台整体建设方案。元数据管理、数据采集、数据实时开发、数据网关、数据运营;
  3. 现阶段应用场景介绍。助力基金投顾、实时零售业务;实时交易流水、资讯数据查询;内部链路实时 ETL;
  4. 场景:金融资讯数据多源实时校验。针对金融业内特有且普遍遇到的多来源资讯数据缺乏一致性校验问题,介绍中信建投实时校验解决方案;
  5. 基于 Hologres 的流批一体实践。

Flink 在众安保险金融业务的应用

郭育波|众安保险大数据平台开发高级专家

随着众安金融业务的快速发展,Flink 在金融业务中得到了广泛的使用。这次我主要介绍下我们团队服务的两个业务场景,智能营销和智能风控。

  1. 在营销场景中,我们使用 Flink SQL 实现了实时数仓,支撑了各类的实时标签,实时大盘,实时报表的业务场景。使用 Flink 提供实时标签和实时客群的能力,使用 Hologres 作为离线标签的存储加速引擎,实现了快速的用户分群的能力,结合 AB 实验室和智能触达实现了用户的精准化营销,同时还使用流量 AB 实验实现了千人千面的动态客群功能。最后也是使用 Flink 提供了实时的实验效果分析的能力,赋能精准和快速的营销策略。
  2. 众安金融的风控体系有风控反欺诈、风控决策引擎、风控特征工程,征信数据中心等平台组成,总所周知,金融风控的能力决定了公司的盈利水平,而风控的能力依赖于数据的能力,特征工程为风控的决策提供了核心的数据支撑,我们的特征工程提供三方数据特征,信贷数据特征,征信数据特征,反欺诈数据特征,再这些基础特征之上还有机器学习模型特征,居于用户全方位的数据为风控提供决策依据。我们使用 Flink 的实时计算能力和 Hbase 的高速查询能力满足了风控对于数据的实时性,准确性,稳定性的要求,也取得了很好的业务效果,通过 Flink 的实时计算能力保证了特征的实时性和稳定性,之后为了我们把 Hbase 升级为了阿里云的 Tablestore,减少了 Hbase 运维的风险,进一步提高了稳定性。
  3. 最近我们结合 Flink 和 Nebula Graph 实现了实时关系图谱,通过 Flink 接入用户的各种数据构建用户数据关系图谱,建立了用户,联系人,手机,设备指纹的用户关系图谱网络,居于图数据计算的相邻边关系、社群发现算法加工出了相关的数据特征,为金融反欺诈提供了实时的数据支持。

Flink 在能源建设的实践

姚远|中南电力设计院工程师、注册测绘师

全文从三个方面进行介绍:建设背景,实现落地以及未来规划。

建设背景: EPC 项目建设的电厂,变电站等工地的传感器,人员数据等不断累计,希望分析安全隐患,预防事故发生。在矿山资源开采过程中,希望结合车辆定位,过磅等数据优化运营分析,提高开采及运输效率。基于以上场景,考虑到数据量及分析的需求,决定采用大数据的方案进行处理。作为非互联网的传统工业企业,没有大数据积累,分析对比之后选择 Flink 作为大数据处理平台。

实施落地:

  • 例 1,在公司的矿山开采过程中,如何合理设置矿山的磅站位置,每天到场多少辆车进行运输合适,结合车辆定位和磅站数据进行实时分析,监督矿石的开采运输及现场实际情况的维护,保证开采、运输及过站正常运作。
  • 例 2,电厂现场安置在线监测设备,包括倾角、光纤光栅、GPS 等传感器,利用监测设备对现场变形情况进行监测,防患安全事故发生。

未来规划: 建立整体分析模型,对工地实时数据进行处理;将 GPS 解算过程在 Flink 流上重写,提高反应时间。针对历史数据,挖掘分析价值。

Apache Flink 在蔚来汽车的应用

吴江|蔚来汽车大数据部门数据开发,OLAP 平台 tech lead

  1. 流式计算在蔚来的发展。最开始基于 Spark Streaming 做一些简单的实时处理 -> 开始引入 Flink -> 采用命令行式的 Flink 任务部署和管理 -> 开发实时数据开发平台 1.0 版本 (支持基于 Flink jar 的任务提交与管理) -> 正在开发实时数据开发平台 2.0 版本 (在 1.0 的基础上,增加 Flink SQL 以及 UDF 管理,并且支持 kerberos 认证等);
  2. Flink 的具体应用场景

    • 实时数仓及 OLAP 平台:目前我们构建实时数仓还处在比较初始的阶段,正在逐步构建过程中。我们已经在一些项目比如 nio app 的埋点分析中,对流式的数据做了分层,来逐渐沉淀经常使用的公共数据,增加数据的复用。实时数仓还要提供 OLAP 的能力,为了充分发挥实时的能力,会将 Flink 和 Doris 结合,从而能够提供更加灵活完善的平台化的 OLAP 能力;
    • 电池安全:由于蔚来的可换电模式,电池数量是大于车的数量,电池状态数据的实时获取/处理,对电池安全至关重要。这块主要讲 Flink 怎么助力提升电池安全;
    • 实时看板:看板展示包括实时和离线数据,主要统计和展示用户相关的触点和行为信息。实时和离线数据底层统一用 Apache Doris 进行数据摄入/存储和查询。其中各种实时指标还会直接推给前端,对于复杂的实时指标计算 (比如前端动态选择计算多个城市下的实时 UV),采取了一种新颖的解决方案,会以 Flink 计算引擎为核心驱动,结合前端一起参与计算,实现从端到端 (Kafka -> Flink -> 前端) 的全链路流式计算;
    • cdp (客户数据平台):

      • 用户画像 & 圈人:依托 Flink 的实时计算和处理,以及 Apache Doris 的实时摄入和快速查询的能力,提供用户标签/用户分群数据的实时获取能力;
      • 运营平台:运营平台对选定的人群发送 IM 消息,短信,发放积分卡券等,对于系统的可靠性和数据一致性要求很高 (发送消息要尽量做到不丢不重)。在这个典型的属于后台服务的场景下,Flink 依旧发挥了至关重要的作用。由于发送 im 消息和短信,本身不具备 rollback 能力,我们参照传统的两阶段提交协议,设计了特殊的分布式事务恢复机制,利用 Flink 实时回放 redo log,保证各个 task 之间的状态最终一致性;
    • 跨业务系统数据实时聚合:连接,打通,和汇聚不同业务的数据;
    • 实时监控和告警:利用训练好的机器学习模型,实时提供指标的异常检测和告警。
  3. 未来的计划。继续平台化建设,对于问题解决的方案,回馈社区。

Flink 在字节跳动数据流的实践

刘石伟|字节跳动数据平台数据流技术负责人

数据流是字节跳动所有流量数据的入口,承担着流量数据的接入、ETL、分发、治理等重要职责。Flink 作为当下最流行的流式计算框架被广泛应用于数据流的各个环节,本次分享将介绍字节跳动数据流在 Flink 应用实践中遇到的挑战以及相关优化。

  1. 业务场景和遇到的问题

    • 整体架构;
    • 遇到的挑战 / 问题;
    • 流量大,下游多,稳定性要求高;
    • 业务变化快,业务逻辑修改频率高;
    • 部分场景要求更低的端到端延时;
    • 批流两套处理链路。
  2. 基于动态规则的 Flink ETL

    • 推荐场景;
    • ETL 分流场景。
  3. 数据治理 & SLA 指标建设

    • 稳定性治理;
    • 拆分任务;
    • 链路分级,埋点管控;
    • 数据延迟/丢失率/重复率 SLA 指标。
  4. 未来展望

    • 流批一体;
    • 规则引擎性能优化。

网易游戏基于 Flink 的支付环境全关联分析实践

林佳|网易互娱技术中心计费实时平台与 SDK 技术负责人,Apache Flink Contributor

本次演讲将介绍网易游戏技术中心使用 Flink 的历程、分享使用现状与实践经验。以技术中心的核心业务 “计费支付” 为实例,讨论如何基于 Flink 这一高效可靠的引擎,通过 SDK 化加平台化的模块式封装,实现出异构数据聚合分析、微观支付链路串联跟踪、用户指标湖等实时数据服务,全方位关联起整个支付环境上的实时数据,进而迅速发现支付环境中的风险与机遇、指导优化方向、提升支付环境的服务质量,并挖掘出前所未有的高时效性数据价值。

Apache Flink 在斗鱼的应用与实践

夏畅|斗鱼实时计算负责人

  1. 公司背景介绍;
  2. 实时场景分析;
  3. 实时平台化建设

    • 整体架构设计;
    • 作业引擎实现;
    • HIVE 元数据 & UDF 注入;
    • 实时调试;
    • SLA 保障;
    • 实时元数据 & 全链路血缘;
  4. 实时数仓探索。

特来电云平台智能运维应用实践

刘桂海|特来电平台智能保障团队技术负责人

  1. 特来电云平台简介:新能源充电行业海量高并发互联网网技术架构;
  2. 特来电云平台智能运维简介:基于 AIOps 的智能监控、智能分析、智能控制;
  3. Flink 在特来电云平台智能运维的应用场景

    • 指标分析:基于 Flink 的海量高并发的监控引擎;
    • 链路分析:基于 Flink 及图数据库的服务链路调用知识图谱、用户行为分析知识图谱;
    • 日志分析:基于 Flink 及自然语言处理的异常信息聚类分析、异常日志突变分析;
  4. Flink 在特来电云平台智能运维的未来计划:机器学习迁移到 Alink、基于 K8s 运行 Flink。

作业帮基于 Flink 的实时计算平台实践

张迎|作业帮实时计算平台负责人

  1. 业务背景;
  2. 发展历程;
  3. 解决方案;
  4. 总结展望。

Flink 在易车落地应用与实践

王林红|易车数据平台负责人

Flink 在易车实时数仓、实时数据集成、湖仓一体等方面有很广泛的应用实践,尤其是满足实时大屏、实时流量分析及实时大促等应用场景。

本次分享主要介绍 Flink 在易车相关应用的落地实践及经验分享

  1. Flink 实时计算平台建设:数据集成、元数据管理、数据血缘、数据实时开发、监控优化等;
  2. Flink 在实时数仓、批流一体方面的应用实践;
  3. Flink + Hudi 应用实践。

如何设计信息安全领域的实时安全基线引擎

覃永靖|奇安信集团技术委员会委员、高级技术专家、NGSOC 事业部安全引擎团队架构师

在互联网时代,安全已经成为企业的命脉。奇安信集团作为国内网络安全领军企业,需要与业界同步,使用各种先进技术来保障客户业务安全。 本演讲主要介绍了奇安信集团在打造自研的基于 Flink 的实时安全分析引擎 Sabre 的过程中,对于安全基线的设计和实现过程中遇到的挑战以及对应的解决方案,并分享了很多踩过的坑,同时还有一些思考和总结。希望对从事安全领域相关工作的同学能够有所启发或者帮助。 内容包括:

  1. 什么是安全基线,介绍安全基线中基于特征和基于行为的两种检测模型,介绍相关安全场景,以及安全领域的四个主要约束,异常检测,受限的资源状态,实时分析和非实时的区别,快速响应的必要性;
  2. 实时框架的选择,为何采用 Flink 框架而不是 Spark 框架;
  3. 实时安全基线的设计和实现。

以上为 Flink Forward Asia 2021 行业实践专场内容节选,了解更多大会详情可点击下方链接:

https://Flink-forward.org.cn/

Flink Forward Asia 2021 赞助与合作

图片


首届 Flink Forward Asia Hackathon 正式启动,10W 奖金等你来!

欢迎进入赛事官网了解详情:

https://www.aliyun.com/page-source//tianchi/promotion/FlinkForwardAsiaHackathon

图片

更多 Flink 相关技术问题,可扫码加入社区钉钉交流群
第一时间获取最新技术文章和社区动态,请关注公众号~

image.png

活动推荐

阿里云基于 Apache Flink 构建的企业级产品-实时计算Flink版现开启活动:
99 元试用 实时计算Flink版(包年包月、10CU)即有机会获得 Flink 独家定制卫衣;另包 3 个月及以上还有 85 折优惠!
了解活动详情:https://www.aliyun.com/product/bigdata/sc

image.png

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
2月前
|
人工智能 Cloud Native 云栖大会
揭秘最全议程!2024云栖大会「云原生+AI」有哪些看点?
2024云栖大会「云原生+AI」有哪些看点?
|
11月前
|
SQL 存储 OLAP
FFA 2023 「核心技术」专场: Flink 核心技术动向深度解读
完整议程已公开,期待 12 月 8-9 日与你 Flink Forward Asia 2023 相会!
442 0
FFA 2023 「核心技术」专场: Flink 核心技术动向深度解读
|
前端开发
阿里云技术团队亮相 KubeCon China 2023,一键收藏大会亮点
阿里云技术团队亮相 KubeCon China 2023,一键收藏大会亮点
阿里云技术团队亮相 KubeCon China 2023,一键收藏大会亮点
|
运维 监控 网络协议
2022云栖精选—新华三IPv6创新及实践
朱仕银 新华三技术战略部技术总监
604 1
2022云栖精选—新华三IPv6创新及实践
|
运维 Cloud Native 中间件
云原生实战峰会线上举办!亮点抢先看↓
2022年12月28日,一起探讨如何共同加速迈入数字时代,共同解码阿里云重磅云原生发布
云原生实战峰会线上举办!亮点抢先看↓
|
SQL Kubernetes 供应链
FFA 2022 专场解读 - 行业案例 & 生产实践
Flink Forward Asia 2022 行业案例专场 & 生产实践专场内容节选
FFA 2022 专场解读 - 行业案例 & 生产实践
|
存储 Kubernetes 监控
KubeCon China 2021 阿里云专场来了!这些首日亮点不容错过
2021 年 12 月 9 日-10日,阿里云携 10+ 技术专家正式亮相年度顶级云原生开源技术峰会 KubeCon + CloudNativeCon + Open Source Summit China 2021,并带来阿里云云原生专场,不仅汇聚行业发展方向的精彩主题演讲,在云基础设施、可观察性、存储、定制和扩展 Kubernetes、性能、服务网格、无服务器、容器运行时、CI/CD、网络等云原生与开源技术等各大专题中,从阿里云真实业务场景中走出来的云原生技术最佳实践也将一一呈现。
374 4
KubeCon China 2021 阿里云专场来了!这些首日亮点不容错过
|
存储 SQL 弹性计算
行业先锋畅聊 Flink 未来 —— FFA 2021 圆桌会议(北京)
Flink Forward Asia 2021 圆桌会议 (北京) 内容整理
行业先锋畅聊 Flink 未来 —— FFA 2021 圆桌会议(北京)
|
SQL Kubernetes 监控
FFA 2021 专场解读 - 平台建设
多位技术专家分享基于 Apache Flink 的实时计算平台演进与实践。
FFA 2021 专场解读 - 平台建设
|
数据安全/隐私保护
阿里云ACE × 企业IT治理沙龙 上海站
2021年9月15日,面向互联网行业客户的企业IT治理实战沙龙将在上海西岸智塔举办。阿里集团结合多年业务实践经验,向各位来宾分享阿里的合规之道,从企业治理、流程制度、培训体系、技术方案等多个维度分享如何应对国内外数据安全与隐私合规的重大挑战。
637 0
阿里云ACE × 企业IT治理沙龙 上海站