从0-1构建全民直播大数据平台和实时护航

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
日志服务 SLS,月写入数据量 50GB 1个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 在2018年云栖大会·上海峰会的阿里云支持与服务专场中,全民直播大数据架构师朱益为我们带来从0-1构建全民直播大数据平台和实时护航方面的实战经验。通过分析当前直播平台面临的挑战来详细的讲解大数据平台的构建,以及数据体系在平台上的运营状况,提出数字化推动企业不断发展前进。

在2018年云栖大会·上海峰会的阿里云支持与服务专场中,全民直播大数据架构师朱益为我们带来从0-1构建全民直播大数据平台和实时护航方面的实战经验。通过分析当前直播平台面临的挑战来详细的讲解大数据平台的构建,以及数据体系在平台上的运营状况,提出数字化推动企业不断发展前进。
数十款阿里云产品限时折扣中,赶快点击这里,领劵开始云上实践吧!
直播视频回顾
PPT下载请点击
以下为精彩视频内容整理:

技术挑战

全民直播是一家多元化的直播平台,自2015年12月底上线。主要业务有游戏直播和秀场直播。直播对于实时性有着很高的要求,同时由于直播的互动性很强的原因,所以对于平台的稳定性视频流的流畅度就都有着很高的要求。

系统监控、问题定位、性能优化

为了保障平台的稳定性,我们做了全方位的系统监控,需要做到异常报警和流量预警。但是平台的扩大也带来很多问题,所以我们需要及时响应并且快速定位问题。同时在研发方面还有各种性能优化方面的需求,如终端优化视频优化等。

运营需求

除了技术挑战外在运营方面我们也有一定的需求,如用户运营、主播价值、市场营销、内容推荐、平台营收等。主播价值在运营需求中起到了很大的作用,因为对于一个主播价值的正确评估直接影响到平台的直接收益。

解决方案

以前由Mysql+Web或ELK来解决,但是随着数据量的增加,过去的解决方案明显力不从心,所以共同构建大数据平台刻不容缓。

面临困难

面对的困难有很多,时间紧迫、人员不足、经验不足、经费有限。那么面对工具繁多,我们如何选型海量数据。面对成本紧张,我们如何保证稳定,如何保证数据安全?

借助阿里云构建大数据平台

使用阿里云构建大数据平台主要有以下优势:
·运维成本低:几乎零运维成本,同时支撑海量数据。
·使用门槛低:非研发人员也能独立完成数据报表需求。
·系统稳定:几乎无故障,工作人员响应很及时。
·高安全性:在大数据中心处可以做表级权限管理。
·非常灵活:云服务非常灵活,组件即开即用,用最少的资源去试错。

全民大数据架构

这是一个数据链路,包括数据源、数据采集、经过数据计算加工、存储,最后交给数据应用。大量的用户行为投递到采集服务器,保存到本地后通过阿里云日志服务的logtail的组建支持到阿里云的日志服务。

image001

收集到日志服务后,再投递到计算中心板块。我们也应用了流计算来做了一些实时的日志监控。还有一些数据源也会被直接抽取到计算中心,抽取方式也简单易行。
下面将对一些模块进行详细的介绍:

数据采集

首先是日志规范,要遵循规范先行,如果规范定义的不好或不当时,会对后续的数据应用与数据报表有很大的影响。对于打点,打点要打的全、打的准。为此我们定义了大框架来保证打点信息。埋点的信息包括用户信息,产品的用户号,手机的设备号、IP还有一些公共用户信息的字段。事件的编号、发生时间以及载体。比如按钮所在位置等。
接收服务器采用Golang、单机QPS 2W+。逻辑非常简单,只需要接收请求并且保存到本地文件。我们提供了适当合并请求,支持protobuf,gzip压缩等来提高传输的性能。如果终端断网时可以暂存本地,等待离线上传。
实时采集使用的是日志服务的Logtail ,相比 Filebeats、Flume等开源工具,具有性能更优高效稳定,资源占用少,几乎不会影响线上服务,因为其做了资源保护功能。另一个特点是配置简单,支持JSON、正则等多种模式,部署方便,立即生效。
实时查询迅速定位用户行为轨迹,日志服务提供海量日志分析能力,可进行业务监控。日志服务的优点有,不需要考虑容量问题,也不需要考虑查询性能问题。对我们来说做到了省事省心。
最后我们将数据投递到日志中心,投递到 MaxCompute 供离线计算,StreamCompute可以直连日志服务,以监控业务,对直播视频实时护航。日志采集后整体的平台体系已经搭建成功,下面要做的就是直播阶段的工作。

直播视频实时护航

视频流是直播平台的核心服务,视频流的稳定性直接影响到用户体验,继而影响平台收益。

监控、定位、解决、总结

举例说明一下,比如之前在技术不成熟的时候,大卓在户外直播时突然出现黑屏问题,这是一个影响主播与用户等多方面的一个问题,但是由于当时日志采集不够,于是我们做了全链路实时监控,视频由推流端到分发网络再到播放端。除了打点信息外,我们还对直播间的弹幕信息做了监控。因为弹幕信息与视频信息所走链路不同,这样可以从另外的侧面来监控视频信息。可以通过弹幕信息来了解直播时用户端是否卡顿。基于这套监控,我们应用阿里的流计算实时的计算一些关键指标,对于问题我们可以报警到钉钉群。同时,一些厂商也会把问题报警到钉钉群。钉钉群里面相应的同学就会响应来解决这些问题。通常的解决方案可以分为切换节点和切换线路两种。最后我们也会做完善监控、完善流程等措施。阿里云的CDN同学为直播室的实时护航做了很多事情。

数据体系

日志采集之后我们将其投递到数据中心,MaxCompute 提供一站式数据仓库解决方案,完成我们对数据的清洗、加工与整合计算,然后把数据给分析组同学使用。MaxCompute提供数据集成功能,可以通过DataX 结合 tunnel 简化数据同步。提供权限管理功能,通过ACL和角色管理,实现数据隔离。提供数据清洗功能,使用HiveQL、Shell、PyOdps等进行数据清洗。提供完善任务调度功能,可以设置周期时间,可以定义依赖关系。

元数据管理

对于大数据平台来说,元数据管理非常重要,DataWorks 数据管理提供完整的元数据信息,这个元数据信息只能在浏览器上面看,通过爬取数据,完善元数据管理。使用开放接口获取表结构信息和爬取 DataIDE 接口获取任务元数据。

数据分析挖掘

阿里云兼容Hive2.0,使用时非常方便、查询效率高。支持Python直连、支持R直连、支持更多开源工具。

数据报表

使用商业Bi工具、开源数据分析工具、开源报表工具。

image003

以上是完整的大数据平台搭建体系,基于这个平台,我们实现了精细化运营,针对用户分群、主播挖掘、内容推荐等方面进行运营。搭建这个平台可以使企业更加专注于业务,用数字驱动整个企业不断地发展前进。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
传感器 人工智能 大数据
高科技生命体征探测器、情绪感受器以及传感器背后的大数据平台在健康监测、生命体征检测领域的设想与系统构建
本系统由健康传感器、大数据云平台和脑机接口设备组成。传感器内置生命体征感应器、全球无线定位、人脸识别摄像头等,搜集超出现有科学认知的生命体征信息。云平台整合大数据、云计算与AI,处理并传输数据至接收者大脑芯片,实现实时健康监测。脑机接口设备通过先进通讯技术,实现对健康信息的实时感知与反馈,确保身份验证与数据安全。
|
1月前
|
SQL 存储 HIVE
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
本文整理自鹰角网络大数据开发工程师朱正军在Flink Forward Asia 2024上的分享,主要涵盖四个方面:鹰角数据平台架构、数据湖选型、湖仓一体建设及未来展望。文章详细介绍了鹰角如何构建基于Paimon的数据湖,解决了Hudi入湖的痛点,并通过Trino引擎和Ranger权限管理实现高效的数据查询与管控。此外,还探讨了湖仓一体平台的落地效果及未来技术发展方向,包括Trino与Paimon的集成增强、StarRocks的应用以及Paimon全面替换Hive的计划。
170 1
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
|
2月前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
18天前
|
SQL 存储 HIVE
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
|
19天前
|
存储 分布式计算 大数据
基于阿里云大数据平台的实时数据湖构建与数据分析实战
在大数据时代,数据湖作为集中存储和处理海量数据的架构,成为企业数据管理的核心。阿里云提供包括MaxCompute、DataWorks、E-MapReduce等在内的完整大数据平台,支持从数据采集、存储、处理到分析的全流程。本文通过电商平台案例,展示如何基于阿里云构建实时数据湖,实现数据价值挖掘。平台优势包括全托管服务、高扩展性、丰富的生态集成和强大的数据分析工具。
|
5月前
|
消息中间件 分布式计算 大数据
大数据-166 Apache Kylin Cube 流式构建 整体流程详细记录
大数据-166 Apache Kylin Cube 流式构建 整体流程详细记录
130 5
|
5月前
|
存储 SQL 分布式计算
大数据-162 Apache Kylin 全量增量Cube的构建 Segment 超详细记录 多图
大数据-162 Apache Kylin 全量增量Cube的构建 Segment 超详细记录 多图
108 3
|
1月前
|
存储 分布式计算 物联网
美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台
美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台,实现了数据与 AI 技术的有效融合,解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台,最终实现不同场景下整体性能提升50%以上,同时综合成本下降30%。
|
3月前
|
人工智能 分布式计算 数据处理
MaxCompute Data + AI:构建 Data + AI 的一体化数智融合
本次分享将分为四个部分讲解:第一部分探讨AI时代数据开发范式的演变,特别是MaxCompute自研大数据平台在客户工作负载和任务类型变化下的影响。第二部分介绍MaxCompute在资源大数据平台上构建的Data + AI核心能力,提供一站式开发体验和流程。第三部分展示MaxCompute Data + AI的一站式开发体验,涵盖多模态数据管理、交互式开发环境及模型训练与部署。第四部分分享成功落地的客户案例及其收益,包括互联网公司和大模型训练客户的实践,展示了MaxFrame带来的显著性能提升和开发效率改进。
|
5月前
|
Java 大数据 数据库连接
大数据-163 Apache Kylin 全量增量Cube的构建 手动触发合并 JDBC 操作 Scala
大数据-163 Apache Kylin 全量增量Cube的构建 手动触发合并 JDBC 操作 Scala
84 2
大数据-163 Apache Kylin 全量增量Cube的构建 手动触发合并 JDBC 操作 Scala

热门文章

最新文章