云栖大会在线用户行为分析场分享:海量流式视频日志收集

本文涉及的产品
对象存储 OSS,20GB 3个月
云备份 Cloud Backup,100GB 3个月
文件存储 NAS,50GB 3个月
简介: 本文介绍了不同平台、不同格式的日志采集、处理面临的挑战,详细介绍了阿里云日志服务的Loghub功能以及其丰富的上下游生态。

本文PPT由2017年云栖大会TI 在线用户行为分析专场阿里云北洲分享的《海量流式视频日志收集》整理而成。
p1

在视频直播场景中,使用日志服务的目的是为了能够对当前直播的服务质量进行监控,比如受当前卡顿影响的人数、在线用户数量的变化趋势等。

为了能拿到服务质量,我们需要收集多种维度的日志数据,在介绍日志服务之前,先来了解下日志采集使用上的一些痛点。

  • 日志产生渠道非常多,怎么用一种统一的方式将这些日志快速的收集上来,并进行结构化,方便后续的分析处理,这里的挑战可以说非常之大。
  • 运维方面的困难。业务越来越复杂,怎么将新增加的模块上的日志采集上来,另外,我们希望采集软件能够自升级,并且升级过程中,用户的日志数据不会丢。
  • 我们往往在系统发生故障时,才想起来看日志调查问题,其实日志系统能做的事情远不止这些。

p2
为了解决这些痛点,阿里云推出了日志服务。
日志服务是针对实时日志的一站式全托管服务,主要包括三方面功能。

  • LogHub,也就是日志数据的采集、存储、和消费。
  • LogShipper,主要是将存储在日志服务中的数据投递到下游数仓,包括OSS、MaxCompute、TableStore等,方便对数据进行离线分析。
  • LogSearch和LogAnalysis功能。主要对日志进行全文检索和进行一些实时的统计分析。

接下来我们重点讲解LogHub功能。
p3
LugHub的功能分成两块:

  1. 数据采集,对不同平台、不同类型的日志都提供了便捷、易于扩展的接入方式
  2. 对接多种数据消费系统。
  • 开源层面,我们对接了Flink、Spark Streaming、Storm等主流的流计算引擎。
  • 阿里云这边我们对接了StreamCompute、AliMonitor、ARMS、EMR、JStorm等。
  • 提供了多种语言的高级消费库,这个库屏蔽了日志服务的实现细节,使得用户只需要专注于开发自身业务逻辑。
  • 对接了一些第三方的日志分析工具,比如Splunk、ElasticSearch。

p4
最后我们来看下直播场景中日志系统的架构。
直播系统中有许多设备端,包括摄像头、浏览器、移动端,这些设备端通过流媒体协议RTMP和服务端通信,这里的服务端是搭建在ECS上的。
服务端会周期性的将流媒体的码率、音视频时间戳、卡顿情况记录到本地的日志文件中,通过这个日志我们可以分析出当前直播线路的状况以及在线用户数量等,我们希望将这个文件日志收集到日志服务中。
另外设备端有一些用户行为日志,比如用户开播、进入房间、离开房间等,我们也希望能收集到日志服务中。
使用日志服务收集这两块日志非常简单。
对于服务端的日志,只需要在ECS上安装我们提供的日志采集工具Logtail。对于设备端的日志,使用我们提供的JS库WebTracking直接就可以收集到日志服务中。后面如果服务端要扩容,只需要在新扩的ECS上安装Logtail。数据收集到日志服务中之后,后续可以使用StreamCompute和DataV进行分析展示。
可以说今天Loghub的生态已经非常完善了,我们可以做到让您在5min内将日志从0接入,并且在使用时没有任何运维代价。另外,不管您一天的日志量时1MB还是1PB,也不管您的应用是在杭州还是在美国,都可以快速接入日志服务。最后,我们承诺日志服务一年的故障时间在4个小时以内,也就是99.95%的可用性,使用成本是您使用开源软件自建的15%左右。

参考资料

  1. 日志服务
  2. 日志服务采集方式
  3. WebTracking采集方式
  4. 多实例协同消费库(Consumer Library)
  5. 使用日志服务对接下游消费系统
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1月前
|
JavaScript Java 测试技术
基于ssm+vue.js+uniapp小程序的公司员工工作日志办公系统附带文章和源代码部署视频讲解等
基于ssm+vue.js+uniapp小程序的公司员工工作日志办公系统附带文章和源代码部署视频讲解等
19 0
|
8月前
|
安全 物联网 云栖大会
2023云栖大会 | 云网络技术Session主题资料和视频回放归档(已完结)
2023年10月31日,杭州,一年一度的云栖大会如期而至;阿里云飞天洛神云网络作为阿里云计算的连接底座,是飞天云操作系统的核心组件,致力于为上云企业提供高可靠、高性能、高弹性、智能的连接服务。本次云栖,云网络产品线也带来全系列产品升级,以及创新技术重磅解读,共包括1个Keynote,22个Session,包括产品发布、Deep Dive、最佳实践、客户分享、开放生态等多维度全面解读云网络进展。
1865 7
|
2月前
|
存储 消息中间件 监控
Zoom 基于Apache Hudi 的流式日志处理实践
Zoom 基于Apache Hudi 的流式日志处理实践
57 1
|
消息中间件 数据采集 搜索推荐
「视频小课堂」ELK和Kafka是怎么就玩在一起成了日志采集解决方案文字版
「视频小课堂」ELK和Kafka是怎么就玩在一起成了日志采集解决方案文字版
|
达摩院 云栖大会
云栖大会宣导视频
阿里巴巴达摩院XR LAB负责人谭平老师对云栖大会的宣导视频
281 0
云栖大会宣导视频
|
机器学习/深度学习 人工智能 Cloud Native
|
人工智能 大数据 关系型数据库
2017杭州云栖大会100位大咖视频+讲义全分享
“如果我看得更远一点的话,是因为我站在巨人的肩膀上。”2017杭州云栖大会资料全部整理完毕,首批100位大咖视频+讲义分享给大家。
69299 0
|
新零售 Web App开发 存储
重磅发布: 阿里云WAF日志实时分析上线 (含视频)
阿里云WAF与日志服务打通,对外开发Web访问与攻击日志。提供近实时的网站具体的日志自动采集存储、并提供基于日志服务的查询分析、报表报警、下游计算对接与投递的能力。
3379 0
2018杭州云栖大会Workshop:基于日志的安全分析实战
2018年9月杭州云栖大会Workshop - 基于日志的高级分析实战:介绍背景、场景和步骤等
3024 0
|
云栖大会 开发者
【不断更新】2018杭州云栖大会!视频美图赏析
今年,云栖社区还是负责大会的4天直播,并在9月20日E-1-4会议室举办《开发者专场(上/下)——全领域技术人员进阶》,以及在阿里云展位会有开发者社区的读书活动,欢迎开发者小伙伴们来玩。
8393 0

相关产品

  • 日志服务