云栖大会在线用户行为分析场分享:海量流式视频日志收集

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
对象存储 OSS,恶意文件检测 1000次 1年
简介: 本文介绍了不同平台、不同格式的日志采集、处理面临的挑战,详细介绍了阿里云日志服务的Loghub功能以及其丰富的上下游生态。

本文PPT由2017年云栖大会TI 在线用户行为分析专场阿里云北洲分享的《海量流式视频日志收集》整理而成。
p1

在视频直播场景中,使用日志服务的目的是为了能够对当前直播的服务质量进行监控,比如受当前卡顿影响的人数、在线用户数量的变化趋势等。

为了能拿到服务质量,我们需要收集多种维度的日志数据,在介绍日志服务之前,先来了解下日志采集使用上的一些痛点。

  • 日志产生渠道非常多,怎么用一种统一的方式将这些日志快速的收集上来,并进行结构化,方便后续的分析处理,这里的挑战可以说非常之大。
  • 运维方面的困难。业务越来越复杂,怎么将新增加的模块上的日志采集上来,另外,我们希望采集软件能够自升级,并且升级过程中,用户的日志数据不会丢。
  • 我们往往在系统发生故障时,才想起来看日志调查问题,其实日志系统能做的事情远不止这些。

p2
为了解决这些痛点,阿里云推出了日志服务。
日志服务是针对实时日志的一站式全托管服务,主要包括三方面功能。

  • LogHub,也就是日志数据的采集、存储、和消费。
  • LogShipper,主要是将存储在日志服务中的数据投递到下游数仓,包括OSS、MaxCompute、TableStore等,方便对数据进行离线分析。
  • LogSearch和LogAnalysis功能。主要对日志进行全文检索和进行一些实时的统计分析。

接下来我们重点讲解LogHub功能。
p3
LugHub的功能分成两块:

  1. 数据采集,对不同平台、不同类型的日志都提供了便捷、易于扩展的接入方式
  2. 对接多种数据消费系统。
  • 开源层面,我们对接了Flink、Spark Streaming、Storm等主流的流计算引擎。
  • 阿里云这边我们对接了StreamCompute、AliMonitor、ARMS、EMR、JStorm等。
  • 提供了多种语言的高级消费库,这个库屏蔽了日志服务的实现细节,使得用户只需要专注于开发自身业务逻辑。
  • 对接了一些第三方的日志分析工具,比如Splunk、ElasticSearch。

p4
最后我们来看下直播场景中日志系统的架构。
直播系统中有许多设备端,包括摄像头、浏览器、移动端,这些设备端通过流媒体协议RTMP和服务端通信,这里的服务端是搭建在ECS上的。
服务端会周期性的将流媒体的码率、音视频时间戳、卡顿情况记录到本地的日志文件中,通过这个日志我们可以分析出当前直播线路的状况以及在线用户数量等,我们希望将这个文件日志收集到日志服务中。
另外设备端有一些用户行为日志,比如用户开播、进入房间、离开房间等,我们也希望能收集到日志服务中。
使用日志服务收集这两块日志非常简单。
对于服务端的日志,只需要在ECS上安装我们提供的日志采集工具Logtail。对于设备端的日志,使用我们提供的JS库WebTracking直接就可以收集到日志服务中。后面如果服务端要扩容,只需要在新扩的ECS上安装Logtail。数据收集到日志服务中之后,后续可以使用StreamCompute和DataV进行分析展示。
可以说今天Loghub的生态已经非常完善了,我们可以做到让您在5min内将日志从0接入,并且在使用时没有任何运维代价。另外,不管您一天的日志量时1MB还是1PB,也不管您的应用是在杭州还是在美国,都可以快速接入日志服务。最后,我们承诺日志服务一年的故障时间在4个小时以内,也就是99.95%的可用性,使用成本是您使用开源软件自建的15%左右。

参考资料

  1. 日志服务
  2. 日志服务采集方式
  3. WebTracking采集方式
  4. 多实例协同消费库(Consumer Library)
  5. 使用日志服务对接下游消费系统
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1月前
|
监控 数据挖掘 数据安全/隐私保护
Python脚本:自动化下载视频的日志记录
Python脚本:自动化下载视频的日志记录
|
安全 物联网 云栖大会
2023云栖大会 | 云网络技术Session主题资料和视频回放归档(已完结)
2023年10月31日,杭州,一年一度的云栖大会如期而至;阿里云飞天洛神云网络作为阿里云计算的连接底座,是飞天云操作系统的核心组件,致力于为上云企业提供高可靠、高性能、高弹性、智能的连接服务。本次云栖,云网络产品线也带来全系列产品升级,以及创新技术重磅解读,共包括1个Keynote,22个Session,包括产品发布、Deep Dive、最佳实践、客户分享、开放生态等多维度全面解读云网络进展。
2264 7
|
6月前
|
JavaScript Java 测试技术
基于ssm+vue.js+uniapp小程序的公司员工工作日志办公系统附带文章和源代码部署视频讲解等
基于ssm+vue.js+uniapp小程序的公司员工工作日志办公系统附带文章和源代码部署视频讲解等
42 0
|
7月前
|
存储 消息中间件 监控
Zoom 基于Apache Hudi 的流式日志处理实践
Zoom 基于Apache Hudi 的流式日志处理实践
83 1
|
消息中间件 数据采集 搜索推荐
「视频小课堂」ELK和Kafka是怎么就玩在一起成了日志采集解决方案文字版
「视频小课堂」ELK和Kafka是怎么就玩在一起成了日志采集解决方案文字版
|
达摩院 云栖大会
云栖大会宣导视频
阿里巴巴达摩院XR LAB负责人谭平老师对云栖大会的宣导视频
322 0
云栖大会宣导视频
|
机器学习/深度学习 人工智能 Cloud Native
|
人工智能 大数据 关系型数据库
2017杭州云栖大会100位大咖视频+讲义全分享
“如果我看得更远一点的话,是因为我站在巨人的肩膀上。”2017杭州云栖大会资料全部整理完毕,首批100位大咖视频+讲义分享给大家。
69482 0
|
人工智能 云栖大会 语音技术
视频AI对话杭州云栖:新一代视频智能生产的探索与实践
在今年的杭州云栖大会AB区中庭,有一个全透明建筑备受瞩目,这就是云栖数据指挥中心。在这块大屏中的媒体中央厨房部分,正是采用了视频智能生产方案,将多模态内容理解与云导播和云剪辑相结合,使原来小时级别的视频生产降至秒级。
4103 0
视频AI对话杭州云栖:新一代视频智能生产的探索与实践
|
编解码 人工智能 算法
【杭州云栖】飞天技术汇大视频专场:全民视频时代下的创新技术之路
2018杭州•云栖大会在9月19日如期召开,在四天时间内将举行2场主论坛、170多场前沿峰会。在9月19日上午的飞天技术汇-大视频专场中,多位阿里云技术专家、合作伙伴、客户为现场观众分享了各自领域的多媒体研发成果,进行多款重磅产品的发布,一同解读视频创新技术演进之路。
3059 0
【杭州云栖】飞天技术汇大视频专场:全民视频时代下的创新技术之路

相关产品

  • 日志服务