熊猫直播:大视频数据业务的云上历程

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

在海量数据的大视频行业,如何满足大数据需求?12月20日举办的北京云栖大会“企业云上业务优化”分论坛上,熊猫直播大数据技术专家卢圣刚,分享了熊猫直播不断优化云上资源,建立起灵活配置、高扩展性、易于运维的云上架构的宝贵经验。

作为知名泛娱乐直播平台,熊猫直播涵盖游戏、娱乐、综艺、户外、体育等多种泛娱乐直播内容。在身处大视频时代的当下,熊猫直播代表了众多大视频企业的大数据需求:面对分散在MySQL、Redis、MongoDB之中的数据源头,需要实现统一的数据存储;面对不同的业务场景和高速的业务发展,需要实现灵活的横向扩展——不仅能灵活添加开源组建,还需要能快速增加计算节点。

作为高速发展的直播平台,熊猫直播数据纬度多、数据量巨大——累计已经达到PB级,仅仅每天新增的就有几十T。就离线计算的数据量看,每天几百个日常计算任务,以及大量的临时查询需求。

为了满足这样的大数据需求,卢圣刚分享了熊猫直播从Fluentd + ODPS、到Flume + Ambari、再到Flume + EMR的架构演进历程。

1

阿里云EMR——Elastic MapReduce(E-MapReduce),是基于阿里云ECS之上半托管开源大数据软件栈。

卢圣刚分享了选择EMR的原因:“EMR的弹性动态伸缩,能够帮助熊猫直播直线快捷的扩容、缩容EMR Hadoop集群,灵活、快速部署开源大数据服务(HBase、Kafka、Impala,Flink等),还具备数据存储成本低的优势。”

卢圣刚还特别了强调运维机制对于选择EMR的关键作用。阿里云企业服务对熊猫直播给予7*24小时钉钉群支持,快速解决集群使用问题。阿里云服务的支撑保障,使熊猫直播能够减少运维工作,更专注于业务。

未来,熊猫直播会将依托阿里云,继续深耕大视频数据业务,满足大视频时代不断演进的大数据需求。

了解更多请微博关注阿里云客户满意中心
__8

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
编解码 边缘计算 网络协议
云上“视界”创新无限|2022阿里云直播峰会|学习笔记(四)
快速学习云上“视界”创新无限|2022阿里云直播峰会
|
编解码 缓存 供应链
云上“视界”创新无限|2022阿里云直播峰会|学习笔记(三)
快速学习云上“视界”创新无限|2022阿里云直播峰会
|
编解码 边缘计算 人工智能
云上“视界”创新无限|2022阿里云直播峰会|学习笔记(一)
快速学习云上“视界”创新无限|2022阿里云直播峰会
|
编解码 算法 Cloud Native
云上“视界”创新无限|2022阿里云直播峰会|学习笔记(二)
快速学习云上“视界”创新无限|2022阿里云直播峰会
|
自然语言处理 搜索推荐 小程序
云上“视界”创新无限|2022阿里云直播峰会|学习笔记(五)
快速学习云上“视界”创新无限|2022阿里云直播峰会
|
边缘计算 人工智能 视频直播
云上“视界” 创新无限 | 2022阿里云直播峰会正式上线
7月8日,2022阿里云直播峰会正式上线!
982 0
云上“视界” 创新无限 | 2022阿里云直播峰会正式上线
|
Web App开发 编解码 缓存
2020双十一,阿里云GRTN拉开直播和RTC技术下半场的序幕
直播,已经成为了“剁手党”们最喜闻乐见的一种购物形式。对直播体验的极致追求,也是淘宝技术人们长期的努力方向。为了提升用户购物体验,让直播更加丝滑,让剁手更快一些,在2020双十一期间,淘宝首次启用了阿里云CDN的GRTN全球实时传输网络。数据显示,和传统的HTTPFLV/RTMP方式相比,在启用了GRTN后,直播端到端的延时降低了83%。那么,GRTN到底是什么?其背后究竟隐藏了哪些核心技术?
10532 0
2020双十一,阿里云GRTN拉开直播和RTC技术下半场的序幕
|
移动开发 前端开发 数据可视化
不一样的烟火:记OTT端半屏互动能力建设 | 《优酷OTT互联网大屏前端技术实践》第六章
如何建设OTT播放页,问题如下: OTT播放页将如何承载投放? 互动及交互方式是怎样? 容错机制如何处理? 定向投放如何实现? 用户观影体验如何保障? 共建开发如何分工? ……
1574 0
不一样的烟火:记OTT端半屏互动能力建设 | 《优酷OTT互联网大屏前端技术实践》第六章
今日直播预告:数字时代的企业流量该如何进行逆势增长?
7月15日周三下午14:00-15:30,我们邀请《流量黑洞》作者老胡,为大家用经典案例的方式分析流量背后的用户情绪、理解用户、内容精准洞察......
今日直播预告:数字时代的企业流量该如何进行逆势增长?
今晚直播预告:阿里巴巴副总裁和您一起探讨 “工业互联网:数据驱动的新价值网络”
今晚19:30,阿里巴巴集团副总裁刘松,和您一起探讨 :《工业互联网:数据驱动的新价值网络》。
今晚直播预告:阿里巴巴副总裁和您一起探讨 “工业互联网:数据驱动的新价值网络”