熊猫直播:大视频数据业务的云上历程

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

在海量数据的大视频行业,如何满足大数据需求?12月20日举办的北京云栖大会“企业云上业务优化”分论坛上,熊猫直播大数据技术专家卢圣刚,分享了熊猫直播不断优化云上资源,建立起灵活配置、高扩展性、易于运维的云上架构的宝贵经验。

作为知名泛娱乐直播平台,熊猫直播涵盖游戏、娱乐、综艺、户外、体育等多种泛娱乐直播内容。在身处大视频时代的当下,熊猫直播代表了众多大视频企业的大数据需求:面对分散在MySQL、Redis、MongoDB之中的数据源头,需要实现统一的数据存储;面对不同的业务场景和高速的业务发展,需要实现灵活的横向扩展——不仅能灵活添加开源组建,还需要能快速增加计算节点。

作为高速发展的直播平台,熊猫直播数据纬度多、数据量巨大——累计已经达到PB级,仅仅每天新增的就有几十T。就离线计算的数据量看,每天几百个日常计算任务,以及大量的临时查询需求。

为了满足这样的大数据需求,卢圣刚分享了熊猫直播从Fluentd + ODPS、到Flume + Ambari、再到Flume + EMR的架构演进历程。

1

阿里云EMR——Elastic MapReduce(E-MapReduce),是基于阿里云ECS之上半托管开源大数据软件栈。

卢圣刚分享了选择EMR的原因:“EMR的弹性动态伸缩,能够帮助熊猫直播直线快捷的扩容、缩容EMR Hadoop集群,灵活、快速部署开源大数据服务(HBase、Kafka、Impala,Flink等),还具备数据存储成本低的优势。”

卢圣刚还特别了强调运维机制对于选择EMR的关键作用。阿里云企业服务对熊猫直播给予7*24小时钉钉群支持,快速解决集群使用问题。阿里云服务的支撑保障,使熊猫直播能够减少运维工作,更专注于业务。

未来,熊猫直播会将依托阿里云,继续深耕大视频数据业务,满足大视频时代不断演进的大数据需求。

了解更多请微博关注阿里云客户满意中心
__8

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
人工智能 供应链 算法
案例酷丨鲁商集团:云上转型见成效,数据能量创“心”不止
案例酷丨鲁商集团:云上转型见成效,数据能量创“心”不止
400 0
《飞天技术汇—千万级直播高稳定的挑战和实践 裘良科》电子版地址
飞天技术汇—千万级直播高稳定的挑战和实践 裘良科
105 0
《飞天技术汇—千万级直播高稳定的挑战和实践 裘良科》电子版地址
|
Web App开发 人工智能 算法
万象图谱!RTE创新大赛!声网RTE2021再推实时互联网技术盛宴
10 月 22-23 日,以「万象频道」为主题的第七届声网 RTE2021 实时互联网大会在北京举行。
234 0
万象图谱!RTE创新大赛!声网RTE2021再推实时互联网技术盛宴
|
Web App开发 编解码 缓存
2020双十一,阿里云GRTN拉开直播和RTC技术下半场的序幕
直播,已经成为了“剁手党”们最喜闻乐见的一种购物形式。对直播体验的极致追求,也是淘宝技术人们长期的努力方向。为了提升用户购物体验,让直播更加丝滑,让剁手更快一些,在2020双十一期间,淘宝首次启用了阿里云CDN的GRTN全球实时传输网络。数据显示,和传统的HTTPFLV/RTMP方式相比,在启用了GRTN后,直播端到端的延时降低了83%。那么,GRTN到底是什么?其背后究竟隐藏了哪些核心技术?
10495 0
2020双十一,阿里云GRTN拉开直播和RTC技术下半场的序幕
今晚直播预告:阿里巴巴副总裁和您一起探讨 “工业互联网:数据驱动的新价值网络”
今晚19:30,阿里巴巴集团副总裁刘松,和您一起探讨 :《工业互联网:数据驱动的新价值网络》。
今晚直播预告:阿里巴巴副总裁和您一起探讨 “工业互联网:数据驱动的新价值网络”
|
SQL 分布式计算 运维
【云栖号案例 | 游戏&娱乐】混合云模式助力斗鱼搭建混搭大数据架构
斗鱼自建集群遇到瓶颈,涉及到资源效率和资源成本问题。混合云带来资源成本和资源效率变化最大,保证可以在多活数据中心的状态下支撑更多的业务。
【云栖号案例 | 游戏&娱乐】混合云模式助力斗鱼搭建混搭大数据架构
|
专有云
全媒体时代的速度与激情:香港凤凰卫视云端转型实践
今年凤凰卫视已经部署完成阿里云专有云敏捷版OSS存储,通过和凤凰全媒体平台有效结合,生产效率提升50%,成本降低30%。阿里云专有云敏捷版(Alibaba Cloud Apsara Stack Agility)是面向中小型业务规模客户的企业级云平台,能够实现简易、快速、经济部署专有云的需求。
2341 0
|
人工智能 算法 搜索推荐
优酷世界杯高清直播背后,一场技术升级内容产业的浪潮
作为历史上首家拿下世界杯直播权的主流视频平台,优酷世界杯直播成功首秀的背后由优酷自研的“智能媒体大脑”、阿里云密集的CDN节点和巨量带宽储备支撑,实质上是一场围绕内容产业的技术升级浪潮。
4361 0
|
BI 数据库 分布式计算
视频网站数据平台变迁之路(二)
摘要:上一篇主要介绍了 数据系统架构V1 总体架构及 数据采集与数据存储,本篇我们来聊聊架构下的数据分析遇到的各种情况
1618 0