Serverless AI训练营:课时9:典型案例2:函数计算在音视频场景实践(一)
课时9:典型案例2:函数计算在音视频场景实践(一)
内容介绍:
一、场景介绍
二、最佳实践
三、Demo场景演示
一、场景介绍
自从2020年出现新冠疫情音视频领域如短视频、在线教育、视频会议已经成为所有行业各个年龄体的硬需求,而且伴随近几年直播带货的热潮,音视频行业已经成为许多企业创新的新方向,易观千帆数据显示2020年6月国内移动视频领域活跃用户规模为10亿人,视频用户使用时长达到670多亿小时。那么音视频场景的开发者面临什么样的挑战?
从上图可以看到挑战主要有
1. 需要适配大量不同终端,比如电脑端、移动端、ios、安卓等等,从企业应用 APP 到小程序等,怎么样打造一个通用行业解决方案是非常困难的,往往需要开发者们针对具体的需求重新架构和定制方案。
2. 音视频处理系统对资源方面的需求是非常大的,常见的音视频文件处理、转存、分发、联动这样一个音视频系统的打造对于 CPU、内存、网络资源是要求非常高的,这也造成了整个资源运维上的一些难点,需要管理大量的机器和网络,自建的要求非常高。
3. 主要是业务种类多,变化快,像短视频领域往往是大鱼吃小鱼,企业如果没有创新的话很快会被淘汰,音视频场景业务场景非常复杂,如果迭代比较慢的话,一旦抓不住观众的趋势,那么企业投入将没有意义,所有说这对企业是一个非常大的挑战。
4. 领域有明显的风骨特征,而且往往无法预估爆点的来临,对系统的实时弹性有非常高的渴求。
针对音视频领域的行业背景和客户痛点,基于函数计算的弹性高可用音视频特点、高性能的核心价值在于:
1.高可用、高性能、高弹性
2.百毫秒弹性能力,多可用区的容载,最高端实力八核没有理论的上限 ,而且专注业务开发的特性和低成本可以完全做到,按需使用、按量付费等等结合多种计费模型,能够真正满足企业,更灵活,满足各类定制需求的行业场景,成为短视频、直播带货、在线教育、在线办公领域企业创新的原动力。
函数计算音视频处理方案的优势
ITEM |
自建服务 |
函数计算+函数工作流 Severless |
基础设施 |
需要用户采购、管理、运费机器资源和运行其上的软件、代码 |
无需运维基础设施,仅需部署函数代码即可,按量付费 |
开发效率 |
除了必要的业务逻辑开发,需要自己建立相同线上运行环境,包括相关软件的安装、服务配置、安全更新等一系列问题 |
只需要专注业务逻辑的开发,配合函数计算控制台或者工具一键部署和任务编排 |
并行&分布式视频处理 |
需要很强的开发能力和完善的监控系统来保证稳定性 |
通过 Serverless 工作流编排即可实现多个视频的并行处理以及单个大视频的分布式处理,稳定性和监控交由云平台 |
学习上手成本 |
除了编程语言开发能力和熟悉FFmpeg 以外,可能使用 KBS 或弹性伸缩(ESS),需要了解更多的产品、配置和技术的细节 |
会编写对应的语言的函数代码和熟悉 FFmpeg 使用即可 |
项目上线周期 |
在具体业务逻辑外耗费大量的时间和人力成本,保守估计大约30人天,包括硬件采购、软件和环境配置、系统开发、测试、监控报警、灰度发布系统等 |
预计3人天,开发调试(2人天+压测观察)(1人天) |
卓越的工程效率/弹性伸缩免运维/成本优势
如上图,如果要自建一个服务的话,需要采购和管理基础设施,就算现在企业上云,一般情况下也需要购买和运维。比如说 ECS、ACK 等等云上资源,需要管理需集和容性等等。
如果采用阿里云计算的Serverless 方案基础设施是由系统来分配的,开发者无需购买和运维资源,只需部署代码即可,按量付费。
从开发效率来对比,自建服务除了必要的业务逻辑,还需要自己建立相同线上运行环境,然后测试验收相关软件的安装、环境配置、安全更新等等一系列问题,大量的时间浪费在了非业务创新的环境维护上。那么基于函数计算的解决方案,只需要关注业务逻辑的开发,配合函数计算控制台或者工具做到一键部署和任务编排,不需要浪费大量的时间在环境维护上;音视频场景需要海量资源消耗,要保证服务高可用,高性能、高弹性、自建服务需要很强的开发能力和完善的监控系统来保证稳定性,那么通过 Serverless 工作流来编排函数就可以实现多个视频的并行处理以及单个大视频的分布式处理,稳定性和监控交给了云平台来维护,开发者能够快速完成一个并行的,或者分布式处理系统的落地,这个效率是非常高的。
从学习上手成本和项目周期来考虑,函数计算大大减轻了企业负担,更多来考虑业务能力,不用过多去关注系统架构的稳定,系统架构对于能力要求是非常高的,增加了招聘的负担。
项目周期也可以从保守的大约30人天,下降到3人天左右,这对于中小企业甚至于大企业来说函数计算释放的技术红利为企业带来了质的飞跃。
二.最佳实践
核心价值:
快速开发上线:2天完成开发上线
弹性高可用:计算力不再是瓶颈,迅速调动大量计算资源进行音频处理, OSS 上的存量千万级音频文件自动触发函数几个小时内全部完成处理
高度自定义:用户需要 aacgain 和 mp3gain 等音频专业工具对音频进行音量平衡,FFmpeg 进行音频降噪处理,通用的云服务解决不了需求
降低成本:在音频和短视频处理这块,用户反馈节省了大约60%的机器成本
如上图,北京艾斯酷科技有限公司,是一家英语在线教育公司,旗下的朗易思听是英语听力最佳学习工具,拥有数万双语听力材料,曾获苹果 APP Store 首页推荐,产品相继获得豌豆荚最佳设计奖、小米年度最佳应用等奖项;该企业有海量音频需要音频平衡等处理,短视频需要转码等处理,同时还有很多基于机器学习的 NLP 需求,比如分词、语法分析......