在2017年3月,阿里云视频云团队宣布大视频战略,全面进军视频领域。直到今年9月的杭州云栖大会,短短一年半的时间内,视频云先后发布了多个产品和解决方案,实现了技术与服务的全方位的进阶。如今的视频云更清晰、更智能、更稳定流畅、更实时连接,拥有无限可能。
在今年杭州云栖大会大视频专场中,阿里云视频云总经理朱照远先生为现场嘉宾分享了这一年以来,团队在视频云领域的探索,从高清、智能、稳定流畅、连接这四个方面,阐述了视频云2.0的定义。
技术和开放合作 带来更清晰极致的视频云
谈到视频,就有一个永远绕不开的话题,就是视频的清晰度。显示设备上的视频画面是由像素点构成的,8K的视频的像素点的个数是1080P全高清的16倍,一定距离内,像素点的密度已经超越了人类眼睛的视网膜的分辨极限,画面看起来真实的世界一样,非常的震撼。视频清晰度的不断提升,不但可以让视频承载娱乐视听的内容,更可以应用这样的技术,去给制造业、医疗影像、城市管理等行业带来工业级的视频应用。
朱照远说到:“对视频清晰度的不断追求,是我们做视频云的源动力,我们一起走过了模拟视频时代,一起见证了视频全面数字化,一起从480P到1080P,现在阿里视频云全面支持4K视频直播,提供实时转码,实时录制,实时分发全套4K直播解决方案,为全网视频升级到4K助力。与此同时,我也非常高兴的和大家分享,在今天,我们将同合作伙伴们一起把极致的高清体验向前再推进一步。”
在下午的主论坛中,阿里云视频云发布并演示了8K端到端互联网直播解决技术,并联合多家企业成立8K产业联盟,同时展示了国内首次5G+8K医疗远程会诊,剑指8K的商业应用。除此之外,为了让更多用户能够真切地体验到8K技术,在展区布置了8K直播端到端的解决方案演示,这也是国内第一次把8K直播的全流程,全方位展现在公众的视野中。
AI赋能 打造更智能的视频云
随着人工智能技术有了实质性的突破,让我们的所有设想不再停留在科幻电影中,而是真实的应用在业务系统中,帮助客户去提升效率,降低成本,甚至替代人工。在视频领域,阿里云也一直致力于将AI赋能于视频的“生产-审核-管理-分发-营销 ”全流程,在专场中,朱照远重磅发布三款视频AI产品,希望助力客户向视频智能化再迈一大步。
一、视频智能生产解决方案
智能生产解决方案打通了人工智能和导播台、云端剪辑、音视频编解码等视频技术,让AI赋能视频生产各个环节,取代人力和庞大复杂的视频生产设备,实现快速、高质、安全生产。
从端上生产环节的短视频及互动直播SDK进行AI特效组合采集,到通过云导播、云剪辑进行视频再进行高效、智能化的再次生产加工,然后依托强大的音视频媒体处理的能力,画质重生、FRUC等技术,提高视频生产的质量。同时,利用视频AI赋能视频的分析、识别、审核等,取代人力和庞大复杂的视频生产设备,实现视频的快速高质生产。
在今年的杭州云栖大会现场,云栖数据指挥中心媒体智能生产、云冲浪智能集锦、3V3篮球智能集锦都是采用了阿里云视频智能生产解决方案进行落地。在极短的时间内,克服了集锦生产实效性和质量的巨大考验,实现了云导播、云剪辑与视频AI技术的完美融合,为演讲者、参与者记录了最精彩瞬间,并支持实时的下载和转发。
二、视频DNA – 规范网络视听节目传播秩序
阿里云有一系列的技术手段可以提高影音内容的质量和生产效率,而这些技术的进步会增加视频的含金量,逐渐启发和提高视频创作者乃至整个社会的视频版权意识。
朱照远说到:“我们从版权机构了解到,近两年的视频版权登记件数在逐年增加,以前主要是电影电视,现在有更多的短视频加入其中。而且,我们可以看到,政府和相关机构正在逐渐加大版权监管的力度。在这样的背景下,我们研发并推出了视频DNA,将视频云的媒体处理能力与人工智能技术结合,在总量庞大的视频大数据中,快速准确地判定视频的重复或盗版情况,完成人工审核无法完成的事情。这也是我们作为技术研发人员,也作为社会一分子,去帮助原创者捍卫版权,帮助平台维护健康生态,帮助社会提高版权意识的一种途径。”
视频DNA可以作为视频的唯一标识,它具有唯一性,也就是两个不同视频拥有相同DNA的几率低于千万分之一,接近于0。同时它具有稳定性,也就是不会随音视频文件的格式转换、剪辑拼接、压缩、旋转、增加logo等变换而变化。我们通过技术手段保证了侵权或重复视频或视频片段的识别准召率。
“当然视频DNA的应用场景不止是版权保护和原创识别,我们曾帮助一个客户,解决其30万的视频重复占比达到29.6%的困扰,这可以帮平台去除冗余数据,并在进行个性化推荐的时候,提升用户的观看体验。在使用视频DNA之前,客户往往并不能真正了解自身平台的视频重复比例的。“朱照远说到。
同时视频DNA也可以应用在直播场景中,与云导播台结合,实现对广告的监播和实时替换,有利于支撑广告动态分成业务的生态。
三、智能视觉产品发布
随着人工智能的普及,各个行业均在通过人工智能解决图像视频方面的各种问题,但是仍然存在各式各样的定制化需求,需要投入大量人力物力成本,才能训练出满足业务需求的定制化模型,为了解决这样的难题,阿里云视频云正式发布“智能视觉”,可以帮助0算法基础的企业通过少量训练样本和极短的时间内,训练出他们的业务专属的模型。
智能视觉可以应用在以下几个领域:
- 视频领域,经常遇到基于视频内容识别然后输出标签,利用标签进行搜索、推荐或插入广告等需求,而不同用户对于视频需要分析的内容也不相同,需要针对关注的内容进行定制化模型训练。
- 新零售领域,新零售的运营均基于能够识别商品,可是门店里不断出现新的商品样式,如何能快速的解决各式各样的商品识别。
- 安防监控领域,虽然现在业界已经有了较多的人和车的模型,但是仍然有大量的非人车去识别,比如在城管项目中,需要去识别是否有小商小贩占道,像这类需求在监控行业非常常见,而在业界是没有一个成型的模型去解决的,需要去定制化解决这类需求。
智能视觉产品为了解决这些定制化难题,真正的做到了给0算法基础的用户,通过界面化操作,一键式完成从上传-标注-训练-预测的全流程模型训练部署,达成用少量的数据最高效率训练业务专属模型的目标。该产品目前已经上线公测,可以在视网膜填写申请,申请免费使用。
在产品背后我们拥有着非常强大的技术支撑,首先我们使用分布式引擎,提供从数据模型到部署一站式服务,其次为了提升训练效率,我们采用迁移学习技术,将阿里的数据运用到极致,让用户仅需要少业务数据,就可以训练专属模型。第三,在少量的样本的情况下,使用业界前沿的Auto Model Search,将人工智能运用到模型调参中,为用户提供了更高的模型准召率。最后,为了让用户能够快速验证模型效果,我们利用数据增强技术,能够训练完成的同时,可以得到模型训练效果帮助用户判断是否符合业务需求。
朱照远表示:“在不断的提升我们视频AI产品和能力的同时,我们不断的问自己,AI到底能为行业带来什么?我认为实时高效、稳定安全、增值、智慧是AI技术可以影响整个行业的四个关键词。”
千锤百炼 更稳定流畅的视频云
经过2016年的直播爆发,2017年的短视频热潮和历年双十一,各大电视台跨年晚会的锤炼,阿里云视频云产品已经具备了为大规模、突发性的大型直播赛事提供稳定、流畅的互联网直播的基础能力。在过去的几个月里,阿里云视频云先后为俄罗斯世界杯,雅加达亚运会提供视频服务,将众多技术和全方位的护航能力沉淀,推出了一套超大型、超高清的直接解决方案。
首先是可以支撑千万级并发的CDN分发能力,阿里视频云经过多年的发展,已经建设出一个超大规模的媒体处理,分发基础设施。视频云的产品和技术,连接着10亿台设备,每年有100EB的信息通过视频云的基础设施进行分发。
在世界杯期间,阿里云最高单场支持优酷2400万人并发观看,背后依靠着CDN遍布全球1500+节点和120T的带宽能力储备,同时CDN智能调度系统和全链路的灾备措施,也能全面确保链路的稳定流畅,播出广电级的直播效果。
在满足这么多人稳定流畅观看的同时,还需要提供超高清的视频画质,阿里云应用画质重生,50帧极清技术,将世界杯30帧的视频处理得更加细腻清晰。结合前面提到的媒体处理、AI的能力,就可以让更多的用户很方便、很便宜的获得处理视频这种数据的能力,让视频能力无缝的融入和支持到用户的业务。
更实时、连接全球的视频云
未来企业和用户都需要通过视频来进行连接,而自建音视频通信服务,面临的网络节点的建设、稳定性保证、跨国跨运营商的互通互联、网络对抗算法、降噪去回声以及实时音视频编解码技术,需要有巨大的资源投入、技术投入以及维护成本。
朱照远先生重磅发布了音视频通信 RTC(Real-Time Communication)产品:“我们的目标是打造一个覆盖全球的实时音视频通信的基础设施,我们经过两年的开发和在阿里巴巴集团内部的应用和验证,目前已经是每天连接全球1亿多用户的企业级服务。”
RTC利用自研的智能调度、网络自适应和弱网对抗算法、音频3A算法、自研ARWNT算法等技术,使网络资源使用效率提高30%,带宽的消耗降低10%,可以保证在网络丢包30%的情况下,依然可以提供流畅的视频通话服务,让合作伙伴、企业、创业者更加专注业务本身。
同时,为了让视频技术更普惠,朱照远也表示视频云将持续释放技术红利,公布了视频云预付费产品全线8折,CDN资源包6折起,云导播台400分钟免费试用的活动,希望更多用户可以轻松、便捷的接入视频能力。
在分享的最后,朱照远说到:“人类信息传递的媒体从文字、到图片、再到视频,阿里云视频云一直以为践行的是让信息分享变简单,这是我们的使命。”