以下内容根据访谈视频整理而成
今天视频已经成为最具互动性的网络内容。相比文字和图片,视频可以承载的内容更加丰富也更加生动,人们也已经习惯通过视频这种内容形态来表达自己的想法,传递自己的思想,进行社交以及了解我们的世界。视频成为一种主流的内容表达方式,站在视频服务和开发者角度,我们更多关注如何支撑业务的需求,以及需求背后的技术的形成。
在视频的生产环节有哪些重要的指标和信息是需要开发者去特别关注的?
第一个开发者关注的点是用户体验视频清晰度的高低、流畅度的好坏给用户带来的观感和体验是完全不一样的;第二个关注点功能的完善程度。市面上很多典型的直播产品可以提供美颜,滤镜,贴纸,人脸识别,年龄识别等娱乐性功能,我们也可以在视频生产过程中加入水印、智能鉴黄、视频的剪辑等功能;第三点是视频的起播速度。怎样才能保证视频起播时间控制在1S内,在最短的时间高效的对视频进行处理也是开发者非常关注的;第四点就是视频平台是否能做到海量视频分析并实现低成本的运维。因为视频是非常耗费资源的。这四点都是开发者特别关注的,而每一个关注点背后都有阿里云非常强大的技术能力的支撑。
在视频的生产环节,阿里云可以为开发者贡献出哪些能力?
从以下三个角度讲,一个是整个阿里云视频会提供完整的全链路的能力。阿里云点播服务产品提供从视频的导入到短视频的拍摄、录制、图片处理、在线编辑、视频审核等全链路服务。同时也提供给开发者相关统计数据,让开发者可以依托数据分析,做策略性的判断。同时我们的产品可以进行组合高效高效的将视频点播从繁琐的视频生产环节中解放。依托点播产品组合客户的内容链条,让开发者更多的关注业务内容的生产环节,不必纠结于技术的底层细节。同时阿里云也提供高性价比转码服务方案。
除了自身的高品质或独特的内容之外,视频转码是每个视频网站和内容生产企业最核心的技术能力。窄带高清2.0是阿里云视频在云栖大会发布的新产品。这个产品就是针对转码服务的,非常欢迎大家去试用窄带高清2.0这个技术产品。转码中一个非常重要的功能是倍数转码,对于比较关注内容生产的实效性比如新闻、事件直播类产品的生产者来说,从内容生产、转码再到分发,有一个时效性要求。普通的转码可能需要排队,有很长的延迟,而倍数转码能很快对内容转码,减少端到端(指的是从内容的供给到消费的端到端)的时间消耗,保证了内容的实效性。
在短视频产品里,我们对外提供短视频SDK,这里非常重要的一点是人脸识别是对外免费的。已经有大量的客户都在使用短视频SDK,包含梨视频、咸鱼,甚至钉钉都在使用短视频SDK。我们还提供两个内容生产工具,这些生产工具是对线下既有工具的云化,就是把线下产品放在云端提供给大家服务。一个是云剪辑。云剪辑是在云端对素材进行在线编辑、拼接、图文叠加甚至遮标,同时支持异地的协同编辑;第二个是云导播,这是一个很重量级的直播内容生产工具。除了导播台的垫流、垫片常用性功能外,还提供了更丰富的功能。如语音识别。语音识别的应用除了在云栖大会上分享的ET实时语音字幕功能外,还提供更加丰富的功能组合。大家不仅可以使用云导播台业务,也可以用阿里云的APR开发自己的导播台。以上这些就是阿里云给大家提供的技术的解决方案。
在视频点播业务场景下,阿里云如何和人工智能结合使视频更高效的生产和展示?
说到 AI不得不说我们是非常幸运的,因为我们在经历、参与着一场非常伟大的AI技术商业化的变革,这也是一个势不可挡的大趋势。由于数据量非常庞大,计算成本非常高,AI技术对云平台是非常依赖的。而阿里云拥有强大的技术后盾和海量资源支撑。阿里云IDS器前不久在ACM MM2017今年的LSVC(Large-scale video classification)上取得了非常好的成绩,获得了全球的冠军。作为ACM下属的专业组织,ACM MM是国际多媒体领域的顶级盛会。
阿里云融合国际权威的冠军的技术实现以视频为入口的视频智能审核、音视频内容理解、视频指纹、视频智能编辑等。其中视频智能审核的功能在十九大期间也服务很多客户。在视频生产环节,这些AI能力都与视频处理工作流紧密结合。开发者可以对视频处理的工作流进行定义,对多种触发方法进行灵活组合和配置,以实现在不需要任何人工参与的情况下满足大量视频处理的需求。一个非常典型的工作流就是视频的鉴黄、鉴暴、鉴恐,在视频转码之前我们会对视频鉴别处理,发现有问题就停止这个工作流,不进入转码的流程。同时系统也会发出报警,将视频提供给审核人员处理。
视频直播场景里如何与人工智能相结合?
在视频直播场景中主要有以下几点探索:
一是视频的内容解析,我们可以对视频直播中出现的商品以及场景进行解析,将视频、电商以及广告结合,为直播点播等多种视频形式提供更好的视频商业化变现手段。这个技术已经落地到天猫魔盒第一版的“边看边掏”项目中了,它可以打通观看视频的用户和视频本身的内容、淘宝上的商品三者之间的关系,在最合适的视频片段里投放给用户最感兴趣的商品。
二是人脸识别。通过使用人脸识别技术可以有效的识别网红主播,并通过对用户喜好数据的收集和分析,帮助APP实现对用户的个性化推荐。也可以通过对主播的人脸手势以及动作的识别来添加动态道具,增加直播互动过程中的趣味性。人脸识别在点播场景中得到了非常具体的应用。比如利用强大的人脸识别算法以及实时更新人脸库,在存量点播视频中将视频做识别,网络上删除出现特定人物的内容。
三是语音识别。基于阿里云现有的语音识别技术,可以使直播过程中的社交更加简单。比如实现用语音输入弹幕,使用口令发红包、送礼物等。在十月份刚刚举办完的杭州云栖大会上,实时语音转文字也得到了应用。
四是视频大数据分析。通过对播放日志,用户行为日志进行分析,为客户优化运营提供数据分析上的支撑。也可以结合用户行为,对用户进行个性化的推荐,从而提高用户的粘性和活跃度。后面也会详细介绍人工智能在视频的消费环节的应用。
在视频的分发环节,开发者真正的需求到底是什么?阿里云又能提供什么帮助?
对于开发者,更多关注的一点是地域覆盖度。比如在中国某个区域,某个工作室或某个视频公司产生视频后,分发的对象或观看的受众不仅在全国,也输送到海外。从地域覆盖度角度,阿里云CDN有超过全球1200个结点,覆盖全球六大洲。直播点播产品能阿里云CDN做无缝拼接,实现无论何时何地,视频的观看者都有非常流畅的播放体验,使播放视频的流畅率达到98%,这在行业内是领先水平的。
视频流量大与CDN成本花费少是一个矛盾点,阿里云如何帮助客户解决这个矛盾?
阿里云现在对外除了提供通用的CDN服务外,也提供了PCDN (P2P CDN的简称,价格是CDN的1/4)的加速服务。PCDN利用P2P技术,部署了超过百万级别的PN节点,是CDN现有产品的一个非常好的补充。依托于PCDN技术不仅可以提升整体加速体验、提升播放流畅率,也可以极大的降低分发成本。在直播业务场景里,除了通常的通讯需求外,还要提供端到端,或端到用户的流畅播放,这里涉及全球传播的问题。这个问题指当内容生产在海外需要分发到国内,或国内视频输送出国外都需要内容生产链路打通。在中国的一路直播信号输送到国外的成本是比较高的,国外的直播信号传输到国内成本也是很高的。为了解决这个问题,阿里云最近发布了一款直播全球加速产品。这款产品利用阿里云优质的基础设施,建立了从视频采集到目的站间的全球高速通道。全球高速通道的可靠性和安全性都有极高的保障
视频内容分发出去后,在内容消费的环节中,阿里云又能为开发者提供什么样的服务?
这里可以从四个角度来回答这些问题:
从应用角度来看,阿里云在点播、直播、转码和短视频的各个业务场景都有相应的功能产品提供,产品之间也会做相互的打通。客户通常在直播的内容产生的同时,录制成点播资源。比如短视频拍完后,内容经过沉淀直接分发到点播视频平台。阿里云也支持点播转直播服务,比如点播台、节目的编排转直播,直播CDN也支持直播回看或视频直播。
除了应用角度,我们还非常注重在端上的能力。阿里云播放器SDK,提供全平台播放的解决方案,覆盖了从flash,H5,iOS、安卓多平台的播放器SDK,适用于点播和直播的场景。同时SDK提供非常好的扩展性,用户可以依托于SDK封装自己的业务。点播服务已经建立了从上传、转码、视频分发到播放的全链路监控系统。通过这些系统可以查看客户端的覆盖率,比如网络的情况、用户的清晰度播放占比、播放成功率,这样可以有助于客户定制策略,帮助开发者优化体验。
从安全性角度来看,阿里云也提供了相应的解决方案。一个是依托于阿里云密钥管理的视频加密服务,支持全平台加密播放,有效防止视频内容的泄密。同时阿里视频正在进行借助商业的第二产品相关开发工作。不久之后,客户可以在阿里云商业平台上使用阿里云视频加密服务。加密服务可用对在线教育、财经金融、行业培训或视频行业的独播剧做内容的保护,有效防止第三方下载和对内容做二次分发,对内容进行全方位的保护。二是全方位防盗链机制。阿里云提供了从云端到SDK的完整的加密方案。
从用户体验的角度来看,用户体验在直播场景里要求是很高的。除了要求低延时之外,还需支持首屏秒开,保证播放的整体体验的完整性。阿里云提供指标可度量。对一些关键的指标,如使用速度、卡顿率、播放错码做实时的跟踪,客户或平台方可以即时调取视频的相关数据,根据视频的数据对整个播放做策略性的调整。添加方可以根据分设备、分区域的用户体验报告,有针对性的进行调整业务。
在视频消费环节,人工智能和视频会擦出怎样的火花?
人工智能在视频消费应用上分为四个大方面:
第一是视频的内容分析。前面说的视频内容分析的部分是和电商、广告的结合,现在分析的是在用户消费这个环节上,主要用于提升搜索推荐的效果。阿里大文娱和淘系强大的视频生态环境为我们提供了非常丰富的资源和完备的链目体系。阿里云视频服务场景可以涵盖电商、娱乐、短视频、长视频等各类领域。目前,视频内容理解服务已经广泛应用在优酷、土豆、UC、咸鱼和手淘视频内容上。经过集团内部应用的长期的验证后,阿里云对外推出的服务是非常稳定和成熟的。
第二是视频封面选图。通过对视频内容的理解,结合画面的美学,选出最具有代表性的关键帧或者关键片段作为视频的封面图,让用户一眼就能知道视频的核心内容。同时阿里云也支持根据用户信息的实时反馈和行为日志实现个性化的首图投放,提升用户体验的同时也能提高视频的点击率。这点在视频云的客户、淘系、阿里大文娱等相关产品中都得到了应用。
第三是视频指纹。视频指纹技术的优势在于能多场景适配包括格式、分辨率。对不同分辨率的同源视频具备非常好的识别能力。视频指纹的精确度也非常高。
第四是视频内容审核。阿里云基于深度学习技术和海量数据,智能的识别色情、暴恐、广告、涉政等敏感的视频或图片,极大节省客户人工审核的成本,降低违规的风险。除此之外,语音识别、人物识别、物体识别、场景识别这些视频内容分析的技术也广泛的应用在云相册和优酷土豆的视频打标上。
以上所有人工智能技术在视频AI领域的应用都是为了能够提高工作效率,减少人工的成本和计算成本。
人工智能在视频领域的应用日趋成熟,在未来阿里视频云会朝哪些方向发展?
现在视频AI的概念是非常火的,我们不是把人工智能技术落到口号上二是希望把这样的功能产品化,落实到整个内容生产和内容消费的环节,帮助开发者提升效率、减少人力投入。阿里云视频将会从两个方面入手。
第一个是生产智能。生产智能包含了两个部分的内容。一是在内容生产环节帮助内容生产者做生产智能。例如自动截图,自动拆条、自动生成字幕。目前,这些在视频生产过程中大部分工作是由编辑或内容生产者人工完成的。现在短视频非常流行,我们发现很多短视频内容是从影视剧或长片里截取的片段。人工智能是否能帮助大家做拆条的工作。比如说视频网站的内容的审核。现在其实大部分审核,尤其对某些内容,大部分是通过人工的方式来审核的。有没有可能通过AI技术做到内容智能审核。
对于内容信息的自动生成。现在视频网站通用的做法是一个新的内容产生后,做一个分类。比如影片是属于电视剧还是电影,是恐怖还是战争的题材,甚至对于导演演员都有详细的划分。这些目前都是通过人工打标或人工输入方式去完成的。也就是说我们在生产智能的一部分能不能帮助客户开发者、内容生产者自动生成内容、自动生成内容信息信息。这个讲的是生产智能。
第二个是在消费层是否可以帮助开发者和内容的合作伙伴做消费智能。很多产品,像短视频产品、直播网站、资讯APP都有自动推荐技术。这些技术目前是封锁在各个APP技术人员手上。阿里云后期会开放一些标准能力,让没有具备这些开发能力的人能依托于云计算技术服务,快速使用类似自动推荐服务。同时阿里云视频在消费这一侧希望能更多的帮助开发者和内容生产者做到商业打通。比如是否能在消费这一侧将内容和商业平面广告等做灵活的打通,灵活的根据商业需求做内容的插入等。同时我们在手淘,天猫魔盒已经提供了“边看边买”应用,这是我们在消费智能的重要的早起产品而且也已经产品化了。我们希望在消费侧形成一个稳定的、可落地的产品形态,帮助大家有更多的应用场景。不管是商业化变现还是内容的引领组合都聚焦在两个点,就是做生产的智能和消费的智能。
视频智能化发展是大趋势。在不久的将来,技术可以更加实实在在、真正切切的走近我们每个人的生活中,渗透到每个生活的角落。在视频领域,阿里视频云会源源不断的输出更好的产品体验、更完善的功能、更智能化的服务,把最合适的视频推荐给最需要的人,给大家一个更广阔、清晰、灵动的世界。
关于双11,阿里云视频有推出了哪些优惠活动?
想更多的了解阿里视频云产品视频能力,可以登录阿里云官网中视频点播、视频直播、媒体转码的详情页。双11期间,阿里云视频也推出了很多的优惠,比如直播点播的流量包、短视频SDK的折扣和满减以及视频直播鉴黄的零元体验包,这些都非常欢迎大家去试用和使用,大家可以按需选取合适自己的服务和套餐。
双11第一波,红包领不停,点击看详情:https://promotion.aliyun.com/ntms/act/pre20171111.html