作者| 阿里文娱资深算法专家 胡尧
**一、文娱消费新体验-Free Viewpoint Video
**
面向文娱消费新体验,文娱算法团队基于整体的视频生产、播放、交互式体验等环节做了非常多的技术探索,在视频子弹时间的基础上进一步延展,延伸成更加经济通用的Free Viewpoint Video技术,构建完善的现场-云-边-端的技术链路。
今年优酷与CBA达成全方位的合作,在新赛季首次落地互动FVV体验,变革传统体育赛事的观看体验。我们还主导建设FVV视频技术国家标准,同时承担了国家“科技冬奥”“冰雪项目交互式多维度观赛体验技术与系统”项目,让更多普通用户享受到新一代观看体验。
二、视频消费商业化新模式-创意广告
在视频消费商业化新模式上,重点在创意广告领域,打造动效酷炫、更原生、可互动的广告形态,通过规模化实现中长尾内容的变现。
具体是构建了综合的三维环境感知和理解算法,在多场景多模态的视频内容理解、云端结合的CG 渲染引擎等领域都有深度探索,并且构建云端结合的c c级渲染引擎,实现AI两大平台(视频打点平台、视频特效生产平台)、一个中心的战略(创意广告制作中心)。
**
三、视频创作新平台-基础素材自动化生产与检索**
在视频理解领域的另一个重要应用,就是搭建了视频创作新平台。
首先,我们实现了基础素材的自动化生产与搜索,将传统的静态人物动作和场景实现升级到shot 级别,支持动态素材的检测与识别。
同时,实现精细化抠图,包括对动态人物和物体场景的提取,使这些素材可以被创作者更快速的应用到新的创作环境中。通过交互式的精细化分割算法,动态地将经典视频中的素材提取出来,实现简易化绿幕的效果。
当大量的素材被生产出来,我们同时提供基于准素材级别的智能化检索系统,用户只需要通过语义的文本或语音输入,就能实现对整个素材库的检索。例如用户搜索“吴倩拥抱”,系统就会呈现出整个《冰糖炖雪梨》中有吴倩拥抱的场景。
**
四、视频创作新平台-封面图自动化生产**
另外,我们实现了封面图自动化生产。基于主要人物、场景、美学评级、元素多样性等方面生成不同维度的封面图,并提供智能裁剪服务,满足16:9、4:3或者3:4等各种场景需求。同时在某些场景中实现动图的自动化生产,即实现千人千面的内容+素材的统一个性化推荐,助力运营分发的提效。
五、视频创作新平台-模板式视频半自动化生产
鉴于优酷有海量的IP版权内容,我们研发了一系列的剪辑合成技术,自动对视频的故事线、内容模板进行提取,并在此基础上在海量视频中进行智能化的二次创作,实现如节目卡点剪辑、Video Highlight & Summary技术生成的前情提要等产品。同时具备视频的形态转换技术,将横版的视频通过AI算法,识别显著性主体区域并进行美学评判,实现竖版视频的自动化生产。
这些技术能够有效的为商业化提供更多素材,同时为B端提供更多能力。
在这个基础上,我们才能实现基于元素级的视频深度理解技术,我们将传统的基于用户行为的内容分发体系和基于视频内容理解的视频内容分发体系进行了有效结合,实现了群体智慧和计算机视觉在美学和AI上的融合,实现了从整个封面图内容的原数据分析,到整个用户行为偏好的判断,实现千人千面的内容加素材的个性化推荐,有效提升整个业务场的分发效率。