2018年初的音视频技术生态并不平静,Codec的争夺进入群雄逐鹿的时代,AV1和国产的AVS2对HEVC发起了挑战;WebRTC 1.0版定稿打通了在浏览器、移动端乃至IoT上的多媒体通信;AI、区块链技术的发展,正在与多媒体开发发生化学反应,将成为推动生态发展的新力量。而伴随人们对音视频的需求不断提升,越来越多的新场景被不断发掘,而对于技术的要求也越来越高。
8月25日·武汉 | LiveVideoStack联合桔子空间,邀请到影谱科技、三体云、即构科技、斗鱼、华中科技大学5位技术大咖,共同探索新技术在音视频领域的实践,以及新兴应用场景和传统行业的突破。同时也感谢七牛云、图普科技、相芯科技等公司的特别关注和支持。
讲师风采
作为实时音视频技术的重度使用场景,在线教育对于稳定性和高质量有着严苛的要求。尤其对于跨国场景下高连通率、低延迟和不卡顿是课程稳定性的重要指标,而回声消除、全带语音和噪音抑制等技术则是保证高质量的手段。即构科技技术副总裁冼牛详细解析了针对以上关键点在在线英语培训和乐器陪练场景中的技术实践。
冼牛 即构科技技术副总裁
我们周围世界包含了海量视觉信息,人眼具有识别其中重要信息的能力。而视觉关注则是致力于让机器找出场景中人眼关注的区域,从而解决和视觉相关的诸多媒体应用难题。鉴于此,华中科技大学计算机系统结构博士陈加忠详细介绍了视觉关注在视频压缩编码、图像分割,以及基于深度学习的内容检测等方面的实际应用和技术实践。
陈加忠 华中科技大学计算机系统结构博士
越来越多的实时音视频技术应用场景走进人们的日常生活,如游戏语音、直播连麦等。而对于开发者而言,实现从信息采集、编码到网络传输的高质量实时视频应用仍然存在相当大的挑战。三体云实时视频高级工程师李幸原从编码算法、实时传输以及基于丢包的拥塞控制,介绍了三体云在实时音视频技术开发中遇到的难点问题和技术实践、探索。
李幸原 三体云实时视频高级工程师
人工智能已经成为视频媒体平台在内容生产、洞察用户及内容分发过程中的基础技术。在视频行业整体用户规模增长趋缓的今天,人工智能的应用将为行业提供新的发展驱动力,在深度挖掘IP泛娱乐价值的同时,开拓更广阔的营销空间。影谱科技创新研发中心负责人吉长江详细介绍了如何借助语义和几何方式解析视频内容,并且使用卷积神经网络代替传统方法重构视频,避免纹理缺失、轨迹处理退化、鲁棒性降低等问题,从而提升用户体验。
吉长江 影谱科技创新研发中心负责人
作为国内一流的游戏直播平台,斗鱼每天都会有上万名主播进行游戏直播,同时生成海量视频内容,如何快速、准确的“解读”直播和视频内容让观众直观、便捷的找到感兴趣的视频成为关键。斗鱼资深多媒体研发工程师郑伟讲解了斗鱼在游戏直播内容识别的相关技术实践、遇到的难点以及性能优化策略。
郑伟 斗鱼资深多媒体研发工程师
精彩瞬间
互动问答
合影
资料下载
关注LiveVideoStack公众号,回复【0825】,获取本场沙龙讲师资料下载地址。