走进武汉，探索多媒体开发最佳实践-阿里云开发者社区

走进武汉，探索多媒体开发最佳实践

2018-08-21 1988

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 2018年初的音视频技术生态并不平静，Codec的争夺进入群雄逐鹿的时代，AV1和国产的AVS2对HEVC发起了挑战；WebRTC 1.0版定稿打通了在浏览器、移动端乃至IoT上的多媒体通信；AI、区块链技术的发展，正在与多媒体开发发生在化学反应，将成为推动生态发展的新力量。

640?wx_fmt=jpeg

2018年初的音视频技术生态并不平静，Codec的争夺进入群雄逐鹿的时代，AV1和国产的AVS2对HEVC发起了挑战；WebRTC 1.0版定稿打通了在浏览器、移动端乃至IoT上的多媒体通信；AI、区块链技术的发展，正在与多媒体开发发生在化学反应，将成为推动生态发展的新力量。与此同时，在线答题、在线抓娃娃、O2O与新零售等新的业务场景探索，赋予了新技术最好的实践环境。另外，新技术正在对安防、视频会议、社交、教育、金融等行业产生影响，甚至让行业生态重新洗牌。

8月25日·武汉 | LiveVideoStack联合斗鱼、即构科技、三体云、影普科技等多位大咖，共同探索新技术在音视频领域的实践，以及新兴应用场景和传统行业的突破。

讲师与话题

640?wx_fmt=png

郑伟斗鱼资深多媒体研发工程师

Speaker：斗鱼资深多媒体研发工程师、多媒体小组负责人、斗鱼架构委员会成员，早年从事电视芯片的软件研发，经历过嵌入式播放器的开发，移动时代的兴起也开始移动平台流媒体相关功能的开发。随着近年来AI技术的火热，也在积极探索将AI与传统流媒体相结合的实践。

Topic：AI赋能游戏直播内容识别的实践

斗鱼作为国内一流的游戏直播平台，每天都会有上万名主播直播，同时会生成海量的视频内容，传统的直播除了做内容审核以外，是不做内容的多次消费的。自从短视频兴起后，我们一直在思考一个问题，如何将我们平台海量的直播内容转化为点播内容？一种方案是直接提供主播的回看视频，另一种方案是基于AI的技术进行智能的直播流云剪辑。很显然第二种方案更好，这也是本次分享主要内容。

640?wx_fmt=jpeg

陈加忠华中科技大学计算机系统结构博士

Speaker：华中科技大学计算机系统结构博士，长期从事流媒体的研究与教学，擅长结合视频编码算法特点与硬件的指令集与流水线特征，提高视频编码算法的时间效率；擅长高效实现深度卷积网络的底层计算模块。2002年至2009年参加AVS标准制定视频工作组，曾经主持新加坡科技局ASTAR合作项目：ADI 561上的H.264视频流媒体服务器开发、北京现代信息科学与网络技术重点实验室开放基金：基于移动环境视频失真感知模型的质量体验提升、华为创新研究计划项目: 移动环境下图像处理技术研究。目前研究方向包括：深度学习、计算机视觉、图像与视频处理等。在研项目包括教育直播受众的人脸表情识别、直播敏感内容检测、图像中关键区域检测、中国移动用户大数据分析等。

Topic：多媒体应用中的视觉关注 Visual Attention in Multimedia Application

我们周围的世界包含了巨量的视觉信息，人眼能具有识别其中重要信息的能力，因此人们可以毫不费力地识别所处环境并无障碍地行走。视觉关注致力于让机器找出场景中人眼关注的区域，以解决和视觉相关的诸多媒体应用问题，如：广告投放位置选择、图像分割、目标识别、基于内容的图像检索、图像视频的压缩与传输、图像的适配显示、环境感知的手机节电模式优化等。

640?wx_fmt=jpeg

冼牛即构科技技术副总裁

Speaker：北京邮电大学计算机硕士，香港大学工商管理硕士，负责即构实时音视频引擎的开发与研究，专注视频直播、音视频社交、物联网和在线教育等行业。

Topic：实时音视频技术在跨国网络与教育场景中的应用

在线教育应用场景对实时音视频技术的要求可以用两个关键词来概括：稳定性和高质量。在线英语培训的场景中，稳定性就要求在跨国网络下做到高连通率，低延迟和不卡顿，跨国的实时视频云调度系统要充分考虑就近接入、负载均衡、动态路由、第一公里、最后一公里和节点之间智能调度的策略。在线乐器陪练的场景中，高质量就要求音视频技术能很好地还原音乐声，对回声消除、全带语音和噪音抑止等技术有极致的要求。谨借此机会，分享一下即构科技在在线英语培训场景和在线乐器陪练场景中的技术实践。

640?wx_fmt=png