走进武汉,探索多媒体开发最佳实践

简介: 2018年初的音视频技术生态并不平静,Codec的争夺进入群雄逐鹿的时代,AV1和国产的AVS2对HEVC发起了挑战;WebRTC 1.0版定稿打通了在浏览器、移动端乃至IoT上的多媒体通信;AI、区块链技术的发展,正在与多媒体开发发生在化学反应,将成为推动生态发展的新力量。

640?wx_fmt=jpeg


2018年初的音视频技术生态并不平静,Codec的争夺进入群雄逐鹿的时代,AV1和国产的AVS2对HEVC发起了挑战;WebRTC 1.0版定稿打通了在浏览器、移动端乃至IoT上的多媒体通信;AI、区块链技术的发展,正在与多媒体开发发生在化学反应,将成为推动生态发展的新力量。与此同时,在线答题、在线抓娃娃、O2O与新零售等新的业务场景探索,赋予了新技术最好的实践环境。另外,新技术正在对安防、视频会议、社交、教育、金融等行业产生影响,甚至让行业生态重新洗牌。  


8月25日·武汉 | LiveVideoStack联合斗鱼、即构科技、三体云、影普科技等多位大咖,共同探索新技术在音视频领域的实践,以及新兴应用场景和传统行业的突破。


讲师与话题


640?wx_fmt=png

郑伟 斗鱼资深多媒体研发工程师


Speaker:斗鱼资深多媒体研发工程师、多媒体小组负责人、斗鱼架构委员会成员,早年从事电视芯片的软件研发,经历过嵌入式播放器的开发,移动时代的兴起也开始移动平台流媒体相关功能的开发。随着近年来AI技术的火热,也在积极探索将AI与传统流媒体相结合的实践。


Topic:AI赋能游戏直播内容识别的实践


斗鱼作为国内一流的游戏直播平台,每天都会有上万名主播直播,同时会生成海量的视频内容,传统的直播除了做内容审核以外,是不做内容的多次消费的。自从短视频兴起后,我们一直在思考一个问题,如何将我们平台海量的直播内容转化为点播内容?一种方案是直接提供主播的回看视频,另一种方案是基于AI的技术进行智能的直播流云剪辑。很显然第二种方案更好,这也是本次分享主要内容。


640?wx_fmt=jpeg

陈加忠 华中科技大学计算机系统结构博士


Speaker:华中科技大学计算机系统结构博士,长期从事流媒体的研究与教学,擅长结合视频编码算法特点与硬件的指令集与流水线特征,提高视频编码算法的时间效率;擅长高效实现深度卷积网络的底层计算模块。2002年至2009年参加AVS标准制定视频工作组,曾经主持新加坡科技局ASTAR合作项目:ADI 561上的H.264视频流媒体服务器开发、北京现代信息科学与网络技术重点实验室开放基金:基于移动环境视频失真感知模型的质量体验提升、华为创新研究计划项目: 移动环境下图像处理技术研究。目前研究方向包括:深度学习、计算机视觉、图像与视频处理等。在研项目包括教育直播受众的人脸表情识别、直播敏感内容检测、图像中关键区域检测、中国移动用户大数据分析等。


Topic:多媒体应用中的视觉关注 Visual Attention in Multimedia Application


我们周围的世界包含了巨量的视觉信息,人眼能具有识别其中重要信息的能力,因此人们可以毫不费力地识别所处环境并无障碍地行走。视觉关注致力于让机器找出场景中人眼关注的区域,以解决和视觉相关的诸多媒体应用问题,如:广告投放位置选择、图像分割、目标识别、基于内容的图像检索、图像视频的压缩与传输、图像的适配显示、环境感知的手机节电模式优化等。

640?wx_fmt=jpeg

冼牛 即构科技技术副总裁


Speaker:北京邮电大学计算机硕士,香港大学工商管理硕士,负责即构实时音视频引擎的开发与研究,专注视频直播、音视频社交、物联网和在线教育等行业。


Topic:实时音视频技术在跨国网络与教育场景中的应用


在线教育应用场景对实时音视频技术的要求可以用两个关键词来概括:稳定性和高质量。在线英语培训的场景中,稳定性就要求在跨国网络下做到高连通率,低延迟和不卡顿,跨国的实时视频云调度系统要充分考虑就近接入、负载均衡、动态路由、第一公里、最后一公里和节点之间智能调度的策略。在线乐器陪练的场景中,高质量就要求音视频技术能很好地还原音乐声,对回声消除、全带语音和噪音抑止等技术有极致的要求。谨借此机会,分享一下即构科技在在线英语培训场景和在线乐器陪练场景中的技术实践。


640?wx_fmt=png

李幸原 三体云实时视频高级工程师


Speaker:北京工业大学硕士,7年视频编解码,流媒体研发经历,曾经主导了无线桌面共享系统,移动远程医疗平台的架构设计和研发,参与过大型互联网直播项目,对视频编解码,流媒体,软硬件协同设计等有浓厚的兴趣。


Topic:低延时实时视频通信


音视频实时通讯的应用场景已经随处可见,从游戏语音对讲、直播连麦,到答题组队开黑。对于开发者而言,除了关注如何能快速实现不同应用场景的实时视频通讯,更需要关注的就是用户体验,而其中低延时无疑是重点。本次分享将从三体云实时视频通信架构详细讲解低延时技术实现与难点分析。


640?wx_fmt=jpeg

吉长江 影普科技创新研发中心负责人


Speaker:创新研发中心负责技术的研究开发,科研、专利项目的申报,新技术的推广与应用,解决重大技术难题,组织技术攻关等。负责人吉长江是中科大少年班毕业,在视频技术领域拥有多项发明专利。


Topic:基于语义与几何的视频植入


精美礼品


我们在现场准备了精美的礼品,现场参与的小伙伴还有机会赢得LiveVideoStackCon 2018音视频技术大会的门票、热门技术图书《数字视频处理》。


  • LiveVideoStackCon 2018音视频技术大会门票

  • 《数字视频处理》英文原版

  • 马克杯

  • T恤

  • LiveVideoStack抱枕

  • 数据线

  • 笔记本

  • 拖鞋


640?wx_fmt=png


购买VIP票的小伙伴更有机会参加讲师交流晚宴。点击【阅读原文】报名。

相关文章
uniapp input框监听回车搜索事件效果demo(整理)
uniapp input框监听回车搜索事件效果demo(整理)
基于IEEE802.11g标准的OFDM信号帧检测matlab仿真
此项目旨在应对无线信号识别挑战,利用MATLAB/Simulink开发IEEE 802.11g OFDM信号识别算法。通过对标准的深入研究,设计并计算PLCP前导码数据,采用信号相关性进行信号鉴定。项目构建了完整的发射机模型,在AWGN信道下评估性能。通过生成特定的短训和长训序列,实现帧头检测,并模拟真实信号传输。测试使用MATLAB 2022a版本,展示了信号生成与识别的关键步骤及结果。
|
消息中间件 Kafka
|
2天前
|
云安全 人工智能 自然语言处理
AI说的每一句话,都靠谱吗?
阿里云提供AI全栈安全能力,其中针对AI输入与输出环节的安全合规挑战,我们构建了“开箱即用”与“按需增强”相结合的多层次、可配置的内容安全机制。
|
6天前
|
存储 人工智能 安全
AI 越智能,数据越危险?
阿里云提供AI全栈安全能力,为客户构建全链路数据保护体系,让企业敢用、能用、放心用
|
9天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
3天前
|
消息中间件 安全 NoSQL
阿里云通过中国信通院首批安全可信中间件评估
近日,由中国信通院主办的 2025(第五届)数字化转型发展大会在京举行。会上,“阿里云应用服务器软件 AliEE”、“消息队列软件 RocketMQ”、“云数据库 Tair”三款产品成功通过中国信通院“安全可信中间件”系列评估,成为首批获此认证的中间件产品。此次评估覆盖安全可信要求、功能完备性、安全防护能力、性能表现、可靠性与可维护性等核心指标,标志着阿里云中间件产品在多架构适配与安全能力上达到行业领先水平。
303 192
|
3天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
357 167