音视频技术开发周刊 54期

简介: 『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。

640?wx_fmt=jpeg


『音视频技术开发周刊』由LiveVideoStack团队出品,专注在音视频技术领域,纵览相关技术领域的干货和新闻投稿,每周一期。点击『阅读原文』,浏览第54期内容,祝您阅读愉快。


策划 / LiveVideoStack


架构


如何看待Pensieve:MIT基于神经网络的流媒体码率自适应策略

今年的SIGCOMM上, MIT CSAIL的一支研究团队,发表了一篇名为Pensieve的工作,即利用神经网络优化码率自适应算法,用于提高媒体传输质量。本文对其进行了简单的介绍,并发表了一些看法。


李大龙:音视频技术是互联网品质生活的连接器

结识李大龙源于LiveVideoStackCon 2017,忙碌的工作让我们在会场擦肩而过,并相约一场采访。通过采访,我深深的感受到他对行业的执着与热情,他将音视频技术定义为互联网品质生活的连接器,而我们这些社区媒体不也是这些开发者与生态的连接器吗?


直播终端技术比较

目前,连麦直播的终端主要包括:原生APP、浏览器H5、浏览器WebRTC、微信小程序。浏览器上的应用包括H5和WebRTC,前者可以拉流观看,后者可以实现推流和拉流。


WebSocket Go

本文主要介绍了WebSocket 协议、WebSocket 的 Go 语言实现,以及 socket.io 服务端库的 Go 语言实现的理解。


WebRTC下的媒体网络连接STUN、TURN、UDP、TCP


WebRTC对等连接:连接不同设备上的浏览器

本文详细介绍了如何在不需要服务器的情况下(只需要在开始交互的时候使用服务器),使不同设备上的两个浏览器相互交流。


音频/视频技术


移形换影 - 短视频色彩特效背后的故事

本文介绍了腾讯云短视频(UGSV)众多视频特效中的一种——移形换影。


详解音视频中的DRM数字版权技术

本文首先简单介绍了当前移动端DRM的一些基本概念,并通过实例重点介绍了安卓视频开发的DRM处理。


Pensieve:AI带来的更流畅的高质量观看体验

麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)开发的基于机器学习的流媒体系统能更好的适应不同的网络条件,从而提供更加流畅的流媒体传输体验。LiveVideoStack对原文进行了摘译。


FFmpeg3.3.2+SDL2实现流媒体音频播放

本文介绍了如何通过FFmpeg+SDL实现简单的播放器效果。


编解码


视频编码与封装方式详解

本文为大家介绍了视频编码的方式、封装格式、以及标准两大系统,并指出几种常用的视频编码方式以及存储封装格式。


Zoe Liu:被Chrome Media团队的专注精神感染

在WebRTCon 2018期间,Google软件工程师Zoe Liu接受了LiveVideoStack社区编辑丁雪丰的采访。Zoe畅谈了AV1及VP9的现状与应用前景,以及从On2到Chrome Media坚持20多年做编解码研发的团队。


AVS2音频标准颁布,中国自主音视频标准比翼双飞

2018年6月7日,继AVS2视频部分2016年底颁布为国家标准后,我国第二代数字音频编码标准《信息技术 高效多媒体编码 第3部分:音频》(简称AVS2音频标准)将于2019年1月1日正式实施。


Android 基于FFmpeg开发简易播放器 - FFmpeg解封装


AI智能


深度学习AI美颜系列---AI瘦身效果算法揭秘

商汤基于深度学习研发了整套瘦身SDK,包括了瘦腿,瘦腰,瘦胳膊,瘦头型等等功能,并给出了酷炫的实时瘦身视频,惊艳到了众人!本文将以瘦腰和瘦腿为例,给大家详细讲解一下。


图像语义分割的工作原理和CNN架构变迁

图像分割是根据图像内容对指定区域进行标记的计算机视觉任务,本文聚焦于语义分割任务,即在分割图中将同一类别的不同实例视为同一对象。作者将沿着该领域的研究脉络,说明如何用卷积神经网络处理语义图像分割的任务。


从ISCA论文看AI硬件加速的新技巧

总得来说,专门针对ML/DNN的硬件架构已经是ISCA连续几年的热点了,经过大家的努力,对相关问题的挖掘已经越来越深。目前,对ML/DNN硬件加速技术的研究主要围绕提高Inference的处理效率展开。


图像


压缩效率第一!CVPR图像压缩挑战赛腾讯音视频实验室胜出

CVPR 2018 图像压缩挑战赛(CLIC)结果已经出炉,腾讯音视频实验室和武汉大学陈震中教授联合团队于该项挑战赛上取得压缩性能第一。


具有感兴趣区域的静止图像压缩编码算法研究

为了提高感兴趣区域的图像质量,在信道资源和存储空间有限的条件下,提出感兴趣区域的零树编码算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它对感兴趣区域图像和背景图像采用不同的压缩步骤,使感兴趣区域内的图像比背景图像具有更好的图像质量。


代码简单实现模拟噪声

本文介绍了图像噪声的概念、来源、几种常见的图像噪声形式以及如何通过代码简单实现模拟噪声。

相关文章
|
3月前
|
Kubernetes Linux 微服务
微服务轮子项目(42) -容器管理平台
微服务轮子项目(42) -容器管理平台
85 0
|
3月前
|
机器学习/深度学习 网络安全 算法框架/工具
在本地利用服务器显卡跑代码
在本地利用服务器显卡跑代码
121 0
|
10月前
|
机器学习/深度学习 自然语言处理 算法
NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法
NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法
NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法
|
4天前
|
人工智能 自然语言处理 搜索推荐
AiChat—智能办公助手
在当今的数字化时代,人工智能(AI)已经在各个领域中展现出了强大的能力和潜力。AI在许多方面都为我们的生活带来了便利,其中最显著的一点就是在我们的日常交流和工作中。 现在,最简单的低门槛软件应该是AiChat……
183846 7
AiChat—智能办公助手
|
4天前
|
数据采集 自然语言处理 监控
应用监控 eBPF 版:实现高效协议解析的技术探索
应用监控 eBPF 版:实现高效协议解析的技术探索
130934 0
|
9天前
|
开发工具 数据库 git
向量检索服务体验评测
通过一个实用的例子带你全方位了解向量检索服务DashVector
119966 1
|
17天前
|
弹性计算 运维 Linux
炸裂大合集 !零基础畅玩指南:从入门到精通,一文解锁幻兽帕鲁、雾锁王国之旅
本文从0开始介绍,包含基础电脑配置、购买、搭建等一步步完成,共历时5天。分别介绍了基于ECS+计算巢部署帕鲁和雾锁王国、计算巢运维服务详解、单独采用ECS服务器部署帕鲁和雾锁王国等,文章很长,但确实写的很用心,后期如有新的想法也会同步更新在这里。
269757 12
炸裂大合集 !零基础畅玩指南:从入门到精通,一文解锁幻兽帕鲁、雾锁王国之旅
|
3天前
|
弹性计算 安全 Linux
教你选择适合业务的云服务器ECS,适合自己业务的才是最好的
随着云计算技术的发展,越来越多的个人和企业开始使用云服务器ECS。但是,选择适合自己业务和需求的云服务器ECS并不容易,需要考虑多个因素。本文将介绍如何选择适合自己的云服务器ECS,并提供一些工作中总结的实用的建议。
24965 7
|
18天前
|
弹性计算 监控 区块链
全网最全的幻兽帕鲁服务器搭建教程—阿里云【保姆级/高性价比】
在近年来,随着区块链技术和元宇宙概念的兴起,游戏行业也开始进行全新的探索和变革。幻兽帕鲁作为一个区块链游戏,成为了玩家们热议的话题。在这个游戏世界中,玩家们可以捕捉、培养幻兽,与其他玩家进行战斗和交易。为了让更多玩家能够体验到幻兽帕鲁的魅力,我们特地整理了一份详细的服务器搭建教程,让你在家也能轻松搭建自己的幻兽帕鲁服务器。
159715 21
|
19天前
|
弹性计算 运维 数据安全/隐私保护

相关产品