暂时未有相关云产品技术能力~
暂无个人介绍
本文探讨了Debug Headers的常见优点,所能提供的信息,为CDN调试的相关内容提供全面指导。
视频传输延迟,尤其是在某些互动社交环境中,会严重影响用户的体验。Instagram多年来以降低视频上传延迟为重要指标,实现了多种优化策略。本文来自Instagram媒体基础设施团队软件工程师Ryan Peterman。
李智说,用数学来理解世界可能是每一个理工男的梦想吧。从思科到Netflix,李智一直希望通过数学的方法改善用户的体验。如今他正在在负责开源项目VMAF,希望通过这一项目帮助更多平台改善用户观看体验。
去年12月,在Alta风景如画的谷歌园区见到了许耀武。第一次造访谷歌,与Codec领军人物会面让人充满期待和压力,直到看到耀武脸上的笑容,压力才散去。在他身上,散发着坚定、自信。在一家公司专注Codec研发二十年激起了我的好奇心,也许通过采访可以找到这背后的原因。
历时两年,张武锋和他的团队完成了VIPKID的RTC平台自研1.0到2.0的演进,并正在开发3.0版,经历了来自用户习惯的无情碾压,内测过程中信心满满,线上事故的至暗时刻。LiveVideoStack对VIPKID音视频技术负责人张武锋进行了邮件采访,并整理成文。
为了抢占实时视频的巨大市场,英特尔开源了WebRTC开发套件,并将其命名为Open WebRTC Toolkit (OWT)。由于实时视频编码、转码需要大量的计算资源,Open WebRTC Toolkit将为英特尔带来巨大的潜在商业回报。
近期,Google与Binomial宣布合作开源Basis Universal GPU纹理编解码器,在保持GPU性能效率的同时,提升Web、桌面端与移动应用程序中图像传输的性能。本文来自Google开源博客。
Cloudflare针对HTTP/2优先级的进一步优化,将网页控制权尽可能地交给网站所有者,可根据具体需求与场景,定制化网页加载优先级策略,提供更快速,更优质的用户Web访问与交互体验。
四月初,英特尔和Netflix宣布联合开发了一款名为SVT-AV1的视频编码器软件。可扩展视频技术(SVT)是英特尔的开源框架,它为可视化云技术的开发人员提供了高性能的视频编码软件库。本文将介绍Netflix迄今为止在SVT-AV1积累的经验,以及如何能让您也能参与到这一开发中来。本文来自Netflix技术博客,LiveVideoStack对原文进行摘译。
自适应音频码率可以提升用户的主观体验,并且不会降低视频观看体验。本文来自Netflix科技博客,详细阐述了自适应音频带来的好处以及如何处理各种难点。
资深编解码技术专家Jan Ozer撰文总结描述了其在NAB 2019大会中的见闻,文章介绍了CAE视频编码的几种阶梯展现,以及如何减少带宽并提高体验质量。
「新内容,新交互」全球视频云创新挑战赛,视频玩家挑战计划开始啦!
如何应对视频直播中复杂多样的用户网络环境,提高视频服务质量是各直播服务平台面临的一大难题。Twitch提出了一种无监督学习的方法,全面评估用户观看时的行为与体验,预测用户的网络状况,通过码率自适应的方法实现快速的迭代升级从而提高服务质量。本文来自Twitch Principal Research Engineer沈悦时在LiveVideoStackCon 2018中的分享,并由LiveVideoStack整理而成。
内容自适应编码(CAE)产生的是动态码率(VBR)视频流,根据内容复杂性为视频分配所需的码率从而让“编码质量”与“码率/带宽/存储空间”达到最佳平衡,为用户提供最佳的体验质量。
通过收集网络传输的数据,并采用更接近主观主观评价的客观评价方式,可以有效反映QoS的水平,从而帮助运营方改进服务。
FreeSWITCH是一个开源的软交换平台,具有模块化结构,支持包括WebRTC在内的多种互通互联。本文来自FreeSWITCH 中文社区创始人杜金房在LiveVideoStack线上交流分享中的演讲,详细介绍了FreeSWITCH的功能特性、架构以及现状。
为提升用户观看体验,LinkedIn视频团队一直努力完善其视频自动播放功能。本文概述了LinkedIn自动播放产品标准,以及为实现此标准所开发的技术与架构。
为提升用户观看体验,LinkedIn视频团队一直努力完善其视频自动播放功能。本文概述了LinkedIn自动播放产品标准,以及为实现此标准所开发的技术与架构。
AV1最初发布时,编码速度缓慢,时间过长,严重影响编码器的可用性。随着不断的优化,其编码时间已经有很大改进,几乎可以使用。
Akamai的Smooth Delivery计划旨在通过两个部分:Pacing+Rate Limiting 增强网络性能,在提高整体网络性能的同时,每个部分都侧重于减少拥塞。
本文来自熊猫直播基础研发部的投稿,是熊猫直播P2P分享率优化系列文章的第二篇,第一篇请访问这里。本文授权LiveVideoStack发布,重点展示了熊猫直播通过ASN组网提升P2P分享率的实践。
本文来自熊猫直播基础研发部的投稿,是熊猫直播P2P分享率优化系列文章的第一篇。本文已授权LiveVideoStack发布,重点展示了熊猫直播通过IP组网提升P2P分享率的探索。
在LiveVideoStackCon2018音视频技术大会上,快手音视频技术负责人于冰分享了题为《用户导向的音视频体验优化》的主题演讲,从用户的角度来去谈音视频的体验优化。
近日,Mozilla发布了当前可使用的,规模最大的公共语音数据集Common Voice,数据集涵盖18种语言,由42000多名贡献者提供的近1400小时的语音数据构成。
本文来自Netflix技术博客,讲述了相机和电影行业如何通过技术手段还原图像与视频的原始色彩的。在现代电影制作过程中,这些技术被数字化了。感谢快手视频和图像算法团队的翻译与技术审校。
在多用户视频会议媒体服务器的部署中采用级联结构可有效降低端到端的媒体延迟,改善媒体质量。来自Jitsi团队的Boris Grozev深入描述了级联SFU问题,并展示了他们的方法以及他们遇到的一些挑战。LiveVideoStack对文章进行了翻译,感谢WebRTC专家刘连响的技术审校。
TCP协议是互联网应用最广泛的数据传输协议之一,在过去的40年中改变了世界,但也成为了新的技术瓶颈。Cascade Range Networks, Inc CTO/联合创始人 范醒哲在LiveVideoStack线上交流分享中详细解析了TCP面临的困境与可行的解决方案。本文由LiveVideoStack整理而成。
LinkedIn通过在视频播放过程中收集的大量数据,对多种视频指标进行实验以提高视频性能,改善用户体验。本文来自LinkedIn工程博客,LiveVideoStack对文章进行了翻译。
互动直播已经逐渐成为直播的主要形式。映客直播资深音视频工程师叶峰峰在LiveVideoStackCon 2018大会的演讲中详细介绍了INKE自研连麦整体设计思路、如何基于WebRTC搭建互动直播SDK以及针对用户体验进行优化。本文由LiveVideoStack整理而成。
本文来自北京大学信息科学技术学院教授马思伟在LiveVideoStackCon 2018大会上的演讲,详细介绍了最新一代VVC和AVS3视频编码标准进展,包括关键技术特色以及未来的应用展望。
与VP8相比,VP9进行了大量的设计改进以尽可能的获得更高的视频编码质量。Google软件工程师 姜健详细介绍了VP9可适性视频编码(SVC)中多种新功能的实现与相应API。本文来自姜健在LiveVideoStack 线上交流分享,并由LiveVideoStack整理而成。
舞台现场直播由于场景复杂度高,对各环节的可靠性要求也非常高。YY音视频技术专家朱明亮在LiveVideoStack线上交流分享中结合YY直播实践详细解析了直播中涉及的视频采集卡编程,软硬件编码,视频滤镜处理等内容。本文由LiveVideoStack整理而成。
Netflix会定期评估现有和即将推出的视频编解码器,不断优化视频编码技术以提供更高质量的服务。本文介绍了视频编码器性能评估中的几项重要元素以及如何从传统与自适应流媒体两种视角进行编解码器性能对比。本文来自Netflix技术博客,LiveVideoStack进行了翻译。
源码分析基于 FFmpeg 4.1 版本。
libswscale 是 FFmpeg 中完成图像尺寸缩放和像素格式转换的库。
libswscale 是 FFmpeg 中完成图像尺寸缩放和像素格式转换的库。用户可以编写程序,调用 libswscale 提供的 API 来进行图像尺寸缩放和像素格式转换。也可以使用 scale 滤镜完成这些功能,scale 滤镜实现中调用了 libswscale 的 API。libswscale 的 API 非常简单,就一个 sws_scale() 接口,但内部的实现却非常复杂。
FLV (Flash Video) 是由 Adobe 公司推出的一种封装格式,主要用于流媒体系统。FLV 封装的媒体文件具有体积轻巧、封装播放简单等特点,很适合网络应用。目前各浏览器普遍使用 Flash Player 作为网页播放器,使得安装有浏览器的计算机终端不需要另外安装播放器,这也是 FLV 格式广为流行的原因之一。
流媒体 (streaming media) 是指将一连串的媒体数据压缩后,经过网络分段发送数据,在网络上即时传输影音以供观赏的一种技术与过程,此技术使得数据包得以像流水一样发送;如果不使用此技术,就必须在使用前下载整个媒体文件。
基于 FFmpeg 4.1 版本。
基于 FFmpeg 4.1 版本。
基于FFmpeg 4.1版本。
基于 FFmpeg 4.1 版本。
I 帧:I 帧(Intra-coded picture, 帧内编码帧,常称为关键帧)包含一幅完整的图像信息,属于帧内编码图像,不含运动矢量,在解码时不需要参考其他帧图像。因此在 I 帧图像处可以切换频道,而不会导致图像丢失或无法解码。I 帧图像用于阻止误差的累积和扩散。在闭合式 GOP 中,每个 GOP 的第一个帧一定是 I 帧,且当前 GOP 的数据不会参考前后 GOP 的数据。
转封装是将一种封装格式转换为另一种封装格式,不涉及编解码操作,转换速度非常快。
复用(mux),是 multiplex 的缩写,表示将多路流(视频、音频、字幕等)混入一路输出中(普通文件、流等)。
解复用(demux),表示从一路输入中分离出多路流(视频、音频、字幕等)。
封装格式(container format)可以看作是编码流(音频流、视频流等)数据的一层外壳,将编码后的数据存储于此封装格式的文件之内。封装又称容器,容器的称法更为形象,所谓容器,就是存放内容的器具,以一瓶饮料为例,饮料是内容,那么装饮料的瓶子就是容器。
overlay 技术又称视频叠加技术。overlay 视频技术使用非常广泛,常见的例子有,电视屏幕右上角显示的电视台台标,以及画中画功能。画中画是指在一个大的视频播放窗口中还存在一个小播放窗口,两个窗口不同的视频内容同时播放。
在 FFmpeg 中,滤镜(filter)处理的是未压缩的原始音视频数据(RGB/YUV视频帧,PCM音频帧等)。一个滤镜的输出可以连接到另一个滤镜的输入,多个滤镜可以连接起来,构成滤镜链/滤镜图,各种滤镜的组合为 FFmpeg 提供了丰富的音视频处理功能。
本文基于FFmpeg 4.1版本。