Xilinx+AWS F1+VP9带来30倍实时转码性能提升

简介: 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/83052924 ...
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/83052924

640?wx_fmt=jpeg


在实时、海量、高并发视频的场景下,FPGA加速找到了自己的发展空间,弥补了VP9在编码复杂度方面的不足,专利费的优势也得以体现。


文 / Ant


在上周圣何塞举行的XDF(Xilinx开发者论坛)上(视频回放 https://www.xilinx.com/video/events/xdf-2018-silicon-valley-keynote.html#t=16m13s),Twitch Principal Research Engineer 沈悦时分享了如何通过一系列方案提升实时编码效率,并降低带宽使用。Twitch使用了AWS F1 FPGA集群,这个集群使用了Xilinx+NGCodec方案,Codec采用了VP9,整体下来为Twitch节省了25%的带宽,性能(1080p编码帧率)是CPU方案的30倍。


Twitch为什么没有采用HEVC方案?NGCodec的CEO Oliver Gunasekara在NAB2018上接受Jan Ozer采访时表示


高端市场倾向于使用HEVC编码器。众所周知,苹果公司支持使用HEVC编码器。iPhone手机非常受欢迎,但是由于Android和Chrome用户群不断增长,目前大众市场正在大量使用VP9编码器,事实上几乎所有的芯片组都同时支持这两种编码器。


同样是游戏直播平台,国内的熊猫TV选择了金山云的HEVC方案


在主播端,VP9编码速度很慢,比HEVC还慢,因为几乎没有硬件厂商支持VP9硬编码。在观看端,苹果公司明确支持HEVC,不支持VP9。


作为VP9的下一代AV1至少要在2020年才有硬件加速方案,由于其较高的计算复杂度,通过FPGA加速看上去是比较理性的方案,ASIC方案成熟则需要更长的时间。


在10月19-20日北京举行的LiveVideoStackCon 2018上,沈悦时会参与“成本与QoE”圆桌讨论,你可以在现场向他发文。同台讨论的还有


爱奇艺 高级技术总监庹虎


OnVideo视频创作云平台 联合创始人 刘歧


金山云 高级总监 武爱敏


Hulu 高级软件开发经理 傅德良 


此外,Xilinx Sr.Marketing Mgr Sean Gardner和Xilinx Chief Video IP Solutions Architect Johan Janssen还会在会上分享Xilinx在FPGA加速的视频编码/转码方面的最新演进。



640?wx_fmt=jpeg

相关文章
|
9月前
|
数据可视化 物联网 PyTorch
双卡3090消费级显卡 SFT OpenBuddy-LLaMA1-65B 最佳实践
OpenBuddy继接连开源OpenBuddy-LLaMA1-13B、OpenBuddy-LLaMA1-30B后,8月10日,一鼓作气发布了650亿参数的大型跨语言对话模型 OpenBuddy-LLaMA1-65B。
|
6月前
|
算法 数据库 异构计算
Milvus 2.3.功能全面升级,核心组件再升级,超低延迟、高准确度、MMap一触开启数据处理量翻倍、支持GPU使用!
Milvus 2.3.功能全面升级,核心组件再升级,超低延迟、高准确度、MMap一触开启数据处理量翻倍、支持GPU使用!
Milvus 2.3.功能全面升级,核心组件再升级,超低延迟、高准确度、MMap一触开启数据处理量翻倍、支持GPU使用!
|
8月前
|
数据采集 编解码 数据处理
Android平台如何高效率实现GB28181对接?
GB28181协议是一种用于设备状态信息报送的协议,可以在不同设备之间进行通信和数据传输。
|
12月前
|
机器学习/深度学习 算法 PyTorch
兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了(2)
兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了
170 0
|
12月前
|
机器学习/深度学习 数据采集 算法
兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了(1)
兼容PyTorch,25倍性能加速,国产框架OneFlow「超速」了
153 0
|
12月前
|
机器学习/深度学习 人工智能 PyTorch
PyTorch宣布支持苹果M1芯片GPU加速:训练快6倍,推理提升21倍
PyTorch宣布支持苹果M1芯片GPU加速:训练快6倍,推理提升21倍
866 0
|
机器学习/深度学习 存储 人工智能
英特尔推出两款 7nm AI 芯片,内存高达 96GB HBM2e,训练成本更低
当地时间 5 月 10 日,英特尔举办了 2022 英特尔 On 产业创新峰会。在此次峰会上,英特尔公布了其在芯片、软件和服务方面取得的多项进展,并宣布了包括第 12 代英特尔酷睿 HX 处理器家族、阿波罗计划、Greco AI 加速芯片在内的一系列重大发布。
233 0
英特尔推出两款 7nm AI 芯片,内存高达 96GB HBM2e,训练成本更低
|
算法 安全 搜索推荐
4364Mb/s,助力SM4性能提升40倍的商密 SIG 还有哪些新进展?
商密软件栈 SIG 月报来了,看看本月都有哪些新进展。
4364Mb/s,助力SM4性能提升40倍的商密 SIG 还有哪些新进展?
|
tengine 弹性计算 运维
性能提升一倍!云原生网关支持 TLS 硬件加速
业界在优化 HTTPS 的性能上也做了诸多探索,传统的软件优化方案有 Session 复用、OCSP Stapling、False Start、dynamic record size、TLS1.3、HSTS 等, 但软件层面如何优化也无法满足流量日益增长的速度,加上 CPU 摩尔定律已入暮年,使得专用硬件卸载 CPU 密集型运算成为业界一个通用解决方案。
1312 1
性能提升一倍!云原生网关支持 TLS 硬件加速
|
编解码 弹性计算 视频直播
ASIC视频转码最佳实践
本最佳实践适用于需要做视频转码的客户,通过使用阿里云video-trans云主机,利用实例上的12块ASIC芯片实现高效率的转码能力。本方案适用于视频直播领域视频转码服务。
ASIC视频转码最佳实践