关于AI与高性能计算加速融合，这里有英伟达最新的4个应用案例

2018-01-09 1441

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本文来自AI新媒体量子位（QbitAI）

4d6ce6b8fb3ad3ef8e9cee23928643d3a1343be9

AI和高性能计算正在加速交织融合。

最近的例证来自2017中国高性能计算(HPC)年会，在会上，AI成为了最核心话题。

英伟达对此肯定有更深体会，除了GTC China(GPU技术大会)大谈特谈的AI计算加速，此次他们还展出了不少高性能计算方面的产品和应用。

比如大规模提供实时、低延迟视频分析的DeepStream SDK、可视化实时仿真软件Discovery Live、超分辨率分析算法，以及个人AI超算机DGX Station。

虽然有些已算不上是新产品，但都有一些新进展。

不妨跟随身处前方的量子位，一起看看。

实时30路视频解码：DeepStream

82af26a4ded487f7d92fda0f5640cf213e28ffe9

△ DeepStream演示

GTC China上，英伟达创始人黄仁勋正式推出了该款基于GPU的视频解码及分析的SDK，而在HPC现场，英伟达中国工程师介绍了更多台前幕后的消息。

这是一款完全来自中国研发团队的产品，以5、6个人为核心的北京团队，进行了5个月集中研发。最终结果可以同时实现30路高清视频解码、实时分析和元数据提取。

具体工作原理方面，基于1块GPU卡（比如P4），先完成720p视频的解码，然后通过深度学习算法提取研发需要的元素，比如自动驾驶中的人、车和物。

英伟达工程师也强调，DeepStream的研发的目的主要是为了帮助CV项目的快速产品化。英伟达的核心想法在于展示GPU的解码性能和计算能力，并测试性能极限，此外希望更多用户直接通过GPU部署视频的深度学习应用。

可视化实时仿真：Discovery Live

4a901a2d7c5663c3df645eb8cd5871e69f7ff3a1

△ Discovery Live演示效果

另一个展示的是即将推出的可视化实时仿真软件。这是Ansys公司和英伟达历时4年，利用CUDA制作的一款叫做Discovery Live的软件。

该软件将主要面向CAD设计师，利用仿真来驱动设计，支持流体、结构和热仿真应用，能帮助工程师尝试不同的设计理念，并得到即时反馈。

此前，传统的设计流程是先进行三维模型的设计，最后利用CAE软件验证设计模型的可靠性，若在验证的过程中发现设计存在的缺陷再回头修改设计，是一个重复的过程。

不过，如果CAE工程师在设计产品的前期，或者产品概念设计阶段，能够进行快速的仿真模拟，就可以让设计师更快选择设计思路和设计选型。

而且这同样是GPU性能上一次展示，在GPU海量并行特性基础上打造全新的仿真技术。NVIDIA GPU提供超级计算功能，当结合Discovery Live的工程仿真创新时，其求解速度比传统方法快数千倍。

过去，这种仿真模拟需要通过高性能计算的平台完成，并且借助此类工作站进行可视化；现在，ANSYS Discovery Live充分发挥NVIDIA GPU和CUDA并行计算的能力，首次打造具有可视化仿真的实时设计环境，工作效率将被大大提升。

现场，英伟达工程师展示了一款车设计中关于物理场悉数调整中的实时可视化演示，Discovery Live将CAE设计中的计算过程可视化，可以实时看到风、粒子等物理场变化带来的效果变化。

超分辨率分析

e5c07b39d04887e3a7eb794560390e9dbb405a68

△ 超分辨率分析演示

除了直接软件产品形态的DeepStream和Discovery Live，英伟达还展出了通过GPU实现的前沿深度学习算法研究，比如超分辨率算法。

超分辨率Demo，顾名思义就是对视频网站中的低分辨率视频进行处理，通过深度学习（底层用生成对抗网络）生产一个高清晰版本。由于高清晰版本中的图片、视频相当于是深度学习算出来的，所以对于硬件要求比较高，这也是整体实现中的难点所在。

不过，超分辨率算法开发还较为初步，英伟达工程师称，未来进一步的工作在于用更经济快速的方法实现好的效果，或者其他的方式以帮助到用户，然后提高他们产品的质量、提升体验。

个人AI超算机：DGX Station

726acffa38857a57503b259290b2109cb4c79750

△ 个人AI超算机：DGX Station

最后展出的是一款之前发布的硬件一体机：专门针对个人设计的超级计算机。

之前发布时也介绍过，DGX Station在架构方面配置了4个Volta架构的V100 GPU，GPU之间用NVLink高速带宽连接起来，性能可高达480 TeraFlops，大约相当于124台CPU服务器实现的效果。

此外，由于定位是办公室场景，英伟达方面还在DGX Station设计上花了一点心思：运用水冷设计实现静音，可达到35分贝低噪音。

英伟达方面也在此次展示中首次公开了售价：6.9万美元，主要面向高校、研究所，以及有需求的企业。

英伟达方面透露，除了高校和研究所，目前也有一些企业客户表达了意向，即便在云计算趋势如此明确的今天，个人工作站也不是完全没有市场，而且DGX Station中还有不少深度学习软件的预装。

“它是专门针对深度学习推出来的，也非常适合一些企业。因为有些企业的IT力量可能相对薄弱点，我们这款产品不光有硬件，而且软件都预装好了，开机只要经过简单设置，就可以用Caffe、TensorFlow等做深度学习的训练，图像识别也好，语音识别也好，而无需花费大量的时间自己去配置软件、装驱动、SDK等等。”英伟达工程师介绍说。

— 完 —

本文作者：李根

原文发布时间：2017-10-25

关于AI与高性能计算加速融合，这里有英伟达最新的4个应用案例

实时30路视频解码：DeepStream

可视化实时仿真：Discovery Live

超分辨率分析

个人AI超算机：DGX Station

量子位

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

关于AI与高性能计算加速融合，这里有英伟达最新的4个应用案例

实时30路视频解码：DeepStream

可视化实时仿真：Discovery Live

超分辨率分析

个人AI超算机：DGX Station

量子位

热门文章

最新文章

相关课程

相关电子书

相关实验场景