英伟达发布Tesla P4&P40两款基于Pascal架构的深度学习芯片

简介:

9月13日,NVIDIA(英伟达)在北京国际饭店会议中心召开GTC China 2016大会。GTC是全球最大最权威的 GPU 开发者和行业大会,展示各行业中运用 GPU 技术最重要的创新成果。在会上,NVIDIA发布了Tesla P4和Tesla P40两款Pascal架构GPU。本次集成了72亿个晶体管的Tesla P4(2560个CUDA核心)和120亿个晶体管的Tesla P40(3840个CUDA核心)是用来让用户识别和查询语音、图像或文本的。

Tesla P4&P40的性能相当于40个CPU,响应速度是CPU解决方案的45倍。同时,Pascal架构能助推深度学习加速65倍,最新一代的架构Pascal是首个专为深度学习而设计的GPU。

今年4月,NVIDIA推出过Tesla P100加速卡,它是用于执行深度学习神经网络任务的。速度是英伟达之前高端系统的12倍,研发费用高达20亿美元,单个芯片上集成了150亿个晶体管,是后续即将推出的DGX-1 深度学习系统的核心组成部分。Tesla P100主攻学习和训练任务,而Tesla P4&P40主要负责图像、文字和语音识别。

人工智能和深度学习驱使高端芯片达到前所未有的发展,他们将为人工智能提供最基础的服务,如语音援助、电子邮件过滤器、电影和产品推荐引擎等。现在人工智能将会像电能一样,给世界带来巨大的改变。Tesla P40将在10月上市,而Tesla P4将在11月。


本文转自d1net(转载)

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
5天前
|
机器学习/深度学习 API 语音技术
|
5天前
|
机器学习/深度学习 自然语言处理 算法框架/工具
Python 深度学习架构实用指南:第三、四、五部分(2)
Python 深度学习架构实用指南:第三、四、五部分(2)
58 1
|
5天前
|
机器学习/深度学习 搜索推荐 TensorFlow
Python 深度学习架构实用指南:第一、二部分(3)
Python 深度学习架构实用指南:第一、二部分(3)
58 2
|
5天前
|
机器学习/深度学习 人工智能 算法
Python 深度学习架构实用指南:第三、四、五部分(4)
Python 深度学习架构实用指南:第三、四、五部分(4)
39 1
|
5天前
|
机器学习/深度学习 人工智能 TensorFlow
Python 深度学习架构实用指南:第一、二部分(1)
Python 深度学习架构实用指南:第一、二部分(1)
127 2
|
5天前
|
机器学习/深度学习 Web App开发 自然语言处理
Python 深度学习架构实用指南:第三、四、五部分(1)
Python 深度学习架构实用指南:第三、四、五部分(1)
31 0
|
5天前
|
机器学习/深度学习 PyTorch API
|
5天前
|
机器学习/深度学习 语音技术 算法框架/工具
|
5天前
|
机器学习/深度学习 人工智能 并行计算
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
|
5天前
|
机器学习/深度学习 固态存储 TensorFlow
Python 深度学习架构实用指南:第一、二部分(5)
Python 深度学习架构实用指南:第一、二部分(5)
48 1