人工智能爆点:浪潮发布新版Caffe-MPI,较谷歌TensorFlow 性能翻倍!

简介:

5月9日,浪潮在美国圣何塞举行的2017 GPU技术大会(GTC17)上发布了新一代并行深度学习计算框架Caffe-MPI。测试数据显示,在基于国际通行的Imagenet数据集进行深度学习模型训练时,Caffe-MPI表现出良好的并行扩展,其性能是Google最新深度学习框架TensorFlow的近两倍。Caffe-MPI是全球首个集群并行版的Caffe深度学习计算框架,由浪潮主导开发并已在Github上开源公布所有代码。

人工智能爆点:浪潮发布新版Caffe-MPI,较谷歌TensorFlow 性能翻倍!

浪潮GTC17发布新一代Caffe-MPI现场

人工智能爆点:浪潮发布新版Caffe-MPI,较谷歌TensorFlow 性能翻倍!

浪潮新一代Caffe-MPI与TensorFlow实测数据对比

Caffe和TensorFlow是当今全球最流行的两个开源深度学习框架。Caffe由美国加州大学伯克利分校开发,是世界第一个工业级深度学习框架,但其架构不够灵活扩展性较差;TensorFlow是Google开发的深度学习框架,已经被广泛使用在Google的搜索、图像识别及邮箱等业务。

浪潮开发的Caffe-MPI保留了伯克利版本Caffe架构的优良特性,同时又针对高性能计算系统设计使之具备良好的并行扩展性。新版本Caffe-MPI在4节点16块GPU卡集群系统上训练性能较单卡提升13倍,其每秒处理图片数量是同配置集群运行的TensorFlow 1.0的近2倍。

Caffe-MPI在性能上的出色表现得益其在并行算法设计上的创新突破。Caffe-MPI设计了两层通信模式:节点内的GPU卡间通信及节点间的RDMA全局通信,这极大降低了网络通信的压力,并克服了传统通信模式中PCIE与网络之间带宽不均衡的影响,这样的设计方式非常适合现在的高密度GPU服务器,同时Caffe-MPI还设计实现了计算和通信的重叠。此外,新版本Caffe-MPI提供了更好的cuDNN兼容性,用户可以无缝调用最新的cuDNN版本实现更大的性能提升。

在本次GTC大会上,浪潮全面展示了面向人工智能用户完整的AI产品解决方案,包括全球首个2U空间内支持8块NVLink或PCI-E 接口P100 GPU的人工智能超级计算机AGX-2、浪潮联合百度研发的支持单机16块GPU卡扩展的SR-AI整机柜服务器,以及人工智能深度学习集群管理软件AIStation和并行深度学习框架Caffe-MPI等创新产品技术。

人工智能深度学习是浪潮智慧计算三大支柱业务之一。浪潮新财年宣布成立人工智能部门,并着力打造多样化的硬件平台、管理调度与分析平台和深度学习框架的"平台组合",实现前端承接多源数据、后端支撑智能应用,为人工智能提供领先计算力。目前,浪潮已经是全球顶级互联网公司百度、阿里和腾讯的AI计算GPU服务器的最主要供应商,并与科大讯飞、奇虎360、搜狗、今日头条、Face++等人工智能领先公司保持在系统与应用方面的深入紧密合作,帮助客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。


原文发布时间为:2017年5月16日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
9月前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
787 55
|
4月前
|
机器学习/深度学习 数据采集 人工智能
人工智能浪潮下,解锁“人工智能认证技能”的新路径
在人工智能迅猛发展的今天,AI已深刻融入工作与生活,重塑社会运行规则。从智能助手到自动驾驶,AI技术广泛应用,催生了对专业人才的庞大需求。然而,面对复杂的信息,如何系统学习并脱颖而出成为关键。“人工智能认证技能”提供了解决方案,帮助个人构建完整知识体系、提升实践能力,并拓展职业发展空间。其中,生成式AI(GAI)认证尤为突出,涵盖核心技能与行业应用,助力职场人士掌握前沿技术,规避风险,实现升职加薪目标。拥抱AI时代,通过权威认证开启职业新篇章,共创科技未来!
人工智能浪潮下,解锁“人工智能认证技能”的新路径
|
10月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
6月前
|
机器学习/深度学习 人工智能 算法
AI浪潮下的青年觉醒:生成式人工智能(GAI)认证赋能未来竞争力与人文担当
人工智能正深刻改变生活与工作,青年面临前所未有的机遇与挑战。文章探讨了青年在AI时代的觉醒、核心竞争力的培养及技术伦理参与的重要性,并强调生成式人工智能(GAI)认证的意义,助力青年提升技能与就业竞争力,推动科学教育与技术创新融合。青年应保持好奇心、坚持人文关怀,引领未来社会发展方向,在AI浪潮中创造价值与美好未来。
|
6月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
352 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
7月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
蘑菇识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了9种常见的蘑菇种类数据集【"香菇(Agaricus)", "毒鹅膏菌(Amanita)", "牛肝菌(Boletus)", "网状菌(Cortinarius)", "毒镰孢(Entoloma)", "湿孢菌(Hygrocybe)", "乳菇(Lactarius)", "红菇(Russula)", "松茸(Suillus)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,
489 11
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
9月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
468 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
9月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
173 12
|
10月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
412 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
10月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
368 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型

热门文章

最新文章