华为开源全场景AI计算框架MindSpore,性能可达 Pytorch+2080Ti 的1.93倍

简介: 华为开源全场景AI计算框架MindSpore,性能可达 Pytorch+2080Ti 的1.93倍

bVbGU2a.jpg

MindSpore 是由华为于 2019 年 8 月推出的新一代全场景 AI 计算框架,2020 年 3 月 28 日,华为宣布 MindSpore 正式开源。

MindSpore 着重提升易用性并降低 AI 开发者的开发门槛。

MindSpore 原生适应每个场景包括端、边缘和云,并能够在按需协同的基础上,通过实现 AI 算法即代码,使开发态变得更加友好,显著减少模型开发时间,降低模型开发门槛。


昇腾 910 和 MindSpore 到底是什么


我们都熟悉的电脑当中有一个很重要的组件叫做 GPU,通常称为显卡,有了它才能处理电脑中的视频、图像信号,GPU 的性能越强能够处理视频信号的能力就越强,通常来说就能玩更大型的游戏,昇腾 910 可以大概理解为是服务器里的显卡,只不过它不是用来进行处理视频信号,而是用其强大的算力对 AI 模型进行训练的。

MindSpore 全场景 AI 计算框架则可以去大致类比电脑中的操作系统,有了它才能让 AI 处理器的强大算力充分发挥出来。


实力被证明


知乎用户 @凯恩博 kevin 博士在参加 MindSpore 学习的系列活动时,申请试用到 ModelArts Ascend 910 做模型训练,之后他实测了 Ascend 910 集群的性能,还与 2080Ti/P100/T4+Pytorch 做了性能对比。

bVbGUdC.png

得出如下结论:

A910 在训练速度约是 2080Ti 的 1.93 倍,而 2080Ti 在 32 位精度下是 V100 80% 性能估算,A910 的训练速度性能至少是 V100 的 1.5 倍以上。


产生了什么影响


华为有了目前世界算力顶尖 AI 处理器,对于人工智能算法模型的训练从过去的几个小时缩短到以分钟为单位,极大便利了开发者,能让 AI 应用更快成型,更容易投入使用,对于我国人工智能生态的形成起到了加速器的作用。

目录
相关文章
|
9月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
3152 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
9月前
|
人工智能 数据可视化 数据处理
AI智能体框架怎么选?7个主流工具详细对比解析
大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架,从RelevanceAI、smolagents到LangGraph,涵盖技术门槛、任务复杂度、社区生态等选型关键因素,助你根据项目需求选择最合适的开发工具,构建高效、可扩展的智能系统。
2123 3
AI智能体框架怎么选?7个主流工具详细对比解析
|
9月前
|
人工智能 运维 安全
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
迈格网络推出“天机”新版本,以AI自学习、全端防护、主动安全三大核心能力,重构网络安全防线。融合AI引擎与DeepSeek-R1模型,实现威胁预测、零日防御、自动化响应,覆盖Web、APP、小程序全场景,助力企业从被动防御迈向主动免疫,护航数字化转型。
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
742 10
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
|
8月前
|
人工智能 JavaScript 前端开发
GenSX (不一样的AI应用框架)架构学习指南
GenSX 是一个基于 TypeScript 的函数式 AI 工作流框架,以“函数组合替代图编排”为核心理念。它通过纯函数组件、自动追踪与断点恢复等特性,让开发者用自然代码构建可追溯、易测试的 LLM 应用。支持多模型集成与插件化扩展,兼具灵活性与工程化优势。
666 6
|
8月前
|
人工智能 并行计算 PyTorch
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
750 4
|
9月前
|
人工智能 数据可视化 前端开发
AI Ping:精准可靠的大模型服务性能评测平台
AI Ping是清华系团队推出的“大模型服务评测平台”,被誉为“AI界的大众点评”。汇聚230+模型服务,7×24小时监测性能数据,以吞吐量、延迟等硬指标助力开发者科学选型。界面简洁,数据可视化强,支持多模型对比,横向对标国内外主流平台,为AI应用落地提供权威参考。
2226 3
|
机器学习/深度学习 JavaScript PyTorch
9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
生成对抗网络(GAN)的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论,并用PyTorch实现多种变体,包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣,如LS-GAN提升训练稳定性、WGAN-GP改善图像质量,展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑,为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。
1188 7
9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
|
9月前
|
机器学习/深度学习 存储 PyTorch
Neural ODE原理与PyTorch实现:深度学习模型的自适应深度调节
Neural ODE将神经网络与微分方程结合,用连续思维建模数据演化,突破传统离散层的限制,实现自适应深度与高效连续学习。
816 3
Neural ODE原理与PyTorch实现:深度学习模型的自适应深度调节

热门文章

最新文章

推荐镜像

更多