华为发布算力最强 AI 处理器 Ascend 910 及全场景 AI 计算框架 MindSpore

简介: 华为发布算力最强 AI 处理器 Ascend 910 及全场景 AI 计算框架 MindSpore

[中国,深圳,2019 年 8 月 23 日] 华为正式发布算力最强的 AI 处理器 Ascend 910(昇腾910),同时推出全场景 AI 计算框架 MindSpore。华为公司轮值董事长徐直军在发布会上表示:华为自 2018 年 10 月发布 AI 战略以来,稳步而有序地推进战略执行、产品研发及商用进程。昇腾910、MindSpore 的推出,标志着华为已完成全栈全场景 AI 解决方案(Portfolio)的构建,也标志着华为 AI 战略的执行进入了新的阶段。

image.jpeg8 月 23 日,华为公司轮值董事长徐直军出席 AI 处理器 Ascend 910 及全场景 AI 计算框架 MindSpore 发布会。


昇腾 910,算力最强 AI 处理器

徐直军此次正式发布的 AI 芯片是昇腾910,属于 Ascend-max 系列。在 HC2018 上已经发布了其技术规格。实际测试结果表明,在算力方面,昇腾910 完全达到了设计规格,即:半精度 (FP16)算力达到 256 Tera-FLOPS,整数精度 (INT8) 算力达到 512 Tera-OPS,重要的是,达到规格算力所需功耗仅 310W,明显低于设计规格的 350W。徐直军表示:昇腾910 总体技术表现超出预期,作为算力最强AI处理器,当之无愧。我们已经把昇腾910 用于实际 AI 训练任务。比如,在典型的 ResNet50 网络的训练中,昇腾910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升。面向未来,针对不同的场景,包括边缘计算、自动驾驶车载计算、训练等场景,华为将持续投资,推出更多的 AI 处理器,面向全场景持续提供更充裕、更经济、更适配的AI算力。


MindSpore,全场景 AI 计算框架

徐直军还发布了全场景 AI 计算框架 MindSpore。能否大大降低AI应用开发的门槛,能否实现 AI 无处不在,能否在任何场景下确保用户隐私得到尊重和保护,这些都与 AI 计算框架息息相关。为此,去年华为全联接大会上,华为提出,AI 框架应该是开发态友好(例如显著减少训练时间和成本)和运行态高效(例如最少资源和最高能效比),更重要的是,要能适应每个场景包括端、边缘和云。经过近一年的努力,全场景 AI 计算框架 MindSpore 在这三个方面都取得了显著进展。

全场景支持,是在隐私保护日渐重要的背景下,实现 AI 无所不在越来越基础的需求,也是 MindSpore 的重要特色。针对不同的运行环境,MindSpore 框架架构上支持可大可小,适应全场景独立部署。MindSpore 框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而不是数据本身,以此实现在保证用户隐私数据保护的前提下跨场景协同。除了隐私保护,MindSpore 还将模型保护 Built-in 到 AI 框架中,实现模型的安全可信。 在原生适应每个场景包括端,边缘和云,并能够按需协同的基础上,通过实现AI算法即代码,使开发态变得更加友好,显著减少模型开发时间。以一个 NLP(自然语言处理)典型网络为例,相比其他框架,用 MindSpore 可降低核心代码量 20%,开发门槛大大降低,效率整体提升 50% 以上。通过 MindSpore 框架自身的技术创新及其与昇腾处理器协同优化,有效克服 AI 计算的复杂性和算力的多样性挑战,实现了运行态的高效,大大提高了计算性能。除了昇腾处理器,MindSpore 同时也支持 GPU、CPU 等其它处理器。

为了更好促进 AI 的应用,徐直军宣布“MindSpore 将在 2020 年 Q1 开源”,助力每一位开发者,促进 AI 产业生态发展。


全栈全场景 AI 解决方案,让 AI 无处不在

徐直军在发布以上两款产品之前,首先重申了华为公司的 AI 战略:投资 AI 基础研究,在计算视觉、自然语言处理、决策推理等领域构筑数据高效(更少的数据需求) 、能耗高效(更低的算力和能耗) ,安全可信、自动自治的机器学习基础能力;打造全栈全场景解决方案,提供充裕的、经济的算力资源,简单易用、高效率、全流程的 AI 平台;投资开放生态和人才培养,面向全球,持续与学术界、产业界和行业伙伴广泛合作;把 AI 思维和技术引入现有产品和服务,实现更大价值、更强竞争力;应用 AI 优化内部管理,对准海量作业场景,大幅度提升内部运营效率和质量。

华为 AI 解决方案(portfolio)的全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。而全栈是技术功能视角,是指包括 Ascend 昇腾系列 IP 和芯片、芯片使能 CANN、训练和推理框架 MindSpore 和应用使能 ModelArts 在内的全堆栈方案。

徐直军也回顾了制定以上 AI 战略的初衷。华为定位 AI 是一种新的通用目的技术(GPT),如同 19 世纪的铁路和电力,以及 20 世纪的汽车、电脑、互联网一样,将应用到经济的几乎所有地方。同时华为也认为 AI 的应用总体还处于发展初期,AI 技术和能力相比于长远期望还有很大差距。减小甚至消除这些差距,加速AI的应用,正是华为 AI 战略的初衷和目标。具体包括致力于促成以下 10 个方面的改变。

通过提供更强的算力,使复杂模型训练能在几分钟、甚至几秒钟内完成,而不是今天的数天甚至数周;提供更经济、更充裕的算力,让算力不再稀缺、不再昂贵,从而不再是 AI 发展的制约因素;通过全场景方案,适应企业不同需要,确保用户隐私得到尊重和保护,让 AI 能够部署在任何场景,而不仅仅是公有云。投资基础 AI 算法研究,实现更少的数据需求,即数据高效。也要能够基于更低的算力和能耗,即能耗高效。通过 AI 框架 MindSpore 和应用使能 ModelArts,大大提升 AI 自身的自动化水平,减少对人工的依赖。持续提升模型算法,实现工业生产环境的“工作”优秀,而不仅仅是各种比拼环境的“考试”优秀。实现模型的闭环、实时更新,保证企业 AI 应用始终处于最佳状态。将 AI 技术与 5G、云、物联网、边缘计算、区块链、大数据、数据库… 等技术充分协同,发挥更大价值。通过全栈方案一站式平台,使 AI 成为所有应用开发者甚至所有 ICT 技术从业人员的一项基本技能,而不是一项只有具备高级技能的专家才能完成的工作。通过全栈全场景技术手段,结合投资开放的生态和人才培养,让 AI 人才不再短缺

昇腾310 和 ModelArts 获得广泛应用

在华为全联接大会 2018 上,与华为 AI 战略一起, 作为全栈全场景解决方案的首批组件,华为同时对外发布并正式推出了昇腾310 AI 芯片 和全流程模型生产服务 ModelArts。昇腾310 属于 Ascend-mini 系列第一颗华为商用 AI SoC芯片,在最大功耗仅 8W 的情况下,其整数精度(INT8)算力达到 16Tops,半精度(FD16)算力达 到 8Tops,同时,该芯片中还集成了 16 通道 全高清 视频解码器,是面向边缘计算场景最强算力的 AI SoC。

自发布以来,基于昇腾310 芯片的产品和云服务获得广泛应用。其中,基于昇腾310 的 MDC 和很多国内外主流车企在园区巴士、新能源车、自动驾驶等场景已经深入合作。基于昇腾310 的 Atlas 系列板卡、服务器,与数十家伙伴在智慧交通、智慧电力等数十个行业落地行业解决方案。基于昇腾310,华为云提供了图像分析类服务、OCR 服务、视频智能分析服务等云服务。对外提供 API 达 50 多个,日均调用量超过 1 亿次,而且在快速增长,预计年底日均调用量 超过 3 亿次。另有超过 100 多个客户使用昇腾310 开发定制 AI 算法。

ModelArts 全流程模型生产服务打通了从数据获取-模型开发-模型训练-模型部署的全链条,可将生产所需的所有服务一站式提供。截止目前,ModelArts 已经拥有开发者超过 3 万,日均训练作业任务超过 4000 个,32000 小时,其中:视觉类作业占 85%,语音类作业占 10%, 机器学习 5%。

随着今天昇腾910 AI 处理器以及 MindSpore 全场景 AI 计算框架的发布,华为全栈全场景 AI 解决方案各重要组成部分悉数登场,徐直军因此表示“华为已完成了全栈全场景 AI 解决方案的构建”。实现了预期的计划和目标,对华为 AI,这是一个新的里程碑,更是一个新的开始。在发布会最后,徐直军预告,在即将开幕的华为全联接大会 2019,将有更多震撼的AI新品提出。华为期待与伙伴更加深入、广泛的合作,让 AI 无所不及,把数字世界带给每个人、每个家庭、每个组织。

相关文章
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
DiffSensei 是一个由北京大学、上海AI实验室及南洋理工大学共同推出的AI漫画生成框架,能够生成可控的黑白漫画面板。该框架整合了基于扩散的图像生成器和多模态大型语言模型(MLLM),支持多角色控制和精确布局控制,适用于漫画创作、个性化内容生成等多个领域。
67 18
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
|
4天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
38 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
9天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
93 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
2天前
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
21 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
1天前
|
弹性计算 人工智能 数据管理
AI场景下的对象存储OSS数据管理实践
本文介绍了ECS和OSS的操作流程,分为两大部分。第一部分详细讲解了ECS的登录、密码重置、安全组设置及OSSUTIL工具的安装与配置,通过实验创建并管理存储桶,上传下载文件,确保资源及时释放。第二部分则聚焦于OSSFS工具的应用,演示如何将对象存储挂载为磁盘,进行大文件加载与模型训练,强调环境搭建(如Conda环境)及依赖安装步骤,确保实验结束后正确清理AccessKey和相关资源。整个过程注重操作细节与安全性,帮助用户高效利用云资源完成实验任务。
35 10
|
1天前
|
存储 人工智能 开发工具
AI场景下的对象存储OSS数据管理实践
本文介绍了对象存储(OSS)在AI业务中的应用与实践。内容涵盖四个方面:1) 对象存储作为AI数据基石,因其低成本和高弹性成为云上数据存储首选;2) AI场景下的对象存储实践方案,包括数据获取、预处理、训练及推理阶段的具体使用方法;3) 国内主要区域的默认吞吐量提升至100Gbps,优化了大数据量下的带宽需求;4) 常用工具介绍,如OSSutil、ossfs、Python SDK等,帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施,以及不同工具的特点和应用场景。
27 10
|
4天前
|
机器学习/深度学习 人工智能 算法
AI框架的赢者法则:生态繁荣的昇思MindSpore,成为大模型时代的新选择
2024年被视为大模型应用的元年。昇思MindSpore AI框架凭借其强大的开源社区和技术创新,在全球范围内迅速崛起。截至2024年11月,该框架的下载量已超过1100万次,覆盖130多个国家和地区的2400多个城市,拥有3.7万名贡献者。昇思MindSpore不仅在人才培养和社区治理方面表现出色,还在大模型的开发、训练和应用中发挥了关键作用,支持了50多个主流大模型,覆盖15个行业。随着其市场份额预计达到30%,昇思MindSpore正逐步成为行业共识,推动大模型在各领域的广泛应用。
32 12
|
3天前
|
人工智能 计算机视觉
幻觉不一定有害,新框架用AI的幻觉优化图像分割技术
在图像分割领域,传统方法依赖大量手动标注数据,效率低下且难以适应复杂场景。为解决这一问题,研究人员提出了“任务通用可提示分割”方法,利用多模态大型语言模型(MLLM)生成实例特定提示。然而,MLLM常出现幻觉,影响分割精度。为此,研究团队开发了“Prompt-Mask Cycle”(ProMaC)框架,通过迭代生成和验证提示及掩码,有效利用幻觉信息,提高了分割精度和效率。实验结果表明,ProMaC在多个基准数据集上表现出色,为图像分割技术的发展提供了新思路。
14 6
|
2天前
|
机器学习/深度学习 人工智能 算法
【AI系统】AI 框架之争
本文介绍了AI框架在数学上对自动微分的表达和处理,以及其在多线程算子加速、GPU/NPU支持、代码编译优化等方面的技术挑战。文章详细梳理了AI框架的发展历程,从萌芽阶段到深化阶段,探讨了不同阶段的关键技术和代表性框架。同时,文章展望了AI框架的未来趋势,包括全场景支持、易用性提升、大规模分布式支持和科学计算融合。
21 0
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
52 10
下一篇
DataWorks