英伟达发布 Hopper H100 新架构芯片:面向 AI、自动驾驶汽车及 Metaverse 领域

简介: 英伟达发布 Hopper H100 新架构芯片:面向 AI、自动驾驶汽车及 Metaverse 领域

3 月 22 日,芯片设计巨头英伟达( Nvidia)在其 GTC 2022 大会上重磅发布了全新架构的 Nvidia Hopper H100 芯片,主要致力于为 AI、自动驾驶汽车、 Metaverse 工具及数字产品提供动力,进一步加速了图形、科学计算和 AI 方面的探索能力。

image.png

英伟达发布 Hopper H100 AI 芯片

作为 Nvidia A100 的“继承者”,全新的 Hopper H100 AI 芯片,采用了向计算机科学先驱 Grace Hopper 致敬的命名方式(Hopper 曾在世界上最早从事计算机科学工作的一批先驱,她发明了被称为“编译器”的关键编程工具,并对 COBOL 编程语言进行了代码开发,且创造了“bug”一词),在秉承了 Nvidia 架构性能翻倍优势的同时,还赋予了更多“超级”能力。

image.png

英伟达(Nvidia)创始人、CEO 黄仁勋在会上分享称,在该公司的 NVLink 高速通信通道中,客户可将多达 256 个 H100 芯片链接到“本质上是 one mind-blowing 的 GPU”上。

image.png

据介绍,全新 Hopper H100 芯片由台积电 5nm 定制版本制程(4N)打造,由高达 800 亿个晶体管共同构成其数据处理电路,有着 40 terabyte 每秒的 IO 带宽,是全球首款 PCI-E 5 和 HBM 3 显卡。

算力方面,全新 Hopper H100 的 FP8 算力达到了 4PetaFLOPS,FP16 为 2PetaFLOPS,TF32 算力为 1PetaFLOPS,FP64 和 FP32 算力为 60TeraFLOPS。

相比上一代 A100 的 400W 功率,全新 Hopper H100 的功率高达 700W,AI FP8 精度算力为 A100 上 FP16 的 6 倍,实现了英伟达“历代最大的性能提升”。

image.png

据悉,英伟达已经计划将 Hopper H100 封装到其 DGX 计算模块中,这些模块可连接到名为 SuperPads 的大型系统中。由于早期 DGX 的客户是 Meta(以前是 Facebook,且 Meta 拥有一台新的巨型 AI 超级计算机用来打造 Metaverse),而英伟达则希望通过自己的 DGX SuperPod 系统 Eos 来超越它。

据黄仁勋透露,Hopper H100 GPU 将在第三季度发货,而Grace“有望在明年发货”。

除了 Hopper H100 之外,此次大会上英伟达还推出了其安培系列图形芯片新成员 —— RTX A5500 ,用于动画、产品设计和视觉数据处理等 3D 任务,主要面向需要图形功能的专业人士。该芯片的推出也与 Nvidia 在 Omniverse 方面的探索相吻合(Omniverse 致力于构建 metaverse 的 3D 领域所需的工具和云计算服务)。

芯片“之争”

对于全新 Hopper H100 的到来,有媒体评论称“不知道会否给很多竞争对手带来压力”,比如英特尔即将推出的 Ponte Vecchio 处理器(该处理器拥有 1000 多亿个晶体管),以及苹果的M1 Ultra、 Graphcore、SambaNova Systems 和 Cebranas 等初创公司推出的一系列专用 AI 加速器的芯片。

image.png

由于 Hopper H100 芯片也会面向自动驾驶汽车领域,因此在英伟达的竞争对手里面有个比较引人注目的厂商,那就是特斯拉(其 D1 芯片为其 Dojo 技术提供动力以训练自动驾驶汽车)。此前,特斯拉制造商方面还曾表示,Dojo 在投入使用后,将会取代 Nvidia 芯片。

在芯片方面,英伟达可能不如英特尔、苹果知名,但在新一代技术实用化方面,英伟却不容小觑。比如其在 Omniverse 方面的探索已跨越了多个领域,包括通过云和数字孪生技术进行的协同 3D 设计等工作,均已反映了计算系统中真实世界的一部分。

尽管对手如云,但英伟达依旧在不断进取且已取得进展。英伟达计划将于 2026 年推出新一代 Hyperion 汽车芯片系列,并预计未来 6 年将从汽车芯片中盈利 110 亿美元。至于在 metaverse 方面的进一步发展和探索,也更值得我们期待。

nvidia人工智能ai芯片

相关文章
|
2月前
|
存储 人工智能 缓存
AI 提示词模板相关的架构设计
现在很多企业纷纷研发大语言模型以解决业务问题。提示词在与模型交互中起到关键作用。为优化提示词模板的修改、提高渲染效率及确保安全性,架构设计注重可修改性、安全性、可靠性和性能。设计包括:将提示词存储在OSS以方便修改和版本控制;使用本地缓存提升读取性能;模板引擎增强灵活性;秘钥安全存储在加密系统中;并通过配置中心动态调整。此设计旨在提供高效、安全且可靠的AI交互体验等。
615 78
AI 提示词模板相关的架构设计
|
6天前
|
人工智能 Cloud Native Java
从云原生视角看 AI 原生应用架构的实践
本文核心观点: • 基于大模型的 AI 原生应用将越来越多,容器和微服务为代表的云原生技术将加速渗透传统业务。 • API 是 AI 原生应用的一等公民,并引入了更多流量,催生企业新的生命力和想象空间。 • AI 原生应用对网关的需求超越了传统的路由和负载均衡功能,承载了更大的 AI 工程化使命。 • AI Infra 的一致性架构至关重要,API 网关、消息队列、可观测是 AI Infra 的重要组成。
|
22天前
|
人工智能 运维 监控
智能化运维:AI在IT基础架构管理中的应用
【6月更文挑战第8天】本文将探讨人工智能(AI)如何革新传统的IT运维领域,实现智能化的故障预测、自动化的修复流程以及高效的资源分配。我们将通过实例分析AI技术如何优化数据中心的能源使用,提升网络性能监控的准确性,并降低系统维护成本。
44 2
|
27天前
|
人工智能 容器 运维
活动回顾丨AI 原生应用架构专场·北京站 PPT 下载
5 月 24 日,飞天技术沙龙首个 AI 原生应用架构专场在北京举办。
|
2月前
|
人工智能
邀您参会丨飞天技术沙龙 AI 原生应用架构专场·北京站
飞天技术沙龙 AI 原生应用架构专场·北京站报名中。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
清华首款AI光芯片登上Science,全球首创架构迈向AGI
【4月更文挑战第16天】清华大学研究团队开发出大规模光子芯片“太极”,在《科学》杂志发表,该芯片基于创新的光子计算架构,实现百万神经元级别的ONN,能效比高达160 TOPS/W。实验中,太极芯片成功执行1000类别分类任务,提升AI内容生成质量,为AGI发展开辟新路径。然而,光子集成电路的制造成本高、技术成熟度不足及软件支持限制了其广泛应用。
62 5
清华首款AI光芯片登上Science,全球首创架构迈向AGI
|
2月前
|
人工智能 算法 测试技术
探索软件自动化测试的未来:AI驱动的测试策略构建高效可靠的微服务架构:后端开发的新范式
【5月更文挑战第28天】 在软件开发的世界中,测试是确保产品质量的关键步骤。随着技术的进步和项目复杂性的增加,传统的手动测试方法逐渐显得力不从心。本文旨在探讨自动化测试的最新趋势——人工智能(AI)驱动的测试策略。我们将分析AI如何通过智能化的测试用例生成、测试执行优化以及结果分析来提高测试效率和精确性。文章还将讨论实施AI测试策略的挑战与机遇,为软件测试工程师提供未来技术转型的视角。 【5月更文挑战第28天】 在当今软件开发的快速迭代和复杂多变的环境中,传统的单体应用架构已经难以满足业务敏捷性和可扩展性的需求。微服务架构作为一种新的解决方案,以其服务的细粒度、独立部署和弹性伸缩等特性,正逐
|
20小时前
|
负载均衡 Java 开发者
细解微服务架构实践:如何使用Spring Cloud进行Java微服务治理
【6月更文挑战第30天】Spring Cloud是Java微服务治理明星框架,整合Eureka(服务发现)、Ribbon(客户端负载均衡)、Hystrix(断路器)、Zuul(API网关)和Config Server(配置中心),提供完整服务治理解决方案。通过Eureka实现服务注册与发现,Ribbon进行负载均衡,Hystrix确保服务容错,Config Server集中管理配置,Zuul则作为API入口统一处理请求。理解和使用Spring Cloud是现代Java开发者的关键技能。
13 2
|
1天前
|
缓存 监控 负载均衡
探索微服务架构中的API网关模式
在现代软件开发领域,微服务架构因其灵活性和可扩展性而备受青睐。本文将深入探讨微服务架构中至关重要的组件——API网关。通过分析API网关的核心功能、设计原则以及实际应用案例,我们旨在揭示其在提高系统性能、增强安全性及简化客户端与服务间通信中的重要作用。结合最新研究和实际开发经验,本文将为读者提供关于如何有效实施API网关的深刻见解。
|
1天前
|
存储 负载均衡 云计算
微服务架构中的服务发现与注册机制
在分布式系统设计中,微服务架构因其灵活性和可伸缩性而受到青睐。本文深入探讨了微服务架构下的服务发现与注册机制,通过分析Eureka、Consul和Zookeeper等工具的原理与实践,揭示了这些机制如何优化服务间的通信和故障转移。文章结合最新研究和案例,提供了对微服务架构中关键组件的深刻见解,并讨论了其在不同场景下的应用效果。