AWS 和 NVIDIA 正在构建的 65 台 ExaFLOP AI 超级计算机

2023年11月30日下午9:12 • 最新资讯

65-ExaFLOP-AI-Supercomputer-being-built-by-AWS-and-NVIDIA.webp

随着人工智能爆炸式增长的持续，对更先进的人工智能（AI）基础设施的需求持续增长。为了满足这一需求，Amazon Web Services （AWS） 和 NVIDIA 扩大了战略合作，通过构建能够提供 65 ExaFLOP 处理能力的新型强大 AI 超级计算机来提供增强的 AI 基础设施和服务。

此次合作旨在整合两家公司的最新技术，将人工智能创新推向新的高度。此次合作的一个关键方面是 AWS 成为第一家提供 NVIDIA GH200 Grace Hopper 超级芯片的云提供商。这些超级芯片配备了多节点 NVLink 技术，这是 AI 计算向前迈出的重要一步。GH200 Grace Hopper 超级芯片提供高达 20 TB 的共享内存，该功能可以为 TB 级工作负载提供支持，这是以前在云中无法实现的功能。

正在建设中的新型AI超级计算机

除了硬件方面的进步外，双方的合作关系还延伸到云服务领域。NVIDIA 和 AWS 将在 AWS 上托管 NVIDIA 的 AI 训练即服务平台 NVIDIA DGX Cloud。该服务将采用 GH200 NVL32，为开发人员提供单个实例中最大的共享内存。此次合作将使开发人员能够访问多节点超级计算，以快速训练复杂的人工智能模型，从而简化人工智能开发过程。

65 ExaFLOP 的处理能力

AWS 和 NVIDIA 之间的合作伙伴关系也延伸到雄心勃勃的 Ceiba 项目。该项目旨在设计世界上最快的 GPU 驱动的 AI 超级计算机。AWS将托管这台超级计算机，该超级计算机将主要服务于NVIDIA的研发团队。Project Ceiba 超级计算机与 AWS 服务的集成将为 NVIDIA 提供一套全面的 AWS 研发功能，从而有可能推动 AI 技术的重大进步。

合作总结

AWS 将成为第一家将采用全新多节点 NVLink 技术的 NVIDIA GH200 Grace Hopper 超级芯片引入云的云提供商。NVIDIA GH200 NVL32 多节点平台将 32 个采用 NVIDIA NVLink 和 NVSwitch 技术的 Grace Hopper 超级芯片连接到一个实例中。该平台将在 Amazon Elastic Compute Cloud （Amazon EC2）实例上提供，这些实例与 Amazon 强大的联网（EFA）连接，由高级虚拟化（AWS Nitro System）和超大规模集群（Amazon EC2 UltraClusters）提供支持，使共同客户能够扩展到数千个 GH200 超级芯片。
NVIDIA 和 AWS 将合作在 AWS 上托管 NVIDIA DGX Cloud（NVIDIA 的 AI 训练即服务）。这将是首款采用 GH200 NVL32 的 DGX Cloud，为开发人员提供单个实例中最大的共享内存。AWS 上的 DGX Cloud 将加速尖端生成式 AI 和大型语言模型的训练，这些模型可以达到超过 1 万亿个参数。
NVIDIA 和 AWS 正在合作开展 Project Ceiba 项目，以设计世界上最快的 GPU 驱动的 AI 超级计算机，这是一个具有 GH200 NVL32 和 Amazon EFA 互连的大规模系统，由 AWS 托管，供 NVIDIA 自己的研发团队使用。这台首创的超级计算机配备 16,384 个 NVIDIA GH200 超级芯片，能够处理 65 exaflops 的 AI，NVIDIA 将使用它来推动其下一波生成式 AI 创新。
AWS 将推出另外三个新的 Amazon EC2 实例：由 NVIDIA H200 Tensor Core GPU 提供支持的 P5e 实例，用于大规模和尖端的生成式 AI 和 HPC 工作负载，以及由 NVIDIA L4 GPU 和 NVIDIA L40S GPU 提供支持的 G6 和 G6e 实例，分别用于 AI 微调、推理、图形和视频工作负载等各种应用程序。G6e 实例特别适合使用 NVIDIA Omniverse 开发 3D 工作流程、数字孪生和其他应用程序，NVIDIA Omniverse 是一个用于连接和构建支持 AI 的生成式 3D 应用程序的平台。
“AWS 和 NVIDIA 已经合作了超过 13 年，从世界上第一个 GPU 云实例开始。今天，我们为图形、游戏、高性能计算、机器学习以及现在的生成式 AI 等工作负载提供最广泛的 NVIDIA GPU 解决方案，“AWS 首席执行官 Adam Selipsky 说。“我们将继续与 NVIDIA 一起创新，使 AWS 成为运行 GPU 的最佳场所，将下一代 NVIDIA Grace Hopper 超级芯片与 AWS 的 EFA 强大网络、EC2 UltraClusters 的超大规模集群以及 Nitro 的高级虚拟化功能相结合。”

亚马逊 NVIDIA 合作伙伴

为了进一步增强其 AI 产品，AWS 将推出三个由 NVIDIA GPU 提供支持的新 Amazon EC2 实例。其中包括由 NVIDIA H200 Tensor Core GPU 提供支持的 P5e 实例，以及分别由 NVIDIA L4 GPU 和 NVIDIA L40S GPU 提供支持的 G6 和 G6e 实例。这些新实例将使客户能够在 AWS 上构建、训练和部署其尖端模型，从而扩展 AI 开发的可能性。

AWS NVIDIA DGX 云托管

此外，AWS 将托管由 GH200 NVL32 NVLink 基础设施提供支持的 NVIDIA DGX 云。该服务将为企业提供快速访问多节点超级计算能力的机会，使他们能够有效地训练复杂的人工智能模型。

为了促进生成式 AI 开发，NVIDIA 宣布在 AWS 上推出软件，包括 NVIDIA NeMo Retriever 微服务和 NVIDIA BioNeMo。这些工具将为开发人员提供探索人工智能开发新领域所需的资源。

AWS 和 NVIDIA 之间的扩展合作代表了 AI 创新向前迈出的重要一步。通过整合各自的技术，这些公司将为生成式人工智能创新提供先进的基础设施、软件和服务。此次合作不仅将增强人工智能开发人员的能力，还将为人工智能技术的新进展铺平道路。随着合作的不断发展，人工智能发展的可能性可能会达到前所未有的水平。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun268858.html

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

如何设置Raspberry Pi SNMP监视器

上一篇 2023年11月30日下午9:11

有针对 HP Smart 应用程序 Windows 自动安装问题的解释

下一篇 2023年12月5日下午5:22

工具软件

NVIDIA 和 AI 个人计算的未来

NVIDIA 和 AI 个人计算的未来 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 和 Imbue 首席执行官 Kanjun Qiu 在最近的一次采访中解…

2024年3月26日
工具软件

NVIDIA 针对 AGI 的新 Foundation Agent 计划

NVIDIA 针对 AGI 的新 Foundation Agent 计划 NVIDIA 的“Foundation Agent”计划由 Jim Fan 博士领导，旨在开发多功能和通用…

2024年3月26日
工具软件

英伟达GTC大会发布新的Blackwell计算平台

英伟达GTC大会发布新的Blackwell计算平台英伟达上周召开了GTC大会发布了一堆新硬件和机器人平台，其中Blackwell架构比前代Hopper架构的训练性能提升2.5倍，…

2024年3月26日
工具软件

技嘉 AI 平台亮相 NVIDIA GTC 2024

技嘉 AI 平台亮相 NVIDIA GTC 2024 技嘉科技及其子公司 Giga Computing 将在全球 AI 开发者大会 NVIDIA GTC 2024 上展示其企业解决…

2024年3月24日
工具软件

NVIDIA 针对 AGI 的新 Foundation Agent 计划

NVIDIA 针对 AGI 的新 Foundation Agent 计划 NVIDIA 的“Foundation Agent”计划由 Jim Fan 博士领导，旨在开发多功能和通用…

2024年3月24日
如何在 AWS Ubuntu EC2 实例上安装 XFCE GUI

1. 启动 Ubuntu AWS 实例当然，您的 Amazon 云服务上必须有一个正在运行的 Ubuntu Ec2 实例。如果您已经拥有它，请使用 Web 控制台或 SSH 命令…

2024年3月13日 • Linux命令
Nvidia将大幅加大努力成为云服务提供商

大多数组织并不直接向英伟达购买GPU。相反，它们通过云服务提供商如亚马逊网络服务、微软Azure和谷歌云平台来获取GPU，而这些云服务提供商则从英伟达大量购买芯片。但亚马逊、微软…

工具软件 2023年12月30日
苹果Apple

M3 Pro AI 跑分成绩超越 Nvidia RTX 4090

苹果于12月6日宣布推出MLX，一款专为Apple Silicon设计的开源框架。这款框架的目标是让 AI 开发者能在其项目中进行构建、测试、使用及优化。基准测试中表现出色开…

2023年12月14日
微软Microsoft

AWS 首席执行官攻击 Microsoft 的 Azure AI 战略

占主导地位的云计算提供商亚马逊网络服务（Amazon Web Services）在快速增长的生成式人工智能领域一直被竞争对手Microsoft和谷歌所取代。AWS首席执行官亚当·塞…

2023年11月30日
工具软件

Amazon AWS Graviton4 和 AWS Trainium2 是 AWS 设计的下一代芯片

Amazon Web Services （AWS）最近在 AWS re：Invent 大会上发布了一项激动人心的公告，推出了两款新处理器 Graviton4 和 Trainium…

2023年11月29日
工具软件

NVIDIA推出的MONAI医学影像AI云服务

NVIDIA 最近推出了 MONAI 医学成像 AI 云服务，在医疗保健技术领域迈出了大胆的一步。这项创新服务将对医学成像人工智能（AI）模型的开发方式产生重大影响，将效率和精…

2023年11月27日
最新资讯

NVIDIA H200 将把 AI 技术提升到难以想象的高度

这英伟达H200是一个功能强大的新型 AI 和高性能计算（HPC）平台，在性能、内存和效率方面取得了重大进步。H200 基于 NVIDIA Hopper 架构，是首款提供 HB…

2023年11月15日
最新资讯

NVIDIA宣布推出新H200 GPU有望加快ChatGPT速度

NVIDIA于周一宣布推出HGX H200 Tensor Core GPU，采用Hopper构架，旨在加速AI应用。H200是继去年推出的H100后的新作，后者曾是NVIDIA最强…

2023年11月14日
工具软件

NVIDIA 打破记录，在 4 分钟内训练 AI 模型

NVIDIA 的 AI 平台再次展示了其能力，在最新的 MLPerf 行业基准中创造了新记录，这是 AI 训练和高性能计算的一项备受推崇的衡量标准。AI 超级计算机 NVIDIA …

2023年11月9日
工具软件

NVIDIA Omniverse 获得 DLSS 3.5 和光线重建

最近发布的 NVIDIA DLSS 3.5 更新以及适用于 NVIDIA Omniverse 的光线重建，引发了 3D 工具和应用开发领域的重大发展。此次更新也得到了即将发布的 N…

2023年11月1日
工具软件

NVIDIA AI 登陆 Oracle Cloud Marketplace

英伟达本周宣布，其人工智能（AI）技术现已可供甲骨文云市场中的企业使用。将 NVIDIA DGX 云 AI 超级计算平台和 NVIDIA AI 企业软件集成到 Oracle 云基础…

2023年10月21日
最新资讯

AI 映像生成搭配 NVIDIA GPU 的 Windows PC 上的速度提高了 7 倍

生成式AI是个人计算历史上最重要的趋势之一，现在在Windows PC上使用NVIDIA的开源库TensorRT-LLM for Windows的速度提高了4倍。这一进步将彻底改变…

2023年10月18日
最新资讯

使用 NVIDIA 和 Anyscale 更快地构建大型语言模型（LLM）

在人工智能领域的重大发展中，NVIDIA宣布与统一计算的先驱Anyscale进行战略合作。这种伙伴关系旨在加速大型语言模型（LLM）的开发，这是人工智能领域的一个关键组成部分。此次…

2023年9月19日
最新资讯

NVIDIA GeForce RTX 5090传闻：2.9 GHz升压时频、1.5 TB/s频距和128MB L2

Chiphell泄密者透露了NVIDIA下一代消费者GPU阵容的第一个细节，现在分享了有关新架构功能的新谣言。提醒一下，Panzerlied 是最初透露 NVIDIA 计划在其即…

2023年9月19日
最新资讯

NVIDIA GH200 Superchip基准测试Hopper GPU和Grace CPU组合

在人工智能和机器学习领域，NVIDIA GH200 Grace Hopper Superchip首次亮相。超级芯片在MLPerf行业基准测试中表现出卓越的性能，沉着地运行所有数据中…

2023年9月12日
Stable Diffusion XL NVIDIA TensorRT性能升级推出

在一项新的合作中，Stability AI 和 NVIDIA 联手增强了 Stability AI 的文本到图像生成 AI 产品 Stable Diffusion XL （SDXL…

工具软件 2023年8月24日
最新资讯

英伟达 OptiX 8 光线追踪框架发布

NVIDIA本周发布了OptiX 8，这是其强大框架的最新版本，旨在优化其GPU上的光线追踪性能。这一最新公告标志着 NVIDIA 致力于改进和推进 GPU 加速光线追踪领域的一个…

2023年8月10日
最新资讯

NVIDIA发布的Omniverse Generative AI和OpenUSD更新

NVIDIA公布了其Omniverse平台的重大升级。此次升级结合了OpenUSD框架和生成AI，将彻底改变3D管道。此次更新旨在加快虚拟世界的创建，并简化工业数字化的高级工作流程…

2023年8月9日
从浏览器上传大文件到 S3 时的最佳实践

Amazon S3 对于组织或企业持续备份其工作数据至关重要。这个过程确保了良好的连续性和问责制。一个有效的想法是通过Amazon Simple Storage Solution…

2022年5月27日 • Win 11
Amazon Graviton3 基准测试 – 使用 AWS EC2 C7g 提升性能

亚马逊宣布推出新的 Graviton3 处理器，其计算性能比之前的 Graviton2 AArch64 处理器高出约 25%，FP 和加密性能高达 2 倍，支持 DDR5 系统内存…

2022年5月25日 • 最新资讯

AWS 和 NVIDIA 正在构建的 65 台 ExaFLOP AI 超级计算机

正在建设中的新型AI超级计算机

65 ExaFLOP 的处理能力

亚马逊 NVIDIA 合作伙伴

AWS NVIDIA DGX 云托管

相关推荐