亚马逊云科技推出Amazon EC2 G7e实例推理性能提升高达2.3倍

亚马逊云科技云服务器Amazon EC2 G7e实例现已正式可用，搭载NVIDIA RTX PRO 6000 Blackwell服务器版GPU，目前已在美国东部（北弗吉尼亚州）与美国东部（俄亥俄州）的亚马逊云科技区域可用。相较于Amazon EC2 G6e实例，Amazon EC2 G7e实例的推理性能最高可提升2.3倍，非常适用于空间计算、科学计算等多种GPU加速型工作负载。

亚马逊云科技官网：点击直达（自即日起至2026年12月31日，免费试用由AWS Graviton2处理器驱动的Amazon EC2 t4g.small实例，每月最高可使用750小时）

Amazon EC2 G7e实例规格参数如下：

Amazon EC2 G7e实例最高可配置8块NVIDIA RTX PRO 6000 Blackwell服务器版GPU，GPU内存总量最高可达768GB（单块GPU配备96GB内存），并搭载Intel Emerald Rapids处理器，支持最高192个vCPU、1600Gbps网络带宽、2048GiB系统内存以及15.2TB本地NVMe SSD存储。支持On-Demand Instances、Savings Plan及Spot Instances三种方式购买，以及Dedicated Instances与Dedicated Hosts两种部署模式。

与前代实例相比，Amazon EC2 G7e实例的核心升级如下：

1、NVIDIA RTX PRO 6000 Blackwell GPU

相比Amazon EC2 G6e，Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU，提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存，用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。

2、NVIDIA GPUDirect P2P

对于单块GPU内存无法承载的模型，用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术，通过PCIe互连实现GPU间的直接通信，从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外，与G6e实例搭载的L40s GPU相比，G7e实例的GPU间带宽最高可提升4倍，大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务，并且这些GPU提供的GPU内存总容量可高达768GB。

3、网络性能

Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍，可满足小规模多节点工作负载的运行需求。同时，多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问（RDMA），有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage，与Amazon EC2 G6e实例相比，实例吞吐量最高可提升至1.2Tbps，助力用户更快加载模型。