亚马逊云科技

广告

安信SSL证书

广告

亚马逊云科技推出Amazon EC2 G7e实例 推理性能提升高达2.3倍

美国云服务器推荐

亚马逊云科技云服务器Amazon EC2 G7e实例现已正式可用,搭载NVIDIA RTX PRO 6000 Blackwell服务器版GPU,目前已在美国东部(北弗吉尼亚州)与美国东部(俄亥俄州)的亚马逊云科技区域可用。相较于Amazon EC2 G6e实例,Amazon EC2 G7e实例的推理性能最高可提升2.3倍,非常适用于空间计算、科学计算等多种GPU加速型工作负载。

亚马逊云科技官网:点击直达自即日起至2026年12月31日,免费试用由AWS Graviton2处理器驱动的Amazon EC2 t4g.small实例,每月最高可使用750小时

Amazon EC2 G7e实例规格参数如下:

Amazon EC2 G7e

Amazon EC2 G7e实例最高可配置8块NVIDIA RTX PRO 6000 Blackwell服务器版GPU,GPU内存总量最高可达768GB(单块GPU配备96GB内存),并搭载Intel Emerald Rapids处理器,支持最高192个vCPU、1600Gbps网络带宽、2048GiB系统内存以及15.2TB本地NVMe SSD存储。支持On-Demand Instances、Savings Plan及Spot Instances三种方式购买,以及Dedicated Instances与Dedicated Hosts两种部署模式。

与前代实例相比,Amazon EC2 G7e实例的核心升级如下:

1、NVIDIA RTX PRO 6000 Blackwell GPU

相比Amazon EC2 G6e,Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存,用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。

2、NVIDIA GPUDirect P2P

对于单块GPU内存无法承载的模型,用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术,通过PCIe互连实现GPU间的直接通信,从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外,与G6e实例搭载的L40s GPU相比,G7e实例的GPU间带宽最高可提升4倍,大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务,并且这些GPU提供的GPU内存总容量可高达768GB。

3、网络性能

Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍,可满足小规模多节点工作负载的运行需求。同时,多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问(RDMA),有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage,与Amazon EC2 G6e实例相比,实例吞吐量最高可提升至1.2Tbps,助力用户更快加载模型。

相关推荐:

亚马逊免费云服务器Amazon EC2 T4g/x86领取及配置教程

亚马逊免费云服务器申请与使用教程

(本文由美国主机侦探原创,转载请注明出处“美国主机侦探”和原文地址!)

主机侦探企业微信

微信扫码加好友进群

主机优惠码及时掌握

主机侦探QQ群

QQ群号:938255063

主机优惠发布与交流

温馨提示:

1、本站部分图片来源于互联网,如有侵权请联系删除。邮箱:2942802716#qq.com(#改为@)

2、本文评论没有专人回复,如果您有问题请到美国主机侦探论坛提问!

3、美国主机侦探免费为您提供美国主机购买咨询。

RAKsmart美国服务器
下一篇
Amazon
已经没有了
返回顶部