亚马逊AWS官方博客
HAQM EC2 NVIDIA GPU 加速型实例降价,幅度高达 45%!
各行各业的客户都在利用 AWS 上生成式人工智能的力量来提高员工的工作效率、提供卓越的客户体验并简化业务流程。但是,对 GPU 容量需求的增长已经超过了整个行业的供应水平,GPU 因而成为稀缺资源,其安全成本也相应增加。
随着 HAQM Web Services(AWS)的发展,我们努力降低成本,这样我们就可以将节省的资金回馈给客户。AWS 服务的定期降价一直是 AWS 将从我们的规模所带来的经济效益回馈给客户的标准方式。
现在,我们宣布对 HAQM Elastic Compute Cloud(HAQM EC2)NVIDIA GPU 加速型实例降价高达 45%:P4(P4d 和 P4de)和 P5(P5 和 P5en)实例类型。按需和节省计划定价的降价适用于提供这些实例的所有区域。降价适用于 6 月 1 日开始的按需购买和 6 月 4 日之后生效的节省计划购买。
以下是按实例类型和定价计划列出的自 2025 年 5 月 31 日基准价格以来的降价百分比(%)表:
实例类型 | NVIDIA GPU 数 | 按需 | EC2 实例节省计划 | 计算类节省计划 |
||
1 年 | 3 年 | 1 年 | 3 年 | |||
P4d | A100 | 33% | 31% | 25% | 31% | – |
P4de | A100 | 33% | 31% | 25% | 31% | – |
P5 | H100 | 44% | – | 45% | 44% | 25% |
P5en | H200 | 25% | – | 26% | 25% | – |
节省计划是一种灵活的定价模式,提供较低的计算使用量价格,以换取承诺在 1 年或 3 年期内保持稳定的使用量(以美元/小时计算)。我们提供两种类型的节省计划:
- EC2 实例节省计划提供最低的价格,提供优惠以换取承诺在某个区域使用单个实例系列(例如,美国(弗吉尼亚州北部)区域的 P5 使用量)。
- 无论实例系列、规模、可用区和区域如何(例如,从 P4d 到 P5en 实例,在美国区域之间转移工作负载),计算类节省计划都能提供最大的灵活性并有助于降低成本。
为了提高降价的可获取性,我们正在大规模提供按需容量,用于:
- 亚太地区(首尔)、亚太地区(悉尼)、加拿大(中部)和欧洲地区(伦敦)区域的 P4d 实例
- 美国东部(弗吉尼亚州北部)区域的 P4de 实例
- 亚太地区(孟买)、亚太地区(东京)、亚太地区(雅加达)和南美洲(圣保罗)区域的 P5 实例
- 亚太地区(孟买)、亚太地区(东京)和亚太地区(雅加达)区域的 P5en 实例
我们现在还通过节省计划交付 HAQM EC2 P6-B200 实例,以支持大规模部署,该计划于 2025 年 5 月 15 日发布时仅通过适用于 ML 的 EC2 容量块提供。由 NVIDIA Blackwell GPU 提供支持的 EC2 P6-B200 实例可加速各种支持 GPU 的工作负载,但特别适合大规模的分布式人工智能训练和推理。
这些定价更新反映了 AWS 的承诺,即让高级 GPU 计算更容易获得,同时将节省的成本直接回馈给客户。
在 HAQM EC2 控制台中尝试使用 HAQM EC2 NVIDIA GPU 加速型实例。要了解有关这些定价更新的更多信息,请访问 HAQM EC2 定价页面并将反馈发送至 AWS re:Post for EC2,或者通过常用的 AWS Support 联系人发送反馈。
— Channy
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。