HAQM Web Services 한국 블로그
HAQM EC2 NVIDIA GPU 가속 인스턴스 최대 45% 가격 인하 발표
산업 전반의 고객들은 AWS에서 생성형 AI를 활용하여 직원 생산성을 높이고, 탁월한 고객 경험을 제공하며, 비즈니스 프로세스를 효율화하고 있습니다. 하지만 GPU 수요의 증가가 업계 전반의 공급을 앞지르면서 GPU는 희소한 자원이 되었고, 이를 확보하는 비용도 상승했습니다.
HAQM Web Services(AWS)는 성장함에 따라 비용 절감을 위해 끊임없이 노력하고 있으며, 이렇게 절감된 비용을 고객에게 환원하고 있습니다. AWS 서비스의 정기적인 가격 인하는, 규모의 경제를 통해 얻은 효율성을 고객에게 돌려드리기 위해 행해온 AWS의 전통입니다.
오늘 HAQM Elastic Compute Cloud(HAQM EC2) NVIDIA GPU 가속 인스턴스(P4(P4d 및 P4de)와 P5(P5 및 P5en) 인스턴스 유형)에 대해 최대 45%의 가격 인하를 발표합니다. 이번 가격 인하는 해당 인스턴스가 제공되는 모든 리전의 온디맨드 및 절감형 플랜 가격에 적용됩니다. 온디맨드 구매는 6월 1일부터, 절감형 플랜 구매는 6월 4일 이후부터 가격 인하가 적용됩니다.
아래 표는 2025년 5월 31일 기준 가격에서 인스턴스 유형 및 요금제별 가격 인하 비율(%)을 나타냅니다.
인스턴스 유형 | NVIDIA GPU | 온디맨드 | EC2 인스턴스 절감형 플랜 | 컴퓨팅 절감형 플랜 |
||
1년 | 3년 | 1년 | 3년 | |||
P4d | A100 | 33% | 31% | 25% | 31% | – |
P4de | A100 | 33% | 31% | 25% | 31% | – |
P5 | H100 | 44% | – | 45% | 44% | 25% |
P5en | H200 | 25% | – | 26% | 25% | – |
절감형 플랜은 일정한 사용량(시간당 $/시간 단위)에 대해 1년 또는 3년 기간 동안 약정하는 조건으로 컴퓨팅 사용에 대해 낮은 요금을 제공하는 유연한 요금제입니다. 두 가지 유형의 절감형 플랜을 제공합니다:
- EC2 인스턴스 절감형 플랜: 특정 리전 내 개별 인스턴스 패밀리(예: 미국(버지니아 북부) 리전의 P5 사용)에 대한 약정을 조건으로 가장 낮은 요금을 제공합니다.
- 컴퓨팅 절감형 플랜: 인스턴스 패밀리, 크기, 가용 영역, 리전에 관계없이 비용을 절감할 수 있도록 가장 큰 유연성을 제공합니다(예: P4d에서 P5en 인스턴스로, 미국 리전 간 워크로드 이동 등).
더 많은 고객이 낮아진 가격을 이용할 수 있도록, 다음 리전에서 대규모 온디맨드 용량을 제공합니다:
- P4d 인스턴스: 아시아 태평양(서울), 아시아 태평양(시드니), 캐나다(중부), 유럽(런던) 리전
- P4de 인스턴스: 미국 동부(버지니아 북부) 리전
- P5 인스턴스: 아시아 태평양(뭄바이), 아시아 태평양(도쿄), 아시아 태평양(자카르타), 남아메리카(상파울루) 리전
- P5en 인스턴스: 아시아 태평양(뭄바이), 아시아 태평양(도쿄), 아시아 태평양(자카르타) 리전
또한, 대규모 배포를 지원하기 위해 절감형 플랜을 통해 HAQM EC2 P6-B200 인스턴스를 제공하고 있습니다. 이 인스턴스는 2025년 5월 15일에 EC2 Capacity Blocks for ML을 통해서만 출시되었습니다. NVIDIA Blackwell GPU가 탑재된 EC2 P6-B200 인스턴스는 다양한 GPU 기반 워크로드를 가속화하며, 특히 대규모 분산 AI 학습 및 추론에 적합합니다.
이번 가격 업데이트는 첨단 GPU 컴퓨팅을 보다 쉽게 이용할 수 있도록 하고, 절감된 비용을 고객에게 직접 환원하려는 AWS의 의지를 반영합니다.
HAQM EC2 콘솔에서 HAQM EC2 NVIDIA GPU 가속 인스턴스를 직접 사용해보세요. 이 가격 업데이트에 대해 더 자세히 알아보려면 HAQM EC2 요금 페이지를 방문하시고, EC2 관련 문의는 AWS re:Post for EC2 또는 평소 이용하시는 AWS Support 채널을 통해 전달해주시기 바랍니다.
— Channy