Pourquoi choisir les instances HAQM EC2 G4 ?
Les instances G4 d'HAQM EC2 sont les instances GPU les plus rentables et les plus polyvalentes du marché pour le déploiement de modèles de machine learning tels que la classification d'images, la détection d'objets et la reconnaissance vocale, et pour les applications à forte intensité graphique telles que les stations de travail graphiques à distance, le streaming de jeux et le rendu graphique. Les instances G4 sont disponibles avec une série de GPU NVIDIA (G4dn) ou GPU AMD (G4ad).
Les instances G4dn sont équipées de GPU NVIDIA T4 et de CPU Intel Cascade Lake personnalisés, et sont optimisées pour l'inférence de machine learning et l'entraînement à petite échelle. Ces instances confèrent également des performances élevées aux applications à forte intensité graphique, notamment les postes de travail à distance, le streaming de jeux et le rendu graphique. Ces instances sont également idéales pour les clients qui préfèrent utiliser les logiciels NVIDIA tels que RTX Virtual Workstation et les bibliothèques telles que CUDA, CuDNN et NVENC.
Les instances G4ad sont équipées des derniers GPU AMD Radeon Pro V520 et des processeurs AMD EPYC de 2e génération. Ces instances offrent le meilleur rapport prix/performances dans le cloud pour les applications graphiques, notamment les postes de travail à distance, le streaming de jeux et le rendu graphique. Par rapport aux instances comparables, elles offrent un rapport prix/performances jusqu'à 45 % supérieur pour les applications à forte intensité graphique.
Nouvelles instances HAQM EC2 G4ad
Instances G4dn d'HAQM EC2
Les instances G4dn, alimentées par les GPU NVIDIA T4, sont les instances basées sur les GPU les moins chères du cloud pour l'inférence de machine learning et l'entraînement à petite échelle. Elles délivrent également de hautes performances et sont une solution rentable pour les applications graphiques optimisées par des GPU NVIDIA utilisant des bibliothèques telles que CUDA, CuDNN et NVENC. Elles offrent jusqu'à 8 GPU NVIDIA T4, 96 vCPU, des réseaux à 100 Gbit/s et 1,8 To de stockage SSD local basé sur NVMe et sont également disponibles en tant qu'instances matériel nu.
Avantages du G4dn
Fonctionnalités du G4dn
Instances HAQM EC2 G4ad
Les instances G4ad, alimentées par les GPU AMD Radeon Pro V520, offrent les meilleures performances en termes de prix pour les applications graphiquement exigeantes dans le cloud. Ces instances offrent un rapport prix/performances jusqu'à 45 % supérieur par rapport aux instances G4dn, qui étaient déjà les instances les moins chères du cloud, pour les applications graphiques telles que les stations de travail graphiques à distance, le streaming de jeux et le rendu qui exploitent les API standard du secteur comme OpenGL, DirectX et Vulkan. Elles offrent jusqu'à 4 GPU AMD Radeon Pro V520, 64 vCPU, des réseaux de 25 Gbit/s et un stockage SSD NVMe local de 2,4 To.
Avantages du G4ad
Caractéristiques du G4ad
Témoignages des clients et des partenaires
Voici quelques exemples de la manière dont les clients et partenaires ont atteint leurs objectifs métier grâce aux instances HAQM EC2 G4.
-
Ubitus
Ubitus est une société innovante qui ouvre la voie à la création d'une technologie de jeux sur le cloud. Grâce à leurs plateformes, les utilisateurs peuvent profiter d'une expérience de jeu AAA sur n'importe quel appareil, y compris les smartphones, les tablettes, les consoles de jeu, les téléviseurs intelligents et les ordinateurs, pour autant qu'ils soient connectés à un réseau à large bande.
Lire l'étude de casUbitus a tiré parti des capacités GPU d’AWS pour s’associer à IO Interactive afin de diffuser une version cloud de Hitman 3 sur un appareil de jeu hautement portable. Avec l'introduction des instances G4ad d'HAQM EC2, nous avons pu adapter jusqu'à 50 % de flux simultanés supplémentaires par instance sans modifier aucun code, ce qui nous a permis d'optimiser nos coûts. La structure de coûts réduite nous permet de proposer davantage de jeux, comme Hitman 3, aux joueurs du monde entier.
Wesley Kuo, PDG – Ubitus -
Land F/X
Land F/X tire parti de l’accélération du GPU pour aider les professionnels de la conception tout en optimisant leurs performances et leurs coûts. Land F/X utilisait des instances G4dn pour son développement et, avec le lancement de G4ad, a pu rapidement migrer son utilisation, ce qui a permis d’améliorer de 67 % les performances de rendu tout en économisant 25 % par rapport à l’utilisation antérieure du GPU.
Jeremiah Farmer, PDG/développeur - Land F/X -
Duolingo
Duolingo est une plateforme gratuite d'enseignement des langues qui est devenue le moyen le plus populaire d'apprendre des langues en ligne. Les spécialistes de l'apprentissage des langues, les ingénieurs en machine learning et les experts en IA de Duolingo utilisent les données de plus de 300 millions d'apprenants pour améliorer constamment l'efficacité de la plateforme.
Lire l'étude de casAu fur et à mesure que nos équipes de ML et de recherche se sont développées, nous avons décidé de mettre à jour notre infrastructure de calcul existante basée sur HAQM ECS pour prendre en charge les types d’instance basés sur les GPU HAQM EC2 P3 et G4 afin de mieux mettre à l’échelle notre modèle de développement. Les AMI optimisées par ECS d'HAQM pour les instances GPU nous ont aidés à rendre le nouveau cluster opérationnel très rapidement. Nous avons constaté que les instances G4 ont doublé nos vitesses d'apprentissage ML par rapport aux instances P2, ce qui a permis de réaliser une économie de 33 %, tandis que les instances P3 ont quadruplé les performances et permis de réaliser une économie de 15 %. Dans l’ensemble, les instances G4 conviennent à nos cas d’utilisation générale, car elles offrent un bon équilibre entre le coût et les performances, et les instances P3 sont idéales lorsque la vitesse supplémentaire est essentielle pour une charge de travail particulière.
Max Blaze, ingénieur des opérations du personnel - Duolingo -
Blacknut
Blacknut est le principal service indépendant de jeux sur le cloud qui offre au grand public une expérience de type « cliquez et jouez », sur n’importe quel appareil, à partir d’un catalogue de plus de 500 jeux vidéo. Pour remplir notre mission de fournir une faible latence, des temps de chargement rapides et une expérience de jeu fluide, nous devons être situés aussi près que possible des joueurs. Grâce aux instances G4dn EC2, nous pouvons offrir à nos joueurs un temps de chargement moyen de 10 secondes ou moins par jeu, garantissant ainsi une expérience de jeu globalement positive. Nous pouvons également lancer notre solution sur de nouveaux marchés en moins de 2 mois. Cette réactivité nous a permis de déployer de nouveaux partenaires mondiaux chaque mois depuis 2020, notamment Telecom Italia, Swisscom, POST, Drei Austria, et Ais en Thaïlande. Notre service est désormais actif sur plus de 40 marchés.
Pascal Manchon, directeur technique, Blacknut -
Snap
En 2018, Snap Inc. (Snap), connue pour son application de messagerie Snapchat, a eu une nouvelle idée intrigante : créer une série de vidéos animées mettant en scène le Bitmoji de chaque utilisateur, l'avatar de dessin animé personnalisé qui est la caractéristique de Snapchat. Chaque semaine, Bitmoji TV présentait de nouveaux épisodes composés de vidéos de 3 à 8 minutes, loufoques, animées et scénarisées par des professionnels, dans lesquelles les Bitmojis des utilisateurs et de leurs amis étaient les vedettes, allant de la lutte contre les zombies à la participation à des « Moonlympics » en gravité réduite. Grâce aux instances G4 d'HAQM EC2, Snap a pu créer un type de divertissement personnalisé amusant et audacieux, dont le rendu était suffisamment rapide pour que des millions de personnes puissent en profiter simultanément, tout en maintenant des coûts de calcul faibles.
Lire l'étude de casAvec les instances G4 d’HAQM EC2 par rapport aux instances G3 d’HAQM EC2, nous obtenions une augmentation de 50 % pour un coût supérieur de 10 %.
Brad Kotsopolous, ingénieur logiciel - Snap Inc. -
Nearmap
Nearmap a été fondée à Perth, en Australie, en 2007 et est passée d'une petite start-up à un leader de l'imagerie numérique. L'entreprise est spécialisée dans la création d'images 2D et 3D à partir de photos aériennes de paysages, une ressource précieuse pour une grande variété d'industries. Pour Nearmap, l'impact de la mise à niveau vers les instances G4 d'HAQM EC2 a été immédiat et profond : l'entreprise a pu traiter trois fois plus de données pour le même coût qu'avec les instances G2 d'HAQM EC2, selon un processus qui semblait sans effort et dont l'intégration était transparente avec les outils AWS qu'elle utilisait déjà.
Lire l'étude de casNos clients comptent sur nous pour fournir des modèles de réalité 3D très précis calculés à partir de photographies aériennes sous divers angles sur de vastes zones de couverture. Nous utilisons environ 870 000 cœurs de GPU par jour. Nous exécutions ce pipeline sur des instances G2 d’HAQM EC2, mais nous sommes passés aux instances G4 d’HAQM EC2 et avons réduit nos coûts de 67 %.
John Corbett, directeur - Vision Systems -
Untold Studios
Untold Studios a déployé diverses configurations de postes de travail virtuels AWS, notamment des instances G4, dotées de GPU NVIDIA T4 et de la technologie RTX, et optimisées pour les flux de VFX et d'animation. Grâce à l'élargissement des options d'instance, Untold Studios peut faire correspondre plus précisément les types de machines virtuelles à des applications spécifiques, une approche qui est bénéfique tant sur le plan créatif qu'économique.
G4 a eu un impact considérable sur notre façon de travailler. Nous pouvons mettre à niveau toute une flotte de postes de travail avec une seule ligne de code. Les artistes peuvent ainsi travailler plus rapidement et améliorer la créativité dans tout ce qu’ils font.
Sam Reid, directeur de la technologie, Untold Studios -
Hive VFX
Les stations de travail ont d'abord été déployées avec des instances G3 d'HAQM Elastic Compute Cloud (HAQM EC2). Mais lorsque les instances G4 d'HAQM EC2 (optimisées par les GPU NVIDIA T4 Tensor Core [la dernière génération de GPU de NVIDIA] et la technologie NVIDIA RTX, la toute dernière technologie pour la simulation, le rendu et la conception de haute performance) sont devenues disponibles, Hive VFX a pu se mettre à niveau facilement et rapidement.
La mise à niveau de l’instance G3 à G4 a été simple et, en quelques minutes, les artistes ont eu accès à une nouvelle génération de GPU NVIDIA offrant les performances graphiques de dernière génération sur ordinateur. Les performances des stations de travail que nous obtenons avec les instances G4 sont bien supérieures à celles de certains grands studios et plus que suffisantes pour nos besoins.
Bernie Kimbacher, fondateur – Hive VFX -
Humen
La publicité Doritos pour le Super Bowl 2020 présentait un concours de danse entre l'acteur Sam Elliott, 75 ans, et le rappeur Lil Nas X, 21 ans, une compétition rendue possible grâce à une technologie d'intelligence artificielle développée par une start-up appelée Humen, la société mère de Sway. Cette minuscule entreprise a pu obtenir un partenariat avec la méga-compagnie Doritos pour une campagne du Super Bowl et lancer Sway, une application qui s'est hissée en tête des classements de l'App Store, avec l'aide d'HAQM Web Services (AWS). Pour assumer la charge de travail colossale que représentait le lancement d'une application à forte intensité graphique pendant le Super Bowl, Humen a utilisé des instances HAQM Elastic Compute Cloud (HAQM EC2) G4 et obtenu d'excellents résultats.
Lire l'étude de casAvec les instances HAQM EC2 G4, j’ai pu, en six mois environ, rendre Sway capable de gérer l’échelle du Super Bowl.
Jesse Myers, ingénieur - Humen -
The Molecule
Les logiciels d’effets visuels s’appuient de plus en plus sur la puissance des GPU, et quand on en a besoin, on en a vraiment besoin, mais ce n’est pas tous les jours. En tant que petite entreprise, nous ne pouvons pas nous permettre d'acheter une voiture de course pour aller à l'épicerie ; nous ne pouvons pas nous permettre d'acheter quelque chose et de ne pas l'utiliser tous les jours. Nous ne pouvons pas non plus en acheter 10 pour un projet aux exigences uniques. Mais avec les instances G4, nous avons accès à une flotte de voitures de course équipées de GPU qui sont meilleures et plus rapides que tout ce que nous pourrions acheter, mais sans avoir à payer pour elles lorsque nous n'en avons pas besoin. Les artistes sont ravis d’avoir accès aux voitures de course, et nous sommes heureux de les rendre lorsqu’elles ne sont plus nécessaires !
Chris Healer, président - The Molecule -
PureWeb
Chez PureWeb, nous nous efforçons de fournir la meilleure plateforme au monde pour le streaming en temps réel de contenu interactif pour les entreprises. Ainsi, lorsque le Salon international de l'automobile de Genève a été annulé en raison de la COVID-19, Volkswagen nous a contactés pour que nous proposions une solution innovante consistant à fournir une expérience de salle d'exposition virtuelle à ses clients, afin de s'adapter à la situation. En travaillant en étroite collaboration avec AWS, ainsi qu'avec nos partenaires de l'agence de création, nous avons pu obtenir une réplique virtuelle de la salle d'exposition, créée dans le moteur de jeu Unity, fonctionnant sur notre plateforme à l'aide d'instances G4dn d'HAQM EC2 en seulement trois semaines. Ainsi, des milliers d'utilisateurs ont pu profiter du stand Volkswagen du salon de l'automobile de Genève depuis chez eux. Compte tenu des contraintes de temps et techniques du projet, nous sommes convaincus qu’AWS est le seul fournisseur de services cloud qui aurait pu nous aider à accomplir notre tâche et à offrir aux utilisateurs une expérience stable, évolutive, rentable et véritablement mondiale.
Chris Jarabek, architecte de logiciel senior - PureWeb
Informations sur le produit
Taille d'instance | GPU | vCPU | Mémoire (Gio) | Stockage d'instance (Go) | Bande passante réseau (Gbit/s) | Bande passante EBS (Gbit/s) | Prix/heure pour les instances à la demande* | Tarif horaire effectif des instances réservées sur 1 an* (Linux) | Tarif horaire effectif des instances réservées sur 3 ans (Linux)* | |
G4dn |
||||||||||
Machines virtuelles de GPU unique | g4dn.xlarge | 1 | 4 | 16 | 1 disque SSD NVMe de 125 | Jusqu'à 25 | Jusqu'à 3,5 | 0,526 USD | 0,316 USD | 0,210 USD |
g4dn.2xlarge | 1 | 8 | 32 | 1 disque SSD NVMe de 225 | Jusqu'à 25 | Jusqu'à 3,5 | 0,752 USD | 0,452 USD | 0,300 USD | |
g4dn.4xlarge | 1 | 16 | 64 | 1 disque SSD NVMe de 225 | Jusqu'à 25 | 4,75 | 1,204 USD | 0,722 USD | 0,482 USD | |
g4dn.8xlarge | 1 | 32 | 128 | 1 disque SSD NVMe de 900 | 50 | 9,5 | 2,176 USD | 1,306 USD | 0,870 USD | |
g4dn.16xlarge | 1 | 64 | 256 | 1 disque SSD NVMe de 900 | 50 | 9,5 | 4,352 USD | 2,612 USD | 1,740 USD | |
VM de GPU multiples | g4dn.12xlarge | 4 | 48 | 192 | 1 disque SSD NVMe de 900 | 50 | 9,5 | 3,912 USD | 2,348 USD | 1,564 USD |
g4dn.metal | 8 | 96 | 384 | 2 disques SSD NVMe de 900 | 100 | 19 | 7,824 USD | 4,694 USD | 3,130 USD | |
G4ad |
||||||||||
Machines virtuelles de GPU unique | g4ad.xlarge | 1 | 4 | 16 | 1 disque SSD NVMe de 150 | Jusqu'à 10 | Jusqu'à 3 | 0,379 USD | 0,227 USD | 0,178 USD |
g4ad.2xlarge | 1 | 8 | 32 | 1 disque SSD NVMe de 300 | Jusqu'à 10 | Jusqu'à 3 | 0,541 USD | 0,325 USD | 0,254 USD | |
g4ad.4xlarge | 1 | 16 | 64 | 1 disque SSD NVMe de 600 | Jusqu'à 10 | Jusqu'à 3 | 0,867 USD | 0,520 USD | 0,405 USD | |
VM de GPU multiples | g4ad.8xlarge | 2 | 32 | 128 | 1 disque SSD NVMe de 1 200 | 15 | 3 | 1,734 USD | 1,040 USD | 0,810 USD |
g4ad.16xlarge | 4 | 64 | 256 | 1 disque SSD NVMe de 2 400 | 25 | 6 | 3,468 USD | 2,081 USD | 1,619 USD |
*Prix pour la région AWS USA Est (Virginie du Nord). Les tarifs pour 1 an et 3 ans des instances réservées correspondent aux options de paiement « Frais initiaux partiels » ou « Aucuns frais initiaux » pour les instances sans l’option Frais initiaux partiels.
Démarrer avec les instances G4dn
Utilisation d'AMI et de conteneurs pré-intégrés d'AWS
Au moyen des AMI de deep learning ou de Deep Learning Containers d'HAQM, vous pouvez rapidement lancer des instances HAQM EC2 préinstallées avec des structures de deep learning fréquemment utilisées telles que TensorFlow, PyTorch et MXNet pour entraîner des modèles d'IA sur mesure et sophistiqués, expérimenter de nouveaux algorithmes ou apprendre de nouvelles compétences et techniques. Pour en savoir plus, visitez la page produit d’HAQM Deep Learning AMI ou la page produit d’AWS Deep Learning Containers.
Les AMI RTX Virtual Workstation NVIDIA permettent d’exécuter jusqu’à quatre écrans 4K par GPU pour les applications de visualisation. Les AMI de jeu NVIDIA rendent les vidéos à 60 FPS et prennent en charge l’exécution d’un seul écran 4K sur une base par GPU.
Conception de votre AMI personnalisée avec des pilotes NVIDIA
Les pilotes de centre de données NVIDIA offrent les meilleures performances pour les applications de calcul hautement intensives que l'on retrouve souvent dans le deep learning, la science des données et le calcul haute performance (HPC).
Les pilotes NVIDIA RTX peuvent être utilisés pour activer le logiciel NVIDIA RTX Virtual Workstation. RTX vWS permet de prendre en charge jusqu'à quatre écrans 4K par GPU. Les pilotes de jeu NVIDIA prennent en charge les cartes graphiques, les solutions de jeu et les technologies de jeu les plus avancées au monde. Ce pilote prend en charge un seul écran 4K par GPU.
Pour savoir comment installer ces pilotes sur votre instance, suivez ces liens pour Linux et Windows.
Démarrer avec les instances G4ad
Utilisation d'AMI pré-intégrées provenant d'AWS
Les pilotes AMD Radeon Pro Software for Enterprise fournissent des graphismes de haute performance pour les stations de travail virtuelles, le streaming de jeux, le rendu et d'autres applications graphiques. Pour commencer rapidement, vous pouvez utiliser les AMI fournies par AWS qui incluent le logiciel AMD Radeon Pro Software for Enterprise préinstallé. Ces AMI sont disponibles sur AMD Radeon Pro Marketplace.
Conception de votre AMI personnalisée avec des pilotes AMD
Les pilotes AMD Radeon Pro Software for Enterprise peuvent être utilisés pour configurer des instances avec des graphismes de qualité professionnelle puissants et fiables. Les stations de travail équipées de ces pilotes peuvent prendre en charge jusqu'à deux écrans 4K.
Pour savoir comment installer ces pilotes sur votre instance afin de créer votre propre AMI personnalisée, suivez ces liens pour Linux et Windows.