UltraServer di HAQM EC2

Addestramento e inferenza dell'IA su larga scala

Perché utilizzare gli UltraServer di HAQM EC2?

Gli UltraServer di HAQM Elastic Compute Cloud (HAQM EC2) sono ideali per i clienti che cercano le massime prestazioni di addestramento e inferenza IA per modelli su scala di trilioni di parametri. Gli UltraServer collegano più istanze EC2 utilizzando un'interconnessione di acceleratori dedicata, ad alta larghezza di banda e bassa latenza che consente di sfruttare una rete di acceleratori strettamente accoppiati tra le istanze EC2, e di accedere a una quantità di calcolo e di memoria significativamente maggiore rispetto alle istanze EC2 autonome.

Gli UltraServer EC2 sono ideali per i modelli più grandi che richiedono più memoria e una larghezza di banda di memoria maggiore rispetto a quelle fornite dalle istanze EC2 autonome. Il design di UltraServer utilizza la connettività dell'acceleratore intra-istanza per collegare più istanze in un unico nodo, sbloccando nuove funzionalità. Per l'inferenza, gli UltraServer consentono di fornire tempi di risposta leader del settore per creare le migliori esperienze in tempo reale. Per l'addestramento, gli UltraServer aumentano la velocità e l'efficienza dell'addestramento dei modelli, grazie a una comunicazione collettiva più rapida per il parallelismo dei modelli rispetto alle istanze autonome. Gli UltraServer EC2 supportano la rete EFA e, quando implementati in UltraCluster EC2, consentono l'addestramento distribuito con aumento orizzontale su decine di migliaia di acceleratori su una rete non bloccante di una singola scala di petabit. Offrendo prestazioni più elevate sia per l'addestramento che per l'inferenza, gli UltraServer accelerano il time-to-market e consentono di fornire applicazioni in tempo reale basate sui modelli di fondazione più performanti e di nuova generazione.

Vantaggi

Gli UltraServer consentono l'addestramento e l'inferenza efficienti di modelli con centinaia di miliardi o trilioni di parametri collegando un set più ampio di acceleratori con un'interconnessione a larghezza di banda elevata e bassa latenza per fornire più calcolo e memoria rispetto alle istanze EC2 autonome.

Gli UltraServer consentono l'inferenza in tempo reale per modelli ultra-grandi che richiedono notevoli risorse di memoria e di larghezza di banda della memoria oltre a quelle che una singola istanza EC2 può offrire.

Gli UltraServer consentono una comunicazione collettiva più rapida per il parallelismo dei modelli rispetto alle istanze autonome, aiutandoti a ridurre i tempi di addestramento.

Caratteristiche

Puoi avviare le istanze in un UltraServer e sfruttare un'interconnessione dell'acceleratore dedicata, a larghezza di banda elevata e a bassa latenza tra queste istanze. Gli UltraServer consentono l'accesso a un numero maggiore di acceleratori collegati a questa interconnessione dedicata, offrendo una quantità significativamente maggiore di calcolo e memoria in un singolo nodo rispetto alle istanze EC2 autonome.

Gli UltraServer EC2 implementati in EC2 UltraClusters sono interconnessi con la rete EFA su scala petabit per migliorare le prestazioni dei carichi di lavoro di addestramento distribuiti.

Puoi utilizzare gli UltraServer EC2 insieme a soluzioni di archiviazione ad alte prestazioni come HAQM FSx per Lustre, l'archiviazione condivisa completamente gestita basata sul più popolare file system parallelo ad alte prestazioni. Inoltre, è possibile utilizzare uno spazio di archiviazione economico e virtualmente illimitato con HAQM Simple Storage Service (HAQM S3).

Gli UltraServer EC2 sono basati su AWS Nitro System, una ricca raccolta di componenti di base che delegano molte delle tradizionali funzioni di virtualizzazione all'hardware e al software dedicati. Nitro offre prestazioni, disponibilità e sicurezza elevate riducendo il sovraccarico della virtualizzazione.

Istanze supportate

Istanze Trn2

Alimentate dai chip AWS Trainium2, le istanze Trn2 in una configurazione UltraServer Trn2 (disponibile in anteprima) consentono di scalare fino a 64 chip Trainium2 collegati a NeuronLink, l'interconnessione dedicata ad alta larghezza di banda e bassa latenza per i chip di IA AWS. Gli UltraServer Trn2 offrono prestazioni rivoluzionarie in HAQM EC2 per l'addestramento e l'inferenza dell'IA generativa.

Ulteriori informazioni