Caratteristiche di HAQM Athena

Perché Athena?

HAQM Athena è un servizio interattivo di esecuzione di query che semplifica l'analisi di dati in HAQM S3 con SQL standard. Athena è serverless, quindi non è necessaria alcuna infrastruttura da configurare o gestire e puoi scegliere di pagare in base alle query eseguite o all'elaborazione richiesta dalle tue query. Athena può essere utilizzato per elaborare log, eseguire analisi dei dati ed eseguire query interattive. Athena ridimensiona automaticamente le risorse, eseguendo anche query in parallelo, in modo da ottenere risultati rapidi anche in caso di set di dati di grandi dimensioni e query complesse.  

Page Topics

Vantaggi principali

Vantaggi principali

Open all

HAQM Athena è un servizio serverless, quindi non è presente alcuna infrastruttura da gestire. Non è più necessario preoccuparsi per configurazione, aggiornamenti software, errori o ricalibrazione delle risorse quando set di dati e utenti aumentano. Di tutto questo si occupa Athena automaticamente; sarà possibile concentrare la propria attenzione sui dati.

Per iniziare, accedi alla console di Athena, definisci uno schema utilizzando la procedura guidata oppure immettendo istruzioni DDL, quindi inizia a inoltrare query con l'editor di query integrato. Puoi anche utilizzare AWS Glue per scansionare automaticamente i dati, individuarne gli schemi e compilare il catalogo con definizioni di tabella e partizione nuove e modificate. I risultati vengono visualizzati nella console in pochi secondi e trascritti automaticamente in un percorso personalizzato in S3. Potrai anche scaricarli in locale. Con Athena non sono necessarie complesse attività ETL per preparare i dati per l'analisi. In questo modo è ancora più semplice analizzare set di dati di grandi dimensioni con competenze SQL.

HAQM Athena si basa su Trino e Presto, motori SQL open source, distribuiti e ottimizzati per l'analisi interattiva dei dati a bassa latenza. Sarà quindi possibile eseguire query su grandi set di dati in HAQM S3 utilizzando SQL ANSI, con supporto completo per join, funzioni finestra e array. Athena supporta un'ampia gamma di formati, tra cui CSV, JSON, ORC, Avro e Parquet. Con i connettori di origine dati federati di Athena, puoi eseguire query su archivi dati aggiuntivi e unire i dati ai dati archiviati in Simple Storage Service (HAQM S3). Puoi accedere ad Athena ed eseguire query dalla console Athena, API, CLI, SDK AWS e applicazioni di business intelligence e sviluppo SQL supportate tramite i driver JDBC e ODBC di Athena.

HAQM Athena offre due modelli di prezzo flessibili. Per impostazione predefinita, le query vengono fatturate in base ai dati scansionati per query in terabyte (TB). Ciò consente di inviare domande senza pianificare in anticipo l'elaborazione. Se preferisci pagare in base all'elaborazione utilizzata dalle tue query o desideri controllare la concorrenza e dare priorità ai carichi di lavoro, utilizza i prezzi basati sulla capacità disponibili con Capacità assegnata. Per una maggiore flessibilità, puoi utilizzare contemporaneamente la fatturazione per query e i prezzi basati sulla capacità nello stesso account.

Con HAQM Athena non sono più necessarie interventi manuali per gestire e ottimizzare i cluster e ottenere le migliori prestazioni. Il servizio è ottimizzato per ottenere prestazioni elevate con HAQM S3. Inoltre esegue automaticamente query in parallelo per ottenere risultati in pochi secondi anche su set di dati di grandi dimensioni.  

HAQM Athena è un servizio con disponibilità elevata che esegue query utilizzando risorse di calcolo che si trovano in diverse strutture e, in base alla disponibilità di queste, instrada automaticamente le query. Athena usa HAQM S3 come datastore, rendendo i dati altamente disponibili e durevoli. HAQM S3 fornisce un'infrastruttura durevole per memorizzare i dati più importanti ed è progettato per garantire una durabilità degli oggetti pari al 99,999999999%. I dati vengono archiviati in modo ridondante in più strutture e in più dispositivi all'interno di ogni struttura.

HAQM Athena consente di controllare l'accesso ai dati mediante le policy di AWS Identity and Access Management (IAM), le liste di controllo degli accessi (ACL) e le policy dei bucket HAQM S3. Con le policy di IAM, è possibile fornire agli utenti di IAM controllo granulare sui bucket S3. Controllando l'accesso ai dati in S3, è possibile limitare il numero di utenti che possono eseguire le query con Athena. Inoltre, Athena consente di eseguire query sui dati crittografati in HAQM S3 e di riscrivere i risultati, sempre crittografati, nel bucket S3. Supporta la crittografia sul lato server e lato client.

HAQM Athena si integra di default con AWS Glue. Grazie al catalogo dati di AWS Glue, è possibile creare un repository di metadati unificato su più servizi, scansionare automaticamente i dati per individuarne gli schemi e compilare il catalogo con definizioni di tabella e partizione nuove e modificate e conservare le varie versioni degli schemi. Inoltre, è possibile utilizzare le funzionalità ETL completamente gestite di AWS Glue per eseguire la trasformazione dei dati o convertirli in formato a colonne per ottimizzare le prestazioni delle query e ridurre i costi. Scopri di più su AWS Glue.

Athena fornisce connettori integrati a 30 datastore su AWS, on-premise e in altri cloud, compresi HAQM Redshift, HAQM DynamoDB, Google BigQuery, Google Cloud Storage, Azure Synapse, Azure Data Lake Storage, Redis, Snowflake e SAP Hana. Grazie ai connettori di origine dati di Athena, puoi generare informazioni dettagliate da più origini dati utilizzando la sintassi SQL di Athena senza la necessità di trasferire o trasformare i dati. I connettori dati vengono eseguiti come funzioni AWS Lambda e possono essere abilitati per l'accesso multi-account per scalare le query SQL a centinaia di utenti finali. Per un elenco delle origini supportate, consulta Connettori di origine dati disponibili. Per maggiori informazioni su come creare un connettore di origine dati personalizzato, consulta l'SDK del connettore di Athena.

È possibile richiamare i modelli SageMaker Machine Learning in una query Athena SQL per eseguire l'inferenza. La possibilità di utilizzare il modello ML nelle query SQL consente di completare attività complesse, quali il rilevamento delle anomalie, l'analisi della coorte dei clienti e le previsioni di vendita, con semplici operazioni come la scrittura di una query SQL. Athena consente di eseguire facilmente modelli ML distribuiti su HAQM SageMaker per chiunque abbia esperienza con SQL.