Inserito il: Dec 22, 2017
Ora puoi utilizzare Apache Spark 2.2.1, Apache Hive 2.3.2 e l'integrazione HAQM SageMaker con Apache Spark su HAQM EMR release 5.11.0. Spark 2.2.1 e Hive 2.3.2 includono diverse correzioni di bug e miglioramenti. HAQM SageMaker Spark è una biblioteca Spark open source per HAQM SageMaker, un servizio completamente gestito in grado di creare, formare e distribuire modelli di machine learning scalabili. Consente di eseguire l'interleaving delle diverse fasi Spark che interagiscono con HAQM SageMaker nelle pipeline ML Spark, permettendo di formare modelli utilizzando frame di dati Spark DataFrames in HAQM SageMaker con algoritmi ML forniti da HAQM, come clustering K-Means o XGBoost.
Con la release 5.11.0 puoi creare un cluster HAQM EMR scegliendo l'etichetta "emr-5.11.0" dalla Console di gestione AWS, da AWS CLI o da SDK. Puoi selezionare Spark e Hive per installare queste applicazioni sul tuo cluster. La biblioteca HAQM SageMaker Spark viene inclusa automaticamente quando si installa Spark. Consulta la documentazione relativa ad HAQM EMR per ulteriori informazioni su release 5.11.0, Spark 2.2.1, Hive 2.3.2 e sull'utilizzo di HAQM SageMaker con Spark.
HAQM EMR release 5.11.0 è disponibile in tutte le regioni supportate per HAQM EMR.