SageMaker Data Processing analyse, prépare, intègre et orchestre vos données grâce aux fonctionnalités de traitement d’HAQM Athena, HAQM EMR, AWS Glue et HAQM Managed Workflows pour Apache Airflow (HAQM MWAA). Vous pouvez utilise des cadres de traitement de données open source tels qu’Apache Spark, analyser des données à grande échelle avec Trino et créer une analytique en temps réel de manière fluide avec Apache Flink et Apache Spark.
SageMaker Data Processing vous aide à explorer les données, à créer des tâches de transformation des données, à orchestrer et à déployer des pipelines de données à grande échelle. Il améliore les performances et fournit des informations plus rapidement que les systèmes open source traditionnels grâce à des versions rentables et compatibles avec les API open source d’Apache Spark, Apache Airflow, Apache Flink, Trino, etc. SageMaker Data Processing permet d’accéder à vos sources de données dans HAQM SageMaker via des intégrations zéro ETL, des fonctionnalités de requêtes fédérées et des connecteurs.
Non, vous n’avez pas besoin de migrer vers SageMaker. Vous pouvez continuer à utiliser HAQM EMR, Athena, AWS Glue et HAQM MWAA comme vous le faites aujourd’hui. Cependant, nous vous recommandons de commencer à utiliser SageMaker pour utiliser des outils unifiés, de la gouvernance des données intégrée et des architectures SageMaker Lakehouse simplifiées.
Cela n’a aucun impact sur le code actuel, les requêtes, les tâches et les autres ressources que vous avez créés et utilisés avec HAQM EMR, Athena ou AWS Glue. Vous pouvez continuer à utiliser ces services pour les nouvelles charges de travail, si vous le souhaitez. Les ressources créées dans ces services, comme HAQM EMR sur les clusters HAQM Elastic Compute Cloud (HAQM EC2), sont visibles dans SageMaker afin de simplifier le développement d’applications d’analytique et d’IA. Les expériences de développement existantes intégrées à HAQM EMR, AWS Glue et Athena continueront d’exister, en plus d’une nouvelle expérience de développement au sein de SageMaker.
La dernière version d’AWS Glue, AWS Glue 5.0, est disponible dans SageMaker. AWS Glue 5.0 accélère les charges de travail liées au traitement des données et fournit la dernière exécution Apache Spark 3.5.2 optimisée pour les performances, afin que vous puissiez développer, exécuter et mettre à l’échelle pour obtenir des informations plus rapides. Pour en savoir plus, consultez la page AWS Glue.