Preguntas frecuentes sobre el procesamiento de datos de HAQM SageMaker

Aspectos generales

Abrir todo

El procesamiento de datos de SageMaker analiza, prepara, integra y orquesta sus datos con las capacidades de procesamiento de HAQM Athena, HAQM EMR, AWS Glue y HAQM Managed Workflows para Apache Airflow (HAQM MWAA). Puede usar los marcos de procesamiento de datos de código abierto, como Apache Spark, analizar datos a escala con Trino y crear análisis en tiempo real sin problemas con Apache Flink y Apache Spark.

El procesamiento de datos de SageMaker reúne HAQM EMR, Athena, AWS Glue y HAQM MWAA.

El procesamiento de datos de SageMaker permite explorar datos, crear trabajos de transformación de datos, orquestar e implementar canalizaciones de datos a escala. Mejora el rendimiento y genera información más rápida que los sistemas de código abierto tradicionales con versiones rentables y compatibles con la API de código abierto de Apache Spark, Apache Airflow, Apache Flink y Trino, entre otras. El procesamiento de datos de SageMaker brinda acceso a sus orígenes de datos en HAQM SageMaker Lakehouse mediante integraciones sin ETL, capacidades de consulta federada y conectores.

Migración y acceso

Abrir todo

No, no necesita migrar a SageMaker. Puede seguir usando HAQM EMR, Athena, AWS Glue y HAQM MWAA como lo hace en la actualidad. Sin embargo, le recomendamos que comience a utilizar SageMaker para aprovechar las herramientas unificadas, la gobernanza de datos integrada y las arquitecturas simplificadas de SageMaker Lakehouse.

No afecta al código, las consultas, los trabajos ni otros recursos actuales que haya creado y utilizado con HAQM EMR, Athena o AWS Glue. Si lo prefiere, puede seguir utilizando estos servicios para nuevas cargas de trabajo. Los recursos creados en estos servicios, como HAQM EMR en clústeres de HAQM Elastic Compute Cloud (HAQM EC2), están visibles en SageMaker para simplificar el desarrollo de aplicaciones de análisis e IA. Las experiencias de desarrollo existentes, integradas en HAQM EMR, AWS Glue y Athena, seguirán existiendo, además de una nueva experiencia de desarrollo en SageMaker.

La versión más reciente de AWS Glue, AWS Glue 5.0, está disponible en SageMaker. AWS Glue 5.0 acelera las cargas de trabajo de procesamiento de datos y ofrece la versión ejecutable más reciente de Apache Spark 3.5.2, con un tiempo de ejecución optimizado, para que pueda desarrollar, ejecutar, escalar y obtener información más rápidamente. Para obtener más información, visite AWS Glue.

Precios

Abrir todo

Cada servicio de AWS que utilice a través de SageMaker está sujeto a sus propios precios. Para obtener más información, consulte la página de precios de AWS para Athena, HAQM EMR, AWS Glue y HAQM MWAA.