Publicado en: Dec 8, 2020

HAQM SageMaker Data Wrangler reduce el tiempo que tarda agregar y preparar los datos para el aprendizaje automático de semanas a minutos. Con HAQM SageMaker Data Wrangler, puede simplificar el proceso de la preparación de los datos y la ingeniería de las funciones. También, puede completar cada paso del flujo de trabajo de la preparación de los datos, incluida la selección, limpieza, exploración y visualización de los datos desde una interfaz visual única. 

Para la mayoría de los modelos de aprendizaje automático, puede pasar semanas o meses agregando o preparando los datos desde diferentes orígenes: conversión, transformación y validación de los datos sin procesar a funciones que pueden utilizarse para entrenar modelos y hace predicciones. Es necesario que escriba el código para hacer transformaciones de datos, para que pueda transformar los datos en formatos que se puedan utilizar con eficiencia en un modelo, y que escriba código adicional que se pueda ejecutar a escala en un gran número de origen de datos, tiempo que se aprovecha mejor en tareas de mayor valor.

Mediante la herramienta de selección de datos de HAQM SageMaker Data Wrangler, puede elegir los datos que quiera desde varios orígenes de datos, como HAQM S3, HAQM Athena, HAQM Redshift, AWS Lake Formation y HAQM SageMaker Feature Store. Además, y puede importarlos con un solo clic. HAQM SageMaker Data Wrangler contiene más de 300 transformaciones de datos integradas, para que pueda normalizar, transformar y combinar funciones de forma rápida sin tener que escribir el código. Con las plantillas de visualización de HAQM SageMaker Data Wrangler, puede obtener una vista previa e inspeccionar que las trasformaciones se completen como lo pensó mediante su visualización en HAQM SageMaker Studio, el primer entorno de desarrollo totalmente integrado (IDE) para inteligencia artificial. Una vez que los datos estén preparados, puede crear flujos de trabajo de aprendizaje automático totalmente automatizados con HAQM SageMaker Pipelines y guardarlos para reutilizarlos en HAQM SageMaker Feature Store.

HAQM SageMaker Data Wrangler está generalmente disponible en todas las regiones en las que HAQM SageMaker Studio está disponible. Para comenzar con HAQM SageMaker Data Wrangler, consulte nuestra documentación.