Publicado en: May 29, 2019

Nos complace anunciar la disponibilidad general de HAQM Textract, que solo se encontraba en versión preliminar desde re:invent 2018. HAQM Textract es un servicio de aprendizaje automático administrado que extrae texto y datos estructurados de forma automática a partir de prácticamente cualquier documento. Con HAQM Textract, los clientes pueden automatizar rápidamente flujos de trabajo de documentos mediante el procesamiento de millones de páginas de documentos en unas pocas horas.

HAQM Textract no se limita al simple reconocimiento óptico de caracteres (OCR) para identificar contenido de campos de formularios, información almacenada en tablas y el contexto en el cual aparece la información. La API de HAQM Textract admite varios formatos de imágenes como escaneos, PDF y fotos, y los clientes pueden utilizarla con otros servicios de aprendizaje automático de AWS como HAQM Comprehend, HAQM Comprehend Medical y HAQM Translate para obtener información significativa de mayor relevancia a partir de los datos y los textos extraídos. Los datos y textos extraídos también se pueden usar para crear búsquedas inteligentes en archivos grandes de documentos o bien cargarlos en una base de datos para que los utilicen aplicaciones, como software contable, de conformidad y auditorías. Si desea obtener más información sobre este servicio, visite el sitio web de HAQM Textract.

HAQM Textract ya se encuentra disponible en las siguientes regiones de AWS: norte de Virginia, Ohio, Oregón e Irlanda. Para empezar a usar HAQM Textract, lea la guía de introducción.