Publicado en: Dec 18, 2019
HAQM Textract es un servicio de aprendizaje automático que facilita y recupera rápidamente textos y datos estructurados como tablas y formularios mediante nuestras API DetectText o AnalizeDoc, sin requerir configuración personalizada o plantillas. Una de las ventajas de un servicio administrado como HAQM Textract es que los clientes se benefician de mejoras continuas a lo largo del tiempo. Hoy, nos complace anunciar que HAQM Textract posee la certificación PCI DSS. Esto significa que puede utilizar HAQM Textract para todas las cargas de trabajo que requieran información de seguridad Payment Card Industry Data Security Standard (PCI DSS), como la información del titular de la tarjeta (CHD) o información confidencial de autenticación (SAD). También hoy, AWS lanzó un grupo de mejoras de calidad que hacen de HAQM Textract más preciso para nuestras características de tablas y formularios.
Primero, nuestros modelos de tablas funcionan mejor con estructuras de tablas complejas que contienen celdas divididas y celdas combinadas, las cuales dificultan el alineamiento de los valores de las celdas a los encabezados de las columnas o filas correctas. Además, HAQM Textract siguió mejorando la identificación de las filas y columnas para celdas con texto ajustado (texto presente en múltiples líneas), incluso para tablas sin límites explícitos. HAQM Textract realiza una determinación más precisa de las celdas con contenido en varias líneas en lugar de cuando es una nueva fila sin un límite explícito. Finalmente, HAQM Textract mejoró el modelo de los formulario para ofrecer resultados más precisos para la identificación del par de valores clave. Los beneficios se aplican a muchos tipos de documentos, pero especialmente para los documentos que presentan tablas y pares de valores clave en la misma página. Ahora, HAQM Textract identifica correctamente los pares de valores clave incorporados en la tabla.
Puede obtener más información sobre estas actualizaciones aquí.