Publicado en: Oct 27, 2021
HAQM Textract ahora es compatible con los documentos en formato de archivo de imagen etiquetada (TIFF), además de los formatos PNG, JPEG y PDF. Los clientes ahora pueden procesar documentos TIFF de forma sincrónica o asincrónica utilizando cualquiera de las siguientes API de HAQM Textract: DetectDocumentText, StartDocumentAnalysis, StartDocumentTextDetection, AnalyzeDocument y AnalyzeExpense. HAQM Textract es un servicio de machine learning que extrae automáticamente texto y datos impresos y escritos a mano de cualquier documento.
Con este lanzamiento, HAQM Textract también agrega soporte para el procesamiento de documentos PDF de forma asincrónica utilizando la API AnalyzeExpense, basándose en el soporte sincrónico para archivos de imagen PNG y JPEG que ha estado disponible desde el lanzamiento. Al igual que los clientes envían documentos PDF a las API de DetectDocumentText y AnalyzeDocument, ahora pueden enviar recibos y facturas en formato PDF a la API de AnalyzeExpense.
Inicie sesión en la consola de HAQM Textract para probar los documentos TIFF. Para obtener más información sobre las capacidades de HAQM Textract, visite el sitio web de HAQM Textract, la guía para desarrolladores o la página de recursos.