Publicado: May 29, 2019

Temos o prazer de anunciar a disponibilidade geral do HAQM Textract, que estava em demonstração desde o re:invent 2018. O HAQM Textract é um serviço gerenciado de machine learning que extrai automaticamente texto e dados estruturados de praticamente qualquer documento. Os clientes usam o HAQM Textract para automatizar rapidamente fluxos de trabalho de documentos, processando milhões de páginas de documentos em algumas horas.

O HAQM Textract vai além do simples Optical Character Recognition (OCR – Reconhecimento óptico de caracteres) para identificar conteúdo de campos em formulários, informações armazenadas em tabelas e o contexto no qual as informações são apresentadas. A API do HAQM Textract oferece suporte a vários formatos de imagem como digitalizações, PDFs e fotografias. Os clientes podem usar o serviço com outros serviços de machine learning da AWS, como HAQM Comprehend, HAQM Comprehend Medical e HAQM Translate, para obter um significado mais profundo dos textos e dados extraídos. Além disso, os textos e dados extraídos podem ser usados para criar pesquisas inteligentes em grandes arquivamentos de documentos ou podem ser carregados em um banco de dados para uso por aplicativos como software de contabilidade, auditoria e conformidade. Para saber mais sobre o HAQM Textract, consulte o site do HAQM Textract.

O HAQM Textract já está disponível nas regiões da AWS Norte da Virgínia, Ohio, Oregon e Irlanda. Para começar a usar o HAQM Textract, leia o Guia de conceitos básicos.