Publié le: May 29, 2019
Nous avons le plaisir d’annoncer la mise à disposition pour tous d’HAQM Textract, qui a été en version préliminaire depuis le re:invent 2018. HAQM Textract est un service de machine learning géré qui extrait automatiquement le texte et les données structurées à partir de pratiquement n’importe quel document. HAQM Textract permet aux clients d'automatiser rapidement les flux de travail de documents en traitant des millions de pages de document en quelques heures.
HAQM Textract est plus qu’un logiciel d’OCR (reconnaissance optique des caractères) car il identifie également le contenu des champs de formulaire, les informations stockées dans les tableaux et le contexte dans lequel sont présentées les informations. L’API d’HAQM Textract prend en charge plusieurs formats d’image comme les numérisations, les PDF et les photos. Les clients peuvent l’utiliser en parallèle d’autres services de machine learning d’AWS tels qu’HAQM Comprehend, HAQM Comprehend Medical ou encore HAQM Translate pour déduire un sens plus profond au texte et aux données extraits. Le texte et les données extraits peuvent également servir à créer des recherches intelligentes sur d’importantes archives de document. Sinon, ils peuvent être chargés dans une base de données pour une utilisation par des applications comme les logiciels de comptabilité, d’audit et de conformité. Visitez le site web d'HAQM Textract pour en savoir plus sur HAQM Textract.
HAQM Textract est désormais disponible dans les régions AWS suivantes : Virginie du Nord, Ohio, Oregon et Irlande. Pour démarrer avec HAQM Textract, consultez le Guide de mise en route.