Publié le: Nov 16, 2020

HAQM Textract est un service de machine learning qui permet d’extraire du texte, des tableaux, des formulaires et d’autres données de documents. Aujourd’hui, nous sommes heureux d’annoncer deux nouvelles fonctionnalités :

  • HAQM Textract prend désormais en charge la reconnaissance de textes manuscrits dans les documents, par exemple les feuilles de soins, les ordonnances médicales, les lettres de contestation, les documents fiscaux, les états de revenus, les chèques, les réclamations, les documents universitaires et bien d’autres encore. Vous pouvez utiliser les API Detect Document Text ou Analyze Document pour traiter des documents scannés au format image ou PDF et en extraire du texte imprimé et celui manuscrit, ce qui facilite l’automatisation du traitement de la quasi-totalité des documents scannés. Vous pouvez également utiliser HAQM Augmented AI (HAQM A2I), un autre service AWS, qui simplifie la création de flux de travail de prédictions de machine learning en vue d’une analyse humaine. Vous pouvez vous connecter à la console HAQM Textract pour tester la fonctionnalité de reconnaissance de l’écriture manuscrite ou consulter la nouvelle démonstration de Mike Chambers, HAQM Machine Learning Hero
  • HAQM Textract prend désormais en charge le traitement de documents comportant du texte imprimé en espagnol, en allemand, en italien, en portugais et en français. Vous pouvez commencer à envoyer des documents dans ces langues à des fins d’extraction de texte et HAQM Textract détectera automatiquement les informations et les extraira pour vous.

Nous avons également le plaisir d’annoncer qu’HAQM Textract est désormais disponible dans la région AWS UE (Paris). Pour démarrer, connectez-vous à la console HAQM Textract pour tester la reconnaissance de vos documents manuscrits et les nouvelles langues prises en charge. Pour en savoir plus sur les fonctionnalités de Textract, consultez le site Web d’HAQM Textractle guide du développeur ou la page des ressources.