Publié le: Dec 18, 2019

HAQM Textract est un service de machine learning qui facilite et accélère la récupération de texte et de données structurées comme des tableaux et des formulaires, à l'aide de nos API DetectText ou AnalyzeDoc, sans qu'une configuration ou des modèles personnalisés soient nécessaires. L'un des avantages d'un service géré comme HAQM Textract est que les clients bénéficient d'améliorations en continu au fil du temps. Aujourd'hui, nous avons le plaisir d'annoncer qu'HAQM Textract est désormais certifié PCI DSS. Cela signifie que vous pouvez désormais utiliser HAQM Textract pour l'ensemble des workloads nécessitant des standards de sécurité de l'information Payment Card Industry Data Security Standard (PCI DSS), comme les données des titulaires de cartes (CHD) ou les données d'authentification sensibles (SAD). De plus, à partir d'aujourd'hui, AWS lance une série d'améliorations de la qualité qui rendent HAQM Textract encore plus précis pour nos fonctions tableau et formulaire. 

Tout d'abord, notre modèle de tableaux fonctionne désormais mieux avec des structures de tableau complexes contenant des cellules divisées et des cellules fusionnées, qui rendent difficile le bon alignement des valeurs des cellules avec le bon en-tête de colonne ou de ligne. Ensuite, HAQM Textract s'est encore plus amélioré concernant l'identification des lignes et des colonnes pour les cellules dont le texte est renvoyé à la ligne (présent sur plusieurs lignes), même pour les tableaux sans limites explicites. HAQM Textract détermine désormais de manière plus précise les cellules dont le contenu se situe sur plusieurs lignes, comparé à lorsqu'il s'agit d'une nouvelle ligne sans limite explicite. Enfin, HAQM Textract a également amélioré le modèle de formulaires pour fournir des résultats plus précis pour l'identification de paires de clés-valeurs. Ces avantages s'appliquent à plusieurs types de documents, mais sont particulièrement utiles pour les documents contenant des tableaux et des paires de clés-valeurs sur la même page. Désormais, HAQM Textract identifie correctement les paires de clés-valeurs intégrées dans un tableau. 

Pour en savoir plus sur ces mises à jour, consultez cette page