Simplifiez l’extraction des données et l’automatisation des processus dans les flux de travail multimodaux centrés sur les données, y compris le traitement intelligent des documents (IDP)
Ce guide montre comment l’automatisation des données HAQM Bedrock rationalise la génération d’informations précieuses à partir de contenus multimodaux non structurés tels que des documents, des images, des sons et des vidéos grâce à une API d’inférence multimodale unifiée. L’automatisation des données HAQM Bedrock aide les développeurs à créer des applications d’IA générative ou à automatiser les flux de travail centrés sur les données multimodales comme l’IDP, l’analyse des médias ou la génération à enrichissement contextuel (RAG) de manière rapide et rentable. En suivant ce guide, vous pouvez simplifier des tâches complexes telles que le fractionnement de documents, la classification, l’extraction de données, la normalisation du format de sortie et la validation des données, améliorant ainsi considérablement la capacité de mise à l’échelle de votre traitement.
Veuillez noter : [Disclaimer]
Diagramme d'architecture

-
Traitement intelligent des documents
-
Traitement des demandes de remboursement de frais médicaux
-
Traitement intelligent des documents
-
Ce schéma d’architecture montre comment procéder à la classification et à l’extraction de documents à l’aide d’un exemple de traitement d’octroi de prêts pour une société de services financiers.
Étape 1
L’équipe de science des données charge des exemples de documents dans un compartiment HAQM Simple Storage Service (HAQM S3).Étape 2
L’équipe de science des données utilise les plans fournis et crée de nouveaux plans personnalisés pour chaque classe de documents : formulaire W‑2, fiche de paie, permis de conduire, formulaire 1099 et relevé bancaire. Chaque exemple est traité et des invites d’IA générative extraient les champs (tels que prénom, nom de famille, salaire brut, plus‑values et solde de fin de période).
Étape 3
Les plans sont testés et ajustés. Des normalisations, des transformations et des validations clés sont ajoutées.
Étape 4
Les plans sont gérés et stockés dans la fonctionnalité d’automatisation des données HAQM Bedrock (HAQM BDA).
Étape 5
À l’aide d’un événement « Objet créé », HAQM EventBridge déclenche une fonction AWS Lambda lorsque des documents sont chargés dans HAQM S3. Cette fonction Lambda utilise ensuite la fonctionnalité d’automatisation des données HAQM Bedrock (HAQM BDA) pour traiter les documents chargés.Étape 6
Le flux de traitement d’HAQM Bedrock inclut le fractionnement des documents en fonction de limites logiques, chaque division contenant jusqu’à 20 pages. Le flux de traitement d’<t1>HAQM Bedrock</t1> inclut le fractionnement des documents en fonction de limites logiques, chaque division contenant jusqu’à 20 pages.
Étape 6 (suite)
Le plan correspondant est ensuite invoqué pour chaque page, exécutant des normalisations, des transformations et des validations clés. L’ensemble de ce processus fonctionne de manière asynchrone, ce qui permet de gérer efficacement de multiples documents et de gros volumes de données.
Étape 7
HAQM Bedrock stocke les résultats dans un compartiment HAQM S3 pour un traitement ultérieur et déclenche EventBridge.
Étape 8
EventBridge déclenche la fonction Lambda pour traiter les résultats JSON d’HAQM Bedrock. Les résultats du traitement sont envoyés aux systèmes de traitement en aval.
-
Traitement des demandes de remboursement de frais médicaux
-
Ce schéma d’architecture montre comment automatiser le traitement des demandes de remboursement de frais médicaux à l’aide du traitement de données d’entrée multimodales afin d’améliorer les niveaux d’efficacité et de précision.
Étape 1
Les prestataires de soins de santé soumettent les documents, les images et les vidéos relatifs aux demandes de remboursement de frais médicaux à HAQM S3.
Étape 2
Un flux de travail est déclenché dans la fonctionnalité d’automatisation des données HAQM Bedrock (HAQM BDA).
Étape 3
Les développeurs créent des plans dans HAQM Bedrock pour extraire les données pertinentes.
Étape 4
HAQM Bedrock traite les documents, les images et les vidéos en extrayant du texte, des tableaux, des objets, des transcriptions, en normalisant la structure des données et en signalant les éléments nécessitant une vérification. HAQM Bedrock stocke les données dans HAQM S3 et déclenche EventBridge.
Étape 5
EventBridge déclenche Lambda qui récupère la sortie d’HAQM Bedrock depuis le compartiment S3.
Étape 6
Les agents HAQM Bedrock utilisent la fonction Lambda pour récupérer les informations relatives au plan d’assurance du patient sur HAQM Aurora.Étape 7
Les agents HAQM Bedrock mettent ensuite à jour la base de données des demandes de remboursement de frais médicaux dans Aurora.
Étape 8
Les évaluateurs passent en revue les champs importants et se concentrent sur les éléments nécessitant une vérification.
Étape 9
Les documents, images et vidéos relatifs à l’Evidence of Coverage (EoC) définissant le niveau de couverture médicale sont stockés dans HAQM S3. HAQM Bedrock traite les données multimodales à l’aide d’une API unique et les stocke dans HAQM S3. Elles sont ensuite traitées, intégrées et stockées dans une collection vectorielle pour les bases de connaissances pour HAQM Bedrock.Étape 10
Les agents HAQM Bedrock calculent le niveau d’éligibilité à l’aide des données extraites et des informations indexées.
Étape 11
Les agents HAQM Bedrock mettent à jour la base de données des demandes de remboursement de frais médicaux et en informe l’évaluateur. Celui‑ci examine et approuve ou ajuste la demande de remboursement de frais médicaux de manière efficace.
Démarrer

Piliers Well-Architected

Le cadre AWS Well-Architected vous permet de comprendre les avantages et les inconvénients des décisions que vous prenez lors de la création de systèmes dans le cloud. Les six piliers du cadre vous permettent d'apprendre les bonnes pratiques architecturales pour concevoir et exploiter des systèmes fiables, sécurisés, efficaces, rentables et durables. Grâce à l'outil AWS Well-Architected Tool, disponible gratuitement dans la console de gestion AWS, vous pouvez examiner vos charges de travail par rapport à ces bonnes pratiques en répondant à une série de questions pour chaque pilier.
Le diagramme d'architecture ci-dessus est un exemple de solution créée en tenant compte des bonnes pratiques Well-Architected. Pour être totalement conforme à Well-Architected, vous devez suivre autant de bonnes pratiques Well-Architected que possible.
-
Excellence opérationnelle
HAQM S3, EventBridge et Lambda créent un flux de travail transparent et automatisé pour le traitement des documents et l’extraction de données via un stockage sécurisé pour différents types de documents. L’automatisation des données HAQM Bedrock rationalise l’extraction et la normalisation des données, réduisant les efforts manuels et augmentant la précision. Les bases de connaissances HAQM Bedrock indexent les informations traitées, les rendant facilement consultables et accessibles, tandis que les agents HAQM Bedrock exploitent ces données structurées pour prendre des décisions intelligentes et acheminer efficacement les demandes. Aurora sert de base de données robuste pour stocker et récupérer les informations critiques. Ensemble, ces services permettent de mettre en place un système hautement efficace, évolutif et fiable qui minimise l’intervention humaine et maximise la productivité.
-
Sécurité
HAQM S3 propose un stockage chiffré, Lambda exécute le code dans des environnements isolés et HAQM Bedrock exploite une infrastructure AWS sécurisée avec un chiffrement et des contrôles d’accès intégrés. Aurora fournit des fonctionnalités avancées de sécurité des bases de données. Ces services créent une approche de sécurité complète qui protège les données tout au long de leur cycle de vie tout en maintenant des contrôles d’accès et des pistes d’audit stricts. La capacité à gérer de manière centralisée les politiques de sécurité et à tirer parti des mises à jour et améliorations continues de la sécurité d’AWS vous permet de maintenir une solide posture de sécurité tout en vous concentrant sur vos activités principales.
-
Fiabilité
HAQM S3 fournit un espace de stockage durable et hautement disponible pour les documents. EventBridge contribue à garantir un traitement cohérent piloté par les événements en déclenchant de manière fiable les fonctions Lambda, qui se mettent à l’échelle parfaitement pour gérer différentes charges de travail sans durée d’indisponibilité. Aurora, une base de données hautement disponible, propose des sauvegardes automatisées et des fonctionnalités de basculement. Ces services offrent un système robuste et tolérant aux pannes capable de résister aux défaillances des composants, de se mettre à l'échelle automatiquement et de maintenir des performances constantes sous des charges élevées, minimisant ainsi les durées d’indisponibilité et les risques de perte de données.
-
Efficacité des performances
Les services AWS améliorent l’efficacité des performances grâce à des solutions évolutives et performantes pour le traitement des documents. HAQM S3 fournit un accès à faible latence aux documents stockés, tandis qu’EventBridge permet le traitement des événements en temps réel. Lambda offre une puissance de calcul rapide et à la demande. La nature sans serveur de Lambda et d’EventBridge élimine les goulots d’étranglement associés au provisionnement des serveurs. En outre, HAQM Bedrock exploite des modèles d’IA pour traiter efficacement des tâches complexes d’analyse de données.
-
Optimisation des coûts
Les services AWS contribuent à l’optimisation des coûts grâce à des modèles de paiement à l’utilisation (ce qui signifie que vous ne payez que les ressources consommées) et à l’élimination des investissements initiaux dans l’infrastructure. HAQM S3 propose des options de stockage hiérarchisé qui équilibrent performances et coûts. La nature sans serveur d’EventBridge et de Lambda signifie que vous ne payez que le temps de calcul réellement utilisé. HAQM Bedrock fournit des fonctionnalités d’IA sans infrastructure ni expertise internes coûteuses, et Aurora offre des performances comparables à celles des bases de données commerciales à une fraction du coût.
-
Développement durable
Les services AWS contribuent au développement durable en optimisant l’utilisation des ressources et l’efficacité énergétique. HAQM S3 utilise des technologies de stockage efficaces, tandis qu’EventBridge et Lambda proposent des architectures sans serveur qui minimisent les capacités inutilisées. Ces services basés sur le cloud réduisent considérablement l’infrastructure sur site, diminuant ainsi la consommation d’énergie et les émissions de carbone. Leur capacité de mise à l’échelle garantit une utilisation optimale des ressources, évitant ainsi le surprovisionnement et le gaspillage.
Contenu connexe

[Titre]
Avis de non-responsabilité
Les exemples de code, les bibliothèques de logiciels, les outils de ligne de commande, les preuves de concept, les modèles ou toute autre technologie connexe (y compris tout ce qui précède qui est fourni par notre personnel) vous sont fournis en tant que contenu AWS en vertu du contrat client AWS ou de l'accord écrit pertinent entre vous et AWS (selon le cas). Vous ne devez pas utiliser ce contenu AWS dans vos comptes de production, ni sur des données de production ou autres données critiques. Vous êtes responsable des tests, de la sécurisation et de l'optimisation du contenu AWS, tel que les exemples de code, comme il convient pour une utilisation en production, en fonction de vos pratiques et normes de contrôle de qualité spécifiques. Le déploiement de contenu AWS peut entraîner des frais AWS pour la création ou l'utilisation de ressources payantes AWS, telles que l'exécution d'instances HAQM EC2 ou l'utilisation du stockage HAQM S3.
Les références à des services ou organisations tiers dans ce guide n'impliquent pas une approbation, un parrainage ou une affiliation entre HAQM ou AWS et le tiers. Les conseils fournis par AWS constituent un point de départ technique, et vous pouvez personnaliser votre intégration avec des services tiers lorsque vous déployez l'architecture.