Đơn giản hóa việc trích xuất dữ liệu và tự động hóa quy trình trên các quy trình làm việc tập trung vào dữ liệu đa phương thức, bao gồm Xử lý tài liệu thông minh (IDP)
Hướng dẫn này cho biết cách Tự động hóa dữ liệu của HAQM Bedrock hợp lý hóa quá trình tạo ra thông tin chuyên sâu có giá trị từ nội dung đa phương thức phi cấu trúc như tài liệu, hình ảnh, âm thanh và video thông qua API suy luận đa phương thức thống nhất. Tự động hóa dữ liệu của HAQM Bedrock giúp các nhà phát triển xây dựng các ứng dụng AI tạo sinh hoặc tự động hóa quy trình làm việc tập trung vào dữ liệu đa phương thức như IDP, phân tích phương tiện hoặc tạo có kết hợp truy xuất thông tin ngoài (RAG) một cách nhanh chóng và tiết kiệm chi phí. Bằng cách làm theo Hướng dẫn này, bạn có thể đơn giản hóa các tác vụ phức tạp như phân chia tài liệu, phân loại, trích xuất dữ liệu, chuẩn hóa định dạng đầu ra và xác thực dữ liệu, giúp nâng cao đáng kể khả năng điều chỉnh quy mô xử lý của bạn.
Xin lưu ý: [Tuyên bố miễn trừ trách nhiệm]
Sơ đồ kiến trúc

-
Xử lý tài liệu thông minh
-
Xử lý yêu cầu thanh toán bảo hiểm y tế
-
Xử lý tài liệu thông minh
-
Sơ đồ kiến trúc này cho thấy cách thực hiện phân loại và trích xuất tài liệu bằng một ví dụ xử lý quá trình khởi tạo khoản vay cho một công ty dịch vụ tài chính.
Bước 1
Đội ngũ khoa học dữ liệu tải các tài liệu mẫu lên vùng lưu trữ HAQM Simple Storage Service (HAQM S3).Bước 2
Đội ngũ khoa học dữ liệu sử dụng kế hoạch chi tiết được cung cấp và tạo kế hoạch chi tiết tùy chỉnh mới cho mỗi lớp tài liệu: W2, Phiếu thanh toán, Giấy phép lái xe, 1099 và Sao kê ngân hàng. Mỗi mẫu được xử lý và các câu lệnh AI tạo sinh trích xuất các trường (chẳng hạn như tên và họ, tổng lương, lãi vốn và số dư cuối kỳ).
Bước 3
Các kế hoạch chi tiết được kiểm thử và tinh chỉnh. Thêm các chuẩn hóa khóa, quá trình chuyển đổi và xác thực.
Bước 4
Các kế hoạch chi tiết được quản lý và lưu trữ trong tính năng Tự động hóa dữ liệu của HAQM Bedrock.
Bước 5
Bằng cách sử dụng sự kiện “Đối tượng được tạo”, HAQM EventBridge kích hoạt hàm AWS Lambda khi tài liệu được tải lên HAQM S3. Sau đó, hàm Lambda này sử dụng tính năng Tự động hóa dữ liệu của HAQM Bedrock để xử lý các tài liệu đã tải lên.Bước 6
Quy trình xử lý trong tính năng Tự động hóa dữ liệu của HAQM Bedrock bao gồm việc phân chia tài liệu dựa trên ranh giới logic với mỗi phần chứa tối đa 20 trang. Mỗi trang được phân loại thành một loại tài liệu cụ thể và được khớp với kế hoạch chi tiết phù hợp.
Bước 6 (tiếp theo)
Sau đó, kế hoạch chi tiết tương ứng sẽ được gọi cho mỗi trang, thực hiện các thao tác chuẩn hóa khóa, chuyển đổi và xác thực. Toàn bộ quá trình này hoạt động không đồng bộ, cho phép xử lý hiệu quả nhiều tài liệu và khối lượng dữ liệu lớn.
Bước 7
Tự động hóa dữ liệu của HAQM Bedrock lưu trữ kết quả trong vùng lưu trữ HAQM S3 để xử lý sau và kích hoạt EventBridge.
Bước 8
EventBridge kích hoạt hàm Lambda để xử lý kết quả JSON của tính năng Tự động hóa dữ liệu của HAQM Bedrock. Kết quả xử lý được gửi đến các hệ thống xử lý hạ nguồn.
-
Xử lý yêu cầu thanh toán bảo hiểm y tế
-
Sơ đồ kiến trúc này cho thấy cách tự động hóa quá trình xử lý yêu cầu thanh toán bảo hiểm y tế với dữ liệu đầu vào đa phương thức cũng như xử lý để cải thiện độ hiệu quả và độ chính xác.
Bước 1
Các nhà cung cấp gửi tài liệu yêu cầu bồi thường, hình ảnh và video lên HAQM S3.
Bước 2
Quy trình làm việc được kích hoạt trong Tự động hóa dữ liệu của HAQM Bedrock.
Bước 3
Các nhà phát triển tạo kế hoạch chi tiết trong Tự động hóa dữ liệu của HAQM Bedrock để trích xuất dữ liệu có liên quan.
Bước 4
Tự động hóa dữ liệu của HAQM Bedrock xử lý tài liệu, hình ảnh và video bằng cách trích xuất văn bản, bảng, đối tượng, bản chép lời; chuẩn hóa cấu trúc dữ liệu; đánh dấu các mục có độ tin cậy thấp để xem xét. Tự động hóa dữ liệu của HAQM Bedrock lưu trữ dữ liệu trong HAQM S3 và kích hoạt EventBridge.
Bước 5
EventBridge kích hoạt Lambda, truy xuất đầu ra Tự động hóa dữ liệu của HAQM Bedrock từ vùng lưu trữ S3.
Bước 6
Tác tử HAQM Bedrock sử dụng hàm Lambda để tìm nạp thông tin chi tiết về gói bảo hiểm của bệnh nhân từ HAQM Aurora.Bước 7
Sau đó, Tác tử HAQM Bedrock Agents cập nhật cơ sở dữ liệu yêu cầu bảo hiểm trong Aurora.
Bước 8
Người phân xử xác minh các trường quan trọng và tập trung vào các mục có độ tin cậy thấp.
Bước 9
Tài liệu, hình ảnh và video Giải thích về Bảo hiểm (EoC) sẽ được lưu trữ trong HAQM S3. Tự động hóa dữ liệu của HAQM Bedrock xử lý dữ liệu đa phương thức với một API duy nhất và lưu trữ dữ liệu đó trong HAQM S3. Sau đó, dữ liệu này được xử lý, nhúng và lưu trữ trong một bộ sưu tập véc-tơ cho Cơ sở kiến thức của HAQM Bedrock.Bước 10
Tác tử HAQM Bedrock tính toán tính đủ điều kiện bằng cách sử dụng dữ liệu được trích xuất và thông tin được lập chỉ mục.
Bước 11
Tác tử HAQM Bedrock cập nhật cơ sở dữ liệu yêu cầu bảo hiểm và thông báo cho người phân xử. Người phân xử sẽ xem xét và phê duyệt hoặc điều chỉnh yêu cầu bảo hiểm một cách hiệu quả.
Bắt đầu

Triển khai Hướng dẫn này
Trụ cột của Well-Architected

Khung AWS Well-Architected giúp bạn nắm được ưu và nhược điểm của các quyết định mà bạn đưa ra khi xây dựng hệ thống trên đám mây. Sáu trụ cột trong Khung giúp bạn tìm hiểu các phương pháp kiến trúc tốt nhất để thiết kế và vận hành các hệ thống đáng tin cậy, bảo mật, hiệu quả, tiết kiệm chi phí và bền vững. Bằng cách sử dụng Công cụ AWS Well-Architected, được cung cấp miễn phí trong Bảng điều khiển quản lý AWS, bạn có thể xem xét khối lượng công việc của mình dựa trên các phương pháp tốt nhất này bằng cách trả lời một bộ câu hỏi cho từng trụ cột.
Sơ đồ kiến trúc ở trên là một ví dụ về Giải pháp được tạo ra với các phương pháp tốt nhất của Well-Architected. Để tận dụng tối đa Well-Architected, bạn nên tuân theo càng nhiều phương pháp tốt nhất của Well-Architected càng tốt.
-
Vận hành xuất sắc
HAQM S3, EventBridge và Lambda tạo ra quy trình làm việc tự động, liền mạch để xử lý tài liệu và trích xuất dữ liệu thông qua lưu trữ an toàn cho các loại tài liệu khác nhau. Tự động hóa dữ liệu của HAQM Bedrock hợp lý hóa việc trích xuất và chuẩn hóa dữ liệu, giảm nỗ lực thủ công và tăng độ chính xác. Cơ sở kiến thức của HAQM Bedrock lập chỉ mục thông tin đã xử lý, giúp dễ dàng tìm kiếm và truy cập thông tin đó, trong khi Tác tử HAQM Bedrock tận dụng dữ liệu có cấu trúc này để đưa ra quyết định thông minh và định tuyến yêu cầu một cách hiệu quả. Aurora đóng vai trò như một cơ sở dữ liệu mạnh mẽ để lưu trữ và truy xuất thông tin quan trọng. Cùng nhau, các dịch vụ này mang lại một hệ thống hiệu quả cao, có quy mô linh hoạt và đáng tin cậy, giảm thiểu sự can thiệp của con người và tối đa hóa năng suất.
-
Bảo mật
HAQM S3 cung cấp kho lưu trữ được mã hóa, Lambda thực thi mã trong môi trường cô lập và HAQM Bedrock tận dụng cơ sở hạ tầng AWS an toàn với mã hóa tích hợp và biện pháp kiểm soát truy cập. Aurora cung cấp các tính năng bảo mật cơ sở dữ liệu nâng cao. Các dịch vụ này tạo ra một cách tiếp cận bảo mật toàn diện để bảo vệ dữ liệu trong suốt vòng đời trong khi vẫn duy trì các biện pháp kiểm soát truy cập nghiêm ngặt và biên bản kiểm tra. Khả năng quản lý các chính sách bảo mật một cách tập trung và tận dụng các cập nhật và cải tiến bảo mật liên tục của AWS cho phép bạn duy trì khả năng bảo mật mạnh mẽ trong khi tập trung vào các hoạt động kinh doanh cốt lõi của mình.
-
Độ tin cậy
HAQM S3 cung cấp dung lượng lưu trữ lâu bền và có độ sẵn sàng cao để lưu trữ tài liệu. EventBridge giúp đảm bảo quy trình xử lý theo hướng sự kiện nhất quán bằng cách kích hoạt các hàm Lambda một cách đáng tin cậy, với khả năng điều chỉnh quy mô liền mạch để xử lý các khối lượng công việc khác nhau mà không mất thời gian ngừng hoạt động. Aurora, một cơ sở dữ liệu có độ sẵn sàng cao, cung cấp khả năng sao lưu tự động và chuyển đổi dự phòng. Các dịch vụ này cung cấp một hệ thống mạnh mẽ, có khả năng chịu lỗi, có thể chịu được sự cố thành phần, tự động điều chỉnh quy mô và duy trì hiệu năng nhất quán khi chịu tải cao, giảm thiểu thời gian ngừng hoạt động và rủi ro mất dữ liệu.
-
Hiệu quả năng suất
Các dịch vụ AWS nâng cao hiệu quả năng suất thông qua các giải pháp hiệu năng cao, có quy mô linh hoạt để xử lý tài liệu. HAQM S3 cung cấp quyền truy cập có độ trễ thấp vào các tài liệu được lưu trữ, trong khi EventBridge cho phép xử lý sự kiện theo thời gian thực. Lambda cung cấp công suất điện toán nhanh chóng và theo nhu cầu. Bản chất phi máy chủ của Lambda và EventBridge loại bỏ các trở ngại liên quan đến việc cung cấp máy chủ. Ngoài ra, HAQM Bedrock còn tận dụng các mô hình AI để xử lý các tác vụ phân tích dữ liệu phức tạp một cách hiệu quả.
-
Tối ưu hóa chi phí
Các dịch vụ của AWS góp phần tối ưu hóa chi phí thông qua các mô hình trả tiền theo mức sử dụng (nghĩa là bạn chỉ trả tiền cho các tài nguyên đã tiêu thụ) và loại bỏ các khoản đầu tư cơ sở hạ tầng trả trước. HAQM S3 cung cấp các tùy chọn lưu trữ theo bậc, cân bằng giữa hiệu năng và chi phí. Bản chất phi máy chủ của EventBridge và Lambda nghĩa là bạn chỉ cần trả tiền cho thời gian điện toán được sử dụng trên thực tế. HAQM Bedrock cung cấp tính năng AI mà không cần chuyên môn hoặc cơ sở hạ tầng nội bộ đắt tiền và Aurora cung cấp hiệu năng tương đương với cơ sở dữ liệu thương mại với chi phí chỉ bằng một phần mức thông thường.
-
Tính bền vững
Các dịch vụ AWS đóng góp vào tính bền vững bằng cách tối ưu hóa việc sử dụng tài nguyên và hiệu quả năng lượng. HAQM S3 sử dụng các công nghệ lưu trữ hiệu quả, trong khi EventBridge và Lambda cung cấp kiến trúc phi máy chủ, giúp giảm thiểu công suất nhàn rỗi. Các dịch vụ dựa trên đám mây này giúp giảm đáng kể cơ sở hạ tầng tại chỗ, giảm tiêu thụ năng lượng và phát thải carbon. Khả năng điều chỉnh quy mô của chúng đảm bảo sử dụng tài nguyên tối ưu, tránh cung cấp quá mức và lãng phí.
Nội dung liên quan

[Tiêu đề]
Tuyên bố miễn trừ trách nhiệm
Mã mẫu; thư viện phần mềm; công cụ dòng lệnh; bằng chứng về khái niệm; mẫu; hoặc công nghệ liên quan khác (bao gồm bất kỳ hạng mục nào nêu trên do nhân viên của chúng tôi cung cấp) sẽ được cung cấp cho bạn dưới dạng Nội dung AWS theo Thỏa thuận khách hàng của AWS hoặc thỏa thuận bằng văn bản có liên quan giữa bạn và AWS (tùy theo điều kiện nào áp dụng). Bạn không nên sử dụng Nội dung AWS này trong tài khoản sản xuất của mình hoặc trên dữ liệu sản xuất hoặc dữ liệu quan trọng khác. Bạn chịu trách nhiệm kiểm thử, bảo mật và tối ưu hóa Nội dung AWS, chẳng hạn như mã mẫu, phù hợp với hoạt động sử dụng ở cấp độ sản xuất dựa trên các phương pháp và tiêu chuẩn kiểm soát chất lượng cụ thể của bạn. Quá trình triển khai Nội dung AWS có thể phát sinh phí AWS cho việc tạo hoặc sử dụng tài nguyên có tính phí trên AWS, chẳng hạn như chạy phiên bản HAQM EC2 hoặc sử dụng dịch vụ lưu trữ HAQM S3.
Việc tham chiếu đến các dịch vụ hoặc tổ chức của bên thứ ba trong Hướng dẫn này không ngụ ý sự chứng thực, tài trợ hoặc liên kết giữa HAQM hoặc AWS với bên thứ ba đó. Hướng dẫn từ AWS là điểm khởi đầu kỹ thuật và bạn có thể tùy chỉnh tích hợp với các dịch vụ của bên thứ ba khi triển khai kiến trúc.