发布于: May 29, 2019

我们很高兴地宣布,自 re:Invent 2018 以来一直提供预览版的 HAQM Textract 现已全面推出。HAQM Textract 是一种托管机器学习服务,可自动从几乎任何文档中提取文本和结构化数据。使用 HAQM Textract,客户可以快速自动执行文档工作流程,在几小时内处理数百万页文档。

HAQM Textract 的功能不只是简单的光学字符识别 (OCR),它还可以识别表单中字段的内容、表格中存储的信息,以及展示信息的上下文。HAQM Textract 的 API 支持多种图像格式,如扫描、PDF 和照片,客户可以将其与其他 AWS 机器学习服务(如 HAQM Comprehend、HAQM Comprehend Medical 和 HAQM Translate)一起使用,以便从提取的文本和数据中获得更深层的含义。提取的文本和数据还可用于在大型文档存档上构建智能搜索,或者加载到数据库中以供应用程序使用,例如会计、审计和合规性软件。要了解有关 HAQM Textract 的更多信息,请访问 HAQM Textract 网站

HAQM Textract 现已在以下 AWS 区域提供:弗吉尼亚北部、俄亥俄、俄勒冈和爱尔兰。要开始使用 HAQM Textract,请阅读入门指南