Textract Detect Document

O Conector Textract Detect Document utiliza o serviço Amazon Textract para extrair automaticamente textos de documentos como PDFs ou imagens (JPEG, PNG). Ele é ideal para leitura de documentos escanea

Conector Textract Detect Document

Parâmetros de Entrada

Campo
Tipo
Obrigatório
Descrição

Conectar à Amazon Web Services

Autorização

Sim

Autorização válida com permissões para utilizar o serviço textract:DetectDocumentText.

Path

String

Sim

Caminho para o documento a ser analisado. Pode ser fornecido dinamicamente usando variáveis do fluxo. Exemplo: {{$.a1.filename}}.

Região

Enum

Sim

Região da AWS onde o Textract será executado. Exemplo: us-east-1 (Leste dos EUA - Norte da Virgínia).

🔎 Importante: O arquivo no campo Path deve estar em formato compatível com o Textract (JPEG, PNG ou PDF com até 5 páginas).

Output

O output será um JSON contendo os blocos de texto detectados, com a seguinte estrutura:

jsonCopiarEditar[
  {
    "type": "LINE",
    "text": "Exemplo de linha de texto detectada"
  },
  {
    "type": "WORD",
    "text": "Palavra"
  }
]
  • type: tipo de bloco retornado (LINE ou WORD);

  • text: conteúdo textual reconhecido no documento.

Requisitos e Limitações

  • O documento deve ter no máximo 5 páginas (para PDF).

  • Tamanho máximo do arquivo: 10 MB.

Observações Importantes sobre o Uso do Conector

  1. Entrada de Arquivos via Base64 (sem leitura/escrita em disco): Para utilização do serviços AWS Textract, é obrigatório utilizar arquivos convertidos a partir de strings Base64. Não é suportada a leitura ou escrita de arquivos diretamente em diretórios locais ou em etapas intermediárias do fluxo. Isso se deve a limitações do ambiente de execução, que opera apenas com dados em memória.

  2. Identificação do Tipo de Arquivo (MIME Type): O conector que realiza a conversão de Base64 para arquivo identifica automaticamente o tipo (MIME Type) do conteúdo com base no nome do arquivo fornecido (por exemplo, "documento.pdf" ou "imagem.png"). Sendo assim, não é necessário encapsular a string Base64 com o prefixo MIME (como data:application/pdf;base64,). Basta fornecer a string Base64 pura e o nome do arquivo com a extensão adequada. O conector cuidará da definição correta do tipo do conteúdo.

Last updated

Was this helpful?