Conector Textract Detect Document

O Conector Textract Detect Document utiliza o serviço Amazon Textract para extrair automaticamente textos de documentos como PDFs ou imagens (JPEG, PNG). Ele é ideal para leitura de documentos escanea

Conector Textract Detect Document

Parâmetros de Entrada

Campo
Tipo
Obrigatório
Descrição

Conectar à Amazon Web Services

Autorização

Sim

Autorização válida com permissões para utilizar o serviço textract:DetectDocumentText.

Path

String

Sim

Caminho para o documento a ser analisado. Pode ser fornecido dinamicamente usando variáveis do fluxo. Exemplo: {{$.a1.filename}}.

Região

Enum

Sim

Região da AWS onde o Textract será executado. Exemplo: us-east-1 (Leste dos EUA - Norte da Virgínia).

🔎 Importante: O arquivo no campo Path deve estar em formato compatível com o Textract (JPEG, PNG ou PDF com até 5 páginas).

Output

O output será um JSON contendo os blocos de texto detectados, com a seguinte estrutura:

jsonCopiarEditar[
  {
    "type": "LINE",
    "text": "Exemplo de linha de texto detectada"
  },
  {
    "type": "WORD",
    "text": "Palavra"
  }
]
  • type: tipo de bloco retornado (LINE ou WORD);

  • text: conteúdo textual reconhecido no documento.

Requisitos e Limitações

  • O documento deve ter no máximo 5 páginas (para PDF).

  • Tamanho máximo do arquivo: 10 MB.

Last updated

Was this helpful?