Textract Detect Document
O Conector Textract Detect Document utiliza o serviço Amazon Textract para extrair automaticamente textos de documentos como PDFs ou imagens (JPEG, PNG). Ele é ideal para leitura de documentos escanea

Parâmetros de Entrada
Conectar à Amazon Web Services
Autorização
Sim
Autorização válida com permissões para utilizar o serviço textract:DetectDocumentText.
Path
String
Sim
Caminho para o documento a ser analisado. Pode ser fornecido dinamicamente usando variáveis do fluxo. Exemplo: {{$.a1.filename}}.
Região
Enum
Sim
Região da AWS onde o Textract será executado. Exemplo: us-east-1 (Leste dos EUA - Norte da Virgínia).
🔎 Importante: O arquivo no campo Path deve estar em formato compatível com o Textract (JPEG, PNG ou PDF com até 5 páginas).
Output
O output será um JSON contendo os blocos de texto detectados, com a seguinte estrutura:
jsonCopiarEditar[
{
"type": "LINE",
"text": "Exemplo de linha de texto detectada"
},
{
"type": "WORD",
"text": "Palavra"
}
]
type: tipo de bloco retornado (LINE ou WORD);
text: conteúdo textual reconhecido no documento.
Requisitos e Limitações
O documento deve ter no máximo 5 páginas (para PDF).
Tamanho máximo do arquivo: 10 MB.
Observações Importantes sobre o Uso do Conector
Entrada de Arquivos via Base64 (sem leitura/escrita em disco): Para utilização do serviços AWS Textract, é obrigatório utilizar arquivos convertidos a partir de strings Base64. Não é suportada a leitura ou escrita de arquivos diretamente em diretórios locais ou em etapas intermediárias do fluxo. Isso se deve a limitações do ambiente de execução, que opera apenas com dados em memória.
Identificação do Tipo de Arquivo (MIME Type): O conector que realiza a conversão de Base64 para arquivo identifica automaticamente o tipo (MIME Type) do conteúdo com base no nome do arquivo fornecido (por exemplo,
"documento.pdf"
ou"imagem.png"
). Sendo assim, não é necessário encapsular a string Base64 com o prefixo MIME (comodata:application/pdf;base64,
). Basta fornecer a string Base64 pura e o nome do arquivo com a extensão adequada. O conector cuidará da definição correta do tipo do conteúdo.
Last updated
Was this helpful?