Documento escaneado? Foto do celular? A IA lê por você.
OCR via Gemini Vision que transforma PDF escaneado, HEIC, WebP e TIFF em texto utilizável. Processamento por página, guard anti-falso-negativo e até 200k caracteres. O texto extraído alimenta todos os módulos da plataforma.
O problema
Documentos escaneados são invisíveis para qualquer IA.
- 01
PDF escaneado é imagem, não texto
Cópia de contrato, certidão, notificação — metade dos documentos que chegam ao escritório são PDFs escaneados. Sem OCR, a IA não consegue ler uma palavra.
- 02
Fotos do celular com qualidade variável
Cliente manda foto do documento pelo WhatsApp: torta, com sombra, em HEIC. Ferramentas genéricas de OCR falham ou extraem lixo. O advogado acaba digitando manualmente.
- 03
Processos antigos com header de tribunal
Provas com carimbo do TJSP, marca d'água do TRT, numeração de página sobreposta ao texto. OCR convencional mistura header com conteúdo e o texto extraído fica inutilizável.
- 04
Resultado do OCR fica isolado
Mesmo quando o OCR funciona, o texto extraído vai para um arquivo separado. Não alimenta a petição, o diagnóstico ou o cálculo — é trabalho duplicado.
O que o KnowLaw entrega
OCR que entende documento jurídico — não apenas pixels.
Gemini Vision processando por página, com guard anti-falso-negativo e integração nativa com todos os módulos da plataforma.
Gemini Vision — OCR de nova geração
Não é Tesseract. O Gemini Vision entende contexto visual: distingue header de conteúdo, lê tabelas, interpreta carimbos e marcas d'água sem misturar com o texto principal.
destaquePDF escaneado, HEIC, WebP, TIFF
Aceita os formatos que realmente chegam ao escritório: PDF escaneado (inclusive multi-página), fotos de celular (HEIC, JPG, PNG), WebP e TIFF de scanner profissional.
destaqueOCR por página (resolve header de tribunal)
Cada página é processada individualmente. Cabeçalho do TJSP, numeração do TRT, marca d'água — o OCR por página isola o conteúdo útil sem contaminar com metadados visuais.
Guard anti-falso-negativo
Quando o OCR não consegue extrair texto confiável de uma página, ela é sinalizada para revisão manual em vez de ser silenciosamente descartada. Nenhuma página é perdida.
Background processing via Celery
Documentos longos são processados em background. Você sobe o arquivo e continua trabalhando — o OCR avisa quando terminar. Sem travamento de tela.
Integrado à plataforma
O texto extraído alimenta diretamente petição, diagnóstico, cálculo trabalhista e assistente. Não é arquivo separado — é insumo pronto para uso em qualquer módulo.
Números reais
OCR que funciona no mundo real do escritório.
200k
caracteres por documento
limite generoso para processos longos
HEIC/WebP/TIFF
formatos além de PDF
o que realmente chega pelo WhatsApp e scanner
Por página
processamento granular
resolve headers de tribunal e marcas d'água
Anti-FN
guard anti-falso-negativo
nenhuma página descartada silenciosamente
Perguntas frequentes
Dúvidas sobre OCR jurídico com IA.
Sim. O Gemini Vision processa fotos em HEIC (iPhone), JPG, PNG e WebP, mesmo com baixa resolução, sombra ou angulação. A qualidade da extração é significativamente superior a OCR convencional (Tesseract) em documentos fotografados.
Cada página é processada individualmente pelo Gemini Vision, que distingue conteúdo textual de elementos visuais como cabeçalho do TJSP, numeração do TRT ou marca d'água. O texto extraído contém apenas o conteúdo útil.
O guard anti-falso-negativo sinaliza a página para revisão manual em vez de descartá-la silenciosamente. Você é notificado de quais páginas precisam de atenção — nenhum conteúdo é perdido.
O OCR processa até 200k caracteres por documento. Para a maioria dos documentos jurídicos (contratos, certidões, sentenças, petições), esse limite é mais que suficiente. Documentos muito longos são processados em background.
Sim. O texto do OCR alimenta diretamente petição rápida, diagnóstico, cálculo trabalhista, assistente e agentes especializados. Não é necessário copiar e colar — a integração é nativa.
O Gemini Vision é multilíngue. Funciona com documentos em português, inglês, espanhol e outros idiomas. Para contratos internacionais ou documentos de arbitragem, a extração funciona sem configuração adicional.
Comece agora
7 dias grátis. Suba um documento escaneado e veja.
Teste com o PDF escaneado que você tem no escritório agora. Veja o texto extraído, a sinalização de páginas com baixa confiança e a integração com os outros módulos. Se não resolver, não custa nada.
Fale com a gente
Conta o caso. A gente responde em até um dia útil.
Pode mandar dúvida sobre a plataforma, pedir demonstração ou propor um piloto. Sem formulário longo, sem callcenter.