← Back to Blog

Como tornar livros de registro manuscritos pesquisáveis

Iuri Madeira

Toda serventia tem aquela estante. Às vezes uma sala inteira. Livros de registro empilhados por décadas, com caligrafia cursiva que só quem trabalha ali há anos consegue navegar com alguma velocidade. Quando alguém pede informação sobre um ato registrado nos anos 80 ou 90, começa uma busca manual que pode levar horas. Tornar esses livros de registro manuscritos pesquisáveis digitalmente é possível, prático e muda completamente a operação.

Este artigo mostra o fluxo completo: da captura da imagem até a busca semântica que encontra um registro específico em segundos.

Etapa 1: Captura — escaneamento ou fotografia

Tudo começa com uma imagem de boa qualidade. Existem dois caminhos:

Scanner planetário (ideal para livros)

Scanners planetários capturam a imagem com o livro aberto sobre uma superfície, sem pressionar as páginas. São ideais porque:

  • Não danificam a encadernação
  • Capturam a dobra central sem distorção severa
  • Permitem resolução controlada (300-400 DPI)
  • Iluminação uniforme integrada

Para serventias com grande volume de livros, é o investimento que mais faz diferença na qualidade do resultado final.

Câmera fotográfica ou celular

Para serventias que estão começando ou têm volume menor, câmeras de celular modernas (a partir de 12MP) produzem resultados utilizáveis se os cuidados básicos forem seguidos:

  • Iluminação: difusa, sem reflexos. Duas luminárias em ângulo de 45 graus resolvem
  • Ângulo: perpendicular à página, sem inclinação
  • Estabilidade: apoio fixo ou tripé. Tremor gera borrão que o OCR não compensa
  • Enquadramento: página inteira, com pequena margem

A resolução efetiva de um celular bom, a 30cm de distância de uma folha A4, equivale a aproximadamente 300 DPI — suficiente para OCR de manuscritos.

Etapa 2: Upload e OCR automático

Com as imagens capturadas, o próximo passo é o upload para o Notoria. O processo é simples:

  1. As imagens são enviadas em lote — dezenas ou centenas de páginas por vez
  2. O OCR é aplicado automaticamente a cada imagem
  3. O texto manuscrito é extraído com reconhecimento contextual

O OCR do Notoria não lê letra por letra como OCR tradicional. Ele analisa o contexto da linha, da frase, do documento. Quando uma letra está ambígua — um "a" que parece "o" numa caligrafia apressada — o modelo usa o contexto para decidir. Numa escritura que menciona "compra e vend_", o sistema infere "venda".

Para manuscritos com boa conservação e caligrafia razoavelmente clara, a taxa de reconhecimento fica acima de 85%. Suficiente para tornar o documento plenamente pesquisável por termos relevantes.

Etapa 3: Tipos Documentais e metadados

Aqui é onde a digitalização sai do amadorismo. Cada página ou documento recebe um Tipo Documental com campos específicos:

Escritura:

  • Livro: 47
  • Folha: 312
  • Data do ato: 15/08/1994
  • Natureza: Compra e Venda
  • Comarca: São Paulo - SP

Certidão de Nascimento:

  • Livro: A-23
  • Folha: 89
  • Termo: 4.521
  • Data de registro: 03/03/1967

Registro de Imóveis:

  • Matrícula: 12.345
  • Averbação: AV-3
  • Data: 22/11/1985

Esses metadados podem ser preenchidos de duas formas:

  • Automaticamente: o pipeline de processamento do Notoria extrai as informações do texto reconhecido pelo OCR
  • Manualmente: para documentos onde a extração automática não capturou todos os campos

A combinação de OCR + extração automática de metadados é o que torna a operação viável em escala. Sem isso, cada documento exigiria digitação manual de metadados — centenas de documentos por dia se tornariam centenas de formulários.

Etapa 4: Organização automática

Com o Tipo Documental definido e os metadados preenchidos, o Notoria organiza automaticamente:

  • Pastas: escrituras vão para a pasta de Escrituras, certidões para Certidões
  • Tags: ano do ato, tipo (compra e venda, doação, inventário), comarca
  • Ordenação: por data do ato, livro, folha

O resultado é um acervo digital que espelha a organização lógica dos livros físicos, mas com a vantagem de ser navegável por múltiplos critérios ao mesmo tempo.

Etapa 5: Busca semântica — o resultado final

Agora vem o motivo de todo esse esforço. Com o acervo digitalizado, classificado e indexado, a busca funciona assim:

Busca por metadados:

  • "Livro 47, Folha 312" → resultado imediato
  • "Escrituras de compra e venda, 1994" → todas as escrituras desse tipo e ano

Busca por conteúdo do texto:

  • "José da Silva compra imóvel" → encontra documentos que mencionam essa transação
  • "imóvel Rua dos Carvalhos" → encontra todos os registros relacionados a esse endereço

Busca semântica (por significado):

  • "transferência de imóvel na Rua dos Carvalhos nos anos 90" → encontra a escritura de compra e venda de agosto de 1994, Livro 47, Folha 312 — mesmo que o texto original não use a palavra "transferência"

A busca semântica é o diferencial. Ela entende que "transferência de imóvel" e "compra e venda" são conceitos relacionados. Entende que "década de 90" inclui documentos de 1990 a 1999. Isso muda fundamentalmente a forma como a equipe interage com o acervo.

O fluxo na prática diária

Uma vez implementado, o dia a dia muda assim:

Antes: telefone toca, alguém precisa de informação sobre um registro dos anos 90. Funcionário vai ao arquivo, identifica o livro provável, folheia até encontrar. Tempo: 30 minutos a 2 horas.

Depois: mesma ligação. Funcionário pesquisa no Notoria. Tempo: 15 a 30 segundos.

Antes: auditor do CNJ solicita levantamento de todos os registros de um tipo específico em determinado período. Equipe mobilizada por dias.

Depois: busca filtrada por tipo documental e período. Relatório gerado em minutos.

Começando o projeto de digitalização

O caminho mais prático é começar pelos livros com maior demanda de consulta — geralmente os mais recentes (últimos 20-30 anos) e os que envolvem imóveis. Em seguida, avançar para o acervo mais antigo.

O Notoria oferece um template pré-configurado para cartórios que já inclui pastas, tipos documentais, tags e pipelines. A configuração inicial leva menos de uma hora.

O investimento maior é na captura: scanner ou câmera, e o tempo da equipe para digitalizar. O processamento — OCR, classificação, organização — é automático.

Conheça o Notoria para cartórios e comece a transformar livros manuscritos em acervo pesquisável.