Pular para o conteúdo

e-Kanban

Tecnologia OCR

O que é e como funciona?

Do ocr ao ctrl+F

 

A tecnologia OCR (Optical Character Recognition, em inglês) é um processo que permite a conversão de texto impresso ou manuscrito em imagens em texto eletrônico editável. 

Assim, o conteúdo desses documentos torna-se pesquisável, indexado e, claro, editável digitalmente.

Etapas:

 

  • Digitalização
  • Pré-processamento
  • Segmentação de caracteres
  • Reconhecimento de caracteres
  • Pós-processamento
  • Geração de saída

 

O que pode ser convertido:

  • Documentos
  • Impressos
  • Informações de recibos
  • Notas fiscais
 

Serve para minha empresa?

Precisa digitalizar e processar grandes volumes de documentos? Então precisa de OCR.

Cuidados:

A precisão do reconhecimento de caracteres pode variar dependendo: 

Da qualidade da imagem original

  • Do software OCR utilizado
  • Do tipo de fonte
  • Da formatação do texto

 

Em alguns casos, pode ser necessária uma revisão manual para corrigir erros de reconhecimento.