Desenvolvimento de uma ferramenta computacional para recuperação e correção de textos digitalizados

  • Marlon Marcon Instituto Federal de Minas Gerais (IFMG), Bambuí (MG) - Brasil
  • André Luiz Brun Universidade Estadual do Oeste do Paraná - UNIOESTE
  • Jorge Bidarra Universidade Estadual do Oeste do Paraná - UNIOESTE
Palavras-chave: OCR. Léxicos. Histogramas de Projeção. Correção ortográfica.

Resumo

Atualmente, há diversas ferramentas computacionais voltadas para identificação e reconhecimento de palavras em arquivos digitais, onde um grande problema tem sido o tratamento de ruídos (falhas de aquisição e erros ortográficos). Estas inconveniências fazem com que os algoritmos de reconhecimento apresentem resultados abaixo do esperado. Este trabalho implementa uma solução para o reconhecimento de palavras com maior qualidade, aplicando algoritmos de remoção de ruído e melhora de contraste, bem como a adoção de um léxico aliado ao módulo de reconhecimento dos caracteres. Os resultados obtidos a partir dos testes de validação e correção das palavras com problemas com taxas de aproveitamento dentro dos limites esperados.

Downloads

Não há dados estatísticos.
Publicado
2013-05-17
Como Citar
[1]
Marcon, M., Brun, A. e Bidarra, J. 2013. Desenvolvimento de uma ferramenta computacional para recuperação e correção de textos digitalizados. Revista Brasileira de Computação Aplicada. 5, 1 (maio 2013), 71-83. DOI:https://doi.org/10.5335/rbca.2013.2719.
Seção
Artigo Original
Share |