OPTICAL CHARACTER RECOGNITIONS SYSTEMS FOR DIFFERENT LANGUAGES WITH SOFT COMPUTING
FICHA
Foto Título:            OPTICAL CHARACTER RECOGNITIONS SYSTEMS FOR DIFFERENT LANGUAGES WITH SOFT COMPUTING
Autor:            Arindam Chaudhuri, Krupa Mandaviya, Pratixa Badelia y Soumya K Ghosh
Editorial:       Springer
Idioma:         Inglés
Páginas:        248
Publicación:  2016
Lectura:         2019
COMENTARIO EDITORIAL
(Fuente: Traducción y ligera elaboración propia de la descripción en Amazon)

Este libro ofrece una visión abarcadora de los modelos soft-compuitng para sistemas de reconocimiento óptico de caracteres. Las diferentes técnicas, incluyendo conjuntos difusos e irregulares, redes neuronales artificiales y algoritmos genéticos, se ponen a prueba usando textos reales escritos en diferentes idiomas como Inglés, Francés, Alemán, Latín, Hindi y Gujrati, los cuales se han extraídos de conjuntos de datos disponibles públicamente.

Los estudios de simulación, que se se explican en detalle, muestran que el modelado basado en soft-computing de sistemas OCR se comportan consistentemente mejor que los modelos tradicionales.

Principalmente concebido como una muestra del estado del arte para estudiantes de posgrado e investigadores en reconocimiento de patrones, reconocimiento óptico de caracteres y soft computing, este libro es también de utilidad también para profesionales en visión por ordenador y procesamiento de imágenes, profundizando en los diferentes aspectos relacionados con el reconocimiento óptico de caracteres.

COMENTARIO PERSONAL

'Optical Character Recognition for different languajes with soft computing' es una obra muy especializada y técnica sobre reconocimiento óptico de caracteres. Su objetivo es mostrar el trabajo llevado a cabo por el equipo que redacta el libro y con el que quieren demostrar que las técnicas de soft computing son más efectivas que los algoritmos tradicionales en la tarea del reconocimiento de textos.

El libro se estructura en diez capítulos, siendo el primero '1. Introduction' una explicación de en qué sonsiste el propio libro.

El segundo capítulo, '2. Optical Character Recognition Systems' es, para mi gusto, el capítulo más interesante y el que contiene la información que realmente estaba buscando al leer este libro, a saber, el funcionamiento y algoritmia ligada al reconocimiento óptico de caracteres. Se nos proporciona algo de background y perspectiva histórica para luego repasar las diferentes técnicas siguiendo el esquema secuencial de aplicación: escaneado óptico, segmentación de localización, preprocesado, segmentación, representación, extracción de características, entrenamiento y reconocimiento y postproceso.

El tercer capítulo '3. Soft Computing Techniques for Optical Character Recognition Systems' es, sin embargo, el capítulo que entiendo principal desde el punto de vista de los autores, puesto que en él se explican las técnicas de soft computing que los autores defienden como más eficaces. Nos hablan de conjuntos difusos ('fuzzy sets'), algoritmos genéticos, la transformada de Hough, variantes difusas del Perceptrón Multicapa o los Support Vector Machines, etc

A continuación en los siguientes capítulos se aplican las técnicas descritas en el tercer capítulo a diferentes idiomas y se analizan los resultados. Siguiendo un esquema muy parecido, se desarrollan los siguientes capítulos:
  • '4. Optical Character Recognition for English Language'
  • '5. Optical Character Recognition for French Language'
  • '6. Optical Character Recognition for German Language'
  • '7. Optical Character Recognition for Latin Language'
  • '8. Optical Character Recognition for Hindi Language'
  • '9. Optical Character Recognition for Gujrati Language'
En todos ellos se proporciona una breve introducción sobre el idioma en si, sobre alguno de los retos que plantea desde el punto de vista de OCR, las fuentes de datos usadas, qué técnicas y cómo se han aplicado y los resultados obtenidos.

FInaliza el libro con el capítulo '10. Summary and future research' que, siguiendo el estilo académico habitual, resume los hallazgos y plantea siguientes líneas de trabajo.

Un libro de alta calidad pero también muy, muy duro de leer, pensado para estudiantes e investigadores muy especializados y con un gran dominio de la algoritmia y mucho interés en ella.