Buscando opciones alternativas a los programas OCR pagados, encontre un programa de reconocimiento de texto llamado GOCR (http://jocr.sourceforge.net/). Ahora se preguntaran que es eso de GAL, es que el programa es Gratuito, es decir no es necesario pagar ningún monto para poder usarlo, Abierto porque puedas descargarte el código fuente, y Libre porque puedes modificarlo y colaborar a mejorar el proyecto.
Gocr versión 0.44 es bastante funcional, y cuenta con muchas opciones. La interfase es en linea de comandos, pero no es muy dificil de aprender. Por ejemplo para poder reconocer texto de un documento escribiriamos lo siguiente:

Donde:
“gocr044.exe” es el nombre del programa.
“-i” es el parámetro que le indica al programa el nombre del documento escaneado.
“boleta.px” es la ruta completa al documento escaneado. En este caso como ambos, el programa y el documento estan en el mismo directorio, solo basta el nombre del archivo.
“-o” es el parametro que indica al programa el nombre que tendra el archivo de texto resultante.
“boleta.txt” es la ruta completa del archivo de texto que deseamos. En este caso como ambos, el programa y el documento estan en el mismo directorio, solo basta el nombre del archivo.
El programa tiene un porcentaje de acierto bastante alto cuando el documento escaneado tiene buena resolución, asi que procura escanear a la mejor resolución posible. Si lo han notado el archivo fuente tiene extensión pcx, y esto es porque el programa acepta solo los formatos pcx, pnm, pgm, pbm, ppm. No hay problema para convertir nuestro documento escaneado de formato tif a pcx podemos usar IrfanView, solo necesitamos guardarlo con esa extensión.
Creditos: Joerg Schulenburg
He realizado una interfase gráfica espero les sea de ayuda, pueden bajarla desde aqui.
Comentarios