Transition: Auto Volador o Avión con ruedas Microsoft Excel: Un motor de juegos 3D?
Jun 08

GOCRBuscando opciones alternativas a los programas OCR pagados, encontre un programa de reconocimiento de texto llamado GOCR (http://jocr.sourceforge.net/). Ahora se preguntaran que es eso de GAL, es que el programa es Gratuito, es decir no es necesario pagar ningún monto para poder usarlo, Abierto porque puedas descargarte el código fuente, y Libre porque puedes modificarlo y colaborar a mejorar el proyecto.

Gocr versión 0.44 es bastante funcional, y cuenta con muchas opciones. La interfase es en linea de comandos, pero no es muy dificil de aprender. Por ejemplo para poder reconocer texto de un documento escribiriamos lo siguiente:

Gocr

Donde:

“gocr044.exe” es el nombre del programa.

“-i” es el parámetro que le indica al programa el nombre del documento escaneado.

“boleta.px” es la ruta completa al documento escaneado. En este caso como ambos, el programa y el documento estan en el mismo directorio, solo basta el nombre del archivo.

“-o” es el parametro que indica al programa el nombre que tendra el archivo de texto resultante.

“boleta.txt” es la ruta completa del archivo de texto que deseamos. En este caso como ambos, el programa y el documento estan en el mismo directorio, solo basta el nombre del archivo.

El programa tiene un porcentaje de acierto bastante alto cuando el documento escaneado tiene buena resolución, asi que procura escanear a la mejor resolución posible. Si lo han notado el archivo fuente tiene extensión pcx, y esto es porque el programa acepta solo los formatos pcx, pnm, pgm, pbm, ppm. No hay problema para convertir nuestro documento escaneado de formato tif a pcx podemos usar IrfanView, solo necesitamos guardarlo con esa extensión.

Creditos: Joerg Schulenburg

He realizado una interfase gráfica espero les sea de ayuda, pueden bajarla desde aqui.

3 Responses to “OCR usando software GAL”

  1. admin Says:

    Si tienen problemas con la interfase solo comenten

  2. Jorge hector Caramignoli Says:

    Estoy necesitando desde hace muchos años un OCR que funcione sin mayores inconvenientes , esdecir que ahorre tiempo y no que gaste mas tiempo que si se hubiese hecho el trabajo sin su ayuda.-

  3. admin Says:

    Hola Jorge.
    Del lado del software gratuito tienes SimpleOCR 3.1, GOCR .
    Si cuentas con MS Office puedes hacer uso del Microsoft Office Document Imaging que viene integrado y es bastante sencillo. Otro paquete comercial que me parece bueno es el ReadIris.
    No existe software perfecto debe entenderse y debes procurar que el texto escaneado sea lo más claro posible.
    Gracias.

Leave a Reply

You must be logged in to post a comment.