Categorías
Artículos

Prizmo Go, práctico y gratuito OCR que no precisa conexión a Internet

Actualmente existen muchas aplicaciones OCR para convertir nuestros smartphones en un útil escáner de bolsillo, pero si buscamos una que sea rápida, sencilla, efectiva, accesible, gratuita y que tenga incorporado el motor de OCR para que pueda funcionar a pesar de no disponer de wifi ni cobertura, Prizmo Go es la candidata ideal. Su facilidad y rapidez la convierten en la opción perfecta para reconocer un texto en cualquier sitio, en un instante y sin complicaciones, que es lo primordial en este tipo de aplicaciones.

 

Descripción de la aplicación

Prizmo Go es una aplicación de reconocimiento óptico de caracteres basado en un sistema de redes neuronales, que permite capturar y reconocer por medio de la cámara del iPhone o del iPad el texto que hay en todo tipo de documentos impresos y escritos a mano (esto último tan sólo en inglés y no de forma gratuita). Además, también permite traducir el texto reconocido a otros idiomas (59 idiomas y también pagando). Y es que esta aplicación en su versión básica es gratuita, pero luego hay un servicio de suscripción premium mensual que libera todas las funciones como el reconocimiento online que mejora la precisión, el reconocimiento de texto manuscrito (en inglés), así como la traducción y la exportación/interacción del texto reconocido. No obstante, la versión gratuita reconoce bastante bien los documentos, por lo que probablemente ya tendremos suficiente con esta versión.

Muchas de sus funciones están específicamente diseñadas para VoiceOver, por lo que su uso nos resultará muy accesible. Muestra de esto son el sistema de ayuda/guiado con voz para enfocar el documento o su lector/conversor texto a voz con teclas de reproducción y navegación. Pero eso no es lo único destacable. Otras Cualidades dignas de mención son que ya trae incorporado el motor OCR con varios idiomas (nos podemos suscribir a la versión premium que permite usar un motor OCR en la nube de mayor precisión con muchos más idiomas y que además permite traducir a otros idiomas el texto reconocido), la posibilidad de lanzar tanto la ayuda del enfoque como la captura de la imagen con los botones físicos del volumen, la incorporación de un Procesamiento de imagen para reconocer texto mal alineado o direcciones invertidas así como un sistema de estabilización de imagen que mejora la nitidez, la capacidad de detectar códigos QR, y la posibilidad de copiar y compartir el texto reconocido así como interactuar con la información encontrada en éste (números de teléfono, direcciones de correo electrónico, direcciones físicas, sitios web).

Seguidamente paso a describiros los botones que nos encontramos En la pantalla principal:

  • “Ajustes de la aplicación”. Aquí dentro encontramos diversas opciones y ajustes: las compras disponibles desde la App, la detección de códigos QR, el almacenamiento de las fotos en el álbum (que viene desactivado por defecto y que es muy útil ya que evita que nos tengamos que preocupar de eliminar las fotos que vamos realizando), el modo de bajo consumo, y la lectura de texto automática (opción muy interesante que nos permite poder activar/desactivar la reproducción automática del texto tras ser reconocido).
  • “Detección de orientación”. Para activar o desactivar la detección automática de la orientación del texto que vamos a reconocer, despreocupándonos así de si lo tenemos del derecho o del revés.
  • “Flash”. Permite activar y desactivar manualmente el flash de la cámara, lo cual viene muy bien para capturar imágenes en situaciones de baja iluminación.
  • “Estabilización”. Mejora la nitidez de la imagen cuando la cámara no tiene suficiente estabilidad al disparar. Esta opción enlentece unos dos segundos el proceso de captura de la imagen, pero resulta interesante activarla tanto si nos tiembla el pulso, como si deseamos mejorar algo más la precisión del reconocimiento.
  • “Idioma del OCR”. Desde aquí podemos cambiar el idioma del reconocimiento sin conexión a Internet. Al principio tan sólo viene en inglés y debemos entrar aquí para descargar de forma gratuita los paquetes que precisemos en otros idiomas, como el español.
  • “Capturar imagen”. Este es el botón que tenemos que pulsar para iniciar la captura y reconocimiento de un documento (esto también se puede hacer de forma mucho más cómoda pulsando el botón físico de subir el volumen del lateral del iPhone).
  • “Importar imagen”. Desde aquí podemos acceder a las fotografías del carrete y reconocer el texto que haya en éstas.
  • “Descripción de la escena”. Este último botón es el que nos facilita una descripción/ayuda con voz para enfocar adecuadamente el texto (acción que se puede llevar a cabo de una forma mucho más cómoda pulsando el botón físico de bajar el volumen que hay en el lateral del iPhone). Se trata de una ayuda realmente completa, con información muy útil, como por ejemplo la de rotar X grados el móvil, las líneas captadas del documento, el ángulo, el porcentaje de cobertura del texto…

 

Funcionamiento

1º. Para capturar un texto colocamos el documento a reconocer en una superficie plana (es importante asegurarnos de que haya buena iluminación y que alrededor del texto no se encuentren otros textos u objetos cercanos para que el programa reconozca bien los bordes del documento). Después colocamos el móvil paralelo a la superficie del texto, a una distancia de unos 30 centímetros con la cámara enfocándolo. En ese punto, si estamos convencidos de que ya lo tenemos bien enfocado, pulsamos el botón de subir volumen del lateral del iPhone para iniciar la captura, o si deseamos verificar el enfoque, pulsamos el botón de bajar volumen de lateral del iPhone para obtener la descripción/ayuda para el enfoque (durante el proceso de enfoque, el móvil vibra y emite un ruidito similar a un “tableteo”, pero eso no suele ser de gran ayuda ni garantía de que el documento esté bien enfocado, por lo que lo mejor es solicitar la guía del enfoque).

2º. Una vez realizada la captura, pasamos automáticamente a la pantalla de lectura donde empieza la auto reproducción del texto reconocido. Si deseamos detener la reproducción, tenemos 2 opciones: pulsar 2 veces con 2 dedos en cualquier parte de la pantalla o presionar el botón “Pausa”. Para reanudar la lectura lo mismo: pulsamos 2 veces con 2 dedos o presionamos el botón “Leer” (os recuerdo, en el caso de que no queráis que empiece la auto lectura automática, que esta opción se puede desactivar desde el botón “Ajustes de la aplicación” de la pantalla principal).

En esta misma pantalla también disponemos de botones para avanzar o retroceder por párrafos… que facilitan la navegación por el texto reconocido (estos botones tan sólo aparecen mientras se está reproduciendo el texto o tras presionar el botón “Parar”. Si el texto está en pausa tras haber presionado el botón “Pausa” o tras haber pulsado con 2 dedos 2 veces, no aparecen estos botones. De Todas Formas, arriba del todo hay Un cuadro con el texto reconocido, por lo que si nos ubicamos ahí, podremos navegar de una forma más sencilla por el texto con VoiceOver,.

Los botones de “Compartir” y “Copiar” que nos encontramos en esta pantalla no nos servirán de nada, a no ser que nos suscribamos a la versión premium. Y es que aunque aparentemente parecen funcionar ambos botones, en el texto compartido o pegado aparece un mensaje comunicándonos que es un texto procesado por Prizmo Go y que debemos obtener la versión premium para acceder al texto completo.

Lo mismo pasa con el botón de “Traducir”. Tan sólo podremos traducir el texto reconocido en la versión premium.

Desde esta misma pantalla se puede cambiar la voz y su velocidad, y una vez leído el texto, en el caso de que queramos realizar otra captura, no hay ninguna necesidad de eliminar la que tenemos en ese momento en pantalla. Basta con pulsar el botón “Volver a la cámara” o realizar el gesto de VoiceOver de ir a la página anterior, para regresar a la pantalla principal donde podremos capturar el nuevo texto.

 

Notas prácticas

  • Para poder copiar y compartir el texto reconocido sin tener que adquirir estas funciones, tenemos la fabulosa y socorrida posibilidad que nos ofrece VoiceOver de copiar en el portapapeles lo último que se ha verbalizado. Para esto nos ponemos arriba del todo de la pantalla de lectura, en el cuadro del texto reconocido, y tras empezar VoiceOver a leerlo, realizamos el gesto de pulsar con 3 dedos cuatro veces rápidamente en la pantalla. Luego nos vamos al cuadro de edición de la aplicación donde deseemos pegarlo (WhatsApp, Mail, editor de texto…), realizamos el gesto del rotor hasta llegar a “Editar”, hacemos flick hacia abajo hasta “Pegar”, y finalmente hacemos un doble toque con un dedo en esa opción para pegar. Lamentablemente, si el documento tiene varios párrafos, deberemos repetir este proceso con cada uno de ellos. Por cierto, para copiar el texto al portapapeles, no hace falta esperar a que VoiceOver termine de leer todo el texto, con realizar el gesto nada más empezar a verbalizarlo, ya se copia todo íntegramente.
  • También se pueden reconocer fotografías directamente desde aplicaciones como WhatsApp para leer el texto que pueda haber en ellas. Para hacer esto en el caso de WhatsApp, primero nos ubicamos encima de la fotografía que deseamos reconocer, luego realizamos flicks hacia abajo hasta la opción «Reenviar», entramos ahí con un doble toque con un dedo, después con flick hacia la derecha buscamos y pulsamos el botón «Compartir», y finalmente, en el cuadro que se abre, pulsamos en “Reconocer texto” (si no aparece esta opción, hay que entrar en “Editar acciones” para hacer que aparezca). Tras todo eso, se abrirá una pantalla en la que tendremos que pulsar el botón “Reconocer”.

 

Descarga Prizmo Go desde la App Store.

 

Deja un comentario