Categorías
Artículos

Voice Dream Scanner, eficaz y práctico OCR que no precisa conexión a Internet

Si estáis buscando una aplicación para vuestros iPhone que sea capaz de reconocer el texto de todo tipo de documentos impresos de forma efectiva, sencilla y sin precisar conexión a Internet, y no os importa gastaros unos pocos euros, la protagonista de este artículo es una muy buena elección. Y si además ya tenéis instalada Voice Dream Reader, encontraréis muy útil a perfecta compatibilidad entre ambas apps.

 

¿Qué es Voice Dream Scanner?

Se trata de una aplicación OCR (reconocedor óptico de caracteres) que emplea la inteligencia artificial y que puede funcionar de forma independiente o en combinación con la app Voice Dream Reader. Nos permite reconocer texto impreso en papel (como libros, carteles, menús de restaurantes, tickets…), Así como el texto Que aparece en la pantalla del ordenador cuando éste se cuelga. Incluso permite reconocer el texto que haya en fotografías, importándolas desde la propia aplicación o desde otras por medio de una extensión que se añade al menú “Compartir”. Lamentablemente, no nos permite reconocer los archivos PDF inaccesibles tipo imagen. Esto se tiene que hacer desde Voice Dream Reader (no se puede hacer de forma independiente desde Voice Dream Scanner, sino que precisa de esta otra aplicación), y lo curioso es que se pueden reconocer desde el Reader sin necesidad de instalar ni emplear Voice Dream Scanner.

La aplicación sorprende por su rapidez, sencillez y efectividad. Sus características principales son:

  • No requiere de conexión a Internet.
  • Como el reconocimiento se realiza en el propio dispositivo, la privacidad está garantizada.
  • Integra un reproductor «texto a voz» que emplea las voces del sistema o compradas en Voice dream Reader.
  • Proporciona una ayuda sonora a modo de asistencia al enfocar los documentos, que nos indica que todo el documento se encuentra en el campo de visión de la cámara, así como la cantidad de texto reconocido. Además, podemos configurar la app para que ella misma dispare la cámara en cuanto considere que el documento está bien enfocado.
  • Permite guardar/compartir el texto escaneado.
  • Puede funcionar de forma independiente o en combinación con Voice Dream Reader, iniciando el reconocimiento de un documento impreso directamente desde esta otra aplicación (desde el botón «Añadir») así como guardar los documentos escaneados en su biblioteca.
  • Detección automática de los bordes de la página del documento por si deseamos recortar la imagen.
  • Detección automática de orientación de documentos y auto rotación.
  • Detección automática de idioma.
  • Mejora automática de la imagen.
  • Modo por lotes para escanear varias páginas rápidamente.
  • Las palabras se resaltan en el texto mientras son verbalizadas.
  • Se puede seleccionar la voz del sintetizador, cambiar su velocidad y podemos utilizar tanto las voces del sistema como las premium compradas en Voice Dream Reader.
  • Aunque no es gratuita, el precio es muy asequible y es de un solo pago (sin suscripciones mensuales). En el momento de la redacción de esta entrada el coste es de unos siete euros.

 

Descripción del interfaz

Su apariencia es sencilla y funcional. En la pantalla principal encontramos los siguientes botones:

  • “Menú”. Aquí es donde podemos acceder entre otras cosas, a la configuración de la aplicación para modificar algunos parámetros como por ejemplo el idioma, la ayuda sonora a la hora de enfocar los documentos, la mejora de las imágenes, la lectura automática del texto escaneado tras ser reconocido, o que se muestre sin formato el texto resultante de la captura.
  • «Importar foto». Desde aquí podemos acceder a la fototeca de nuestro iPhone para reconocer el texto que aparezca en las fotografías.
  • “Detección de límites”. Función que detecta automáticamente los bordes de la página del documento en el caso de que deseemos recortar el texto.
  • “Linterna”. Para activar/desactivar la luz del flash si hay poca iluminación.
  • “Modo por lotes”. Función que se puede activar en caso de que queramos reconocer de forma rápida un documento con muchas páginas y deseemos que el resultado sea un único archivo.
  • “Capturar imagen”. Este botón se encuentra en la parte central inferior de la pantalla y es el que dispara la cámara para realizar el reconocimiento (siempre y cuando no tengamos activado la captura automática). Como ayuda al enfoque del documento a escanear, la aplicación emite un tono que nos indica cuando está bien enfocado y se detectan adecuadamente sus bordes (cuanto más fuerte es este tono, mejor).
  • “Captura automática”. Una función que dispara la captura de forma automática cuando el texto está correctamente enfocado y la cámara permanece estable.

 

Funcionamiento

Es muy sencillo. La aplicación se puede iniciar desde su propio icono o desde la pantalla principal de Voice Dream Reader, desde el botón «Añadir».

  1. Una vez abierta la app, enfocamos el documento con la cámara trasera del móvil a una distancia de unos 20 cm (dependiendo del tamaño de la página del documento esta distancia puede ser mayor o inferior). Se emite un tono acústico para indicar que se detectan correctamente los bordes del documento y el texto. Si hemos colocado un documento por la cara en la que no hay letras, no escucharemos el tono, lo cual es genial, ya que así no desperdiciamos nuestro tiempo escaneando folios en blanco. Cuando el tono sea más intenso, podemos pulsar el botón que realiza la captura y que se encuentra en la parte inferior central de la pantalla (en el caso de que tengamos activada la captura automática, la propia aplicación dispara la cámara).
  2. Tras realizarse el reconocimiento del texto, pasamos automáticamente a la pantalla de reproducción. Si hemos activado la auto reproducción, la app empezará a leernos automáticamente el texto. Si no, podemos realizar una doble pulsación con dos dedos en medio de la pantalla para escucharlo, o pulsar el botón “Reproducir” (si el texto se lee en un idioma distinto al español o deseamos cambiar la voz seleccionada, debemos ir al botón “Configurar voz” y seleccionar el idioma y la voz deseados). Este mismo botón de reproducción es un ajustable que nos permite avanzar/retroceder por el texto reconocido realizando flicks arriba y abajo. Para pausar la reproducción, podemos realizar una doble pulsación con dos dedos en medio de la pantalla, o presionar el botón “Pausar”.
  3. Si deseamos explorar el texto por medio de VoiceOver, debemos ir al botón “Ver texto o imagen” y pulsarlo de forma que quede en “Mostrando texto”. Luego nos desplazamos al cuadro donde se muestra el texto, y a través del rotor, podemos navegar por líneas, palabras o caracteres.
  4. Si no queremos guardar la imagen o ésta no ha sido bien reconocida, debemos pulsar el botón “Descartar”. En el caso de que deseemos guardar la imagen, debemos pulsar el botón “Mantener”.
  5. Al pulsar el botón “Mantener”, vamos a una nueva pantalla en la que aparte de la vista de la página o páginas reconocidas, aparecen varios botones interesantes:

 

  • “Limpiar”. Para borrar la página o páginas escaneadas y volver a la pantalla inicial.
  • “Guardar”. Para guardar el texto en la aplicación Voice Dream Reader, guardarlo/compartirlo como PDF o archivo de texto sin formato, o copiarlo. Si seleccionamos la opción de guardarlo como archivo PDF o texto, aparece una pantalla para ponerle un título, y tras presionar el botón “Aceptar” nos aparece la típica pantalla para guardar/compartir. Si seleccionamos la opción de copiar, esto nos copia el documento en el portapapeles para poder pegarlo directamente donde queramos.
  • “Capturar imagen”. Este botón nos permite realizar otra captura para añadir una nueva página al documento actual. Tras presionarlo, o esperar a que se dispare la captura automática, nos lleva a la pantalla de reproducción, y si pulsamos el botón de “Mantener”, volvemos a esta misma página donde en la vista previa aparecerá la página anterior y esta nueva. Esta acción la podemos realizar tantas veces como deseemos antes de guardar/compartir el documento que incluirá todas las páginas reconocidas. La diferencia entre esto o activar el modo “Modo por lotes” en la página principal, es que de esta forma podemos escuchar la reproducción de cada página antes de escanear la siguiente, mientras que en el modo por lotes podemos ir pulsando el botón de capturar la imagen repetidamente ante cada página nueva, sin necesidad de pasar por la pantalla de reproducción.

 

Cómo capturar varias páginas de forma seguida en el “Modo por lotes”

Esta función nos puede resultar útil en el caso de que deseemos reconocer varias páginas seguidas de un mismo documento extenso o de un libro, todo ello de forma rápida y que el resultado sea un solo archivo.

Tal y como hemos visto antes, esto no nos permite reproducir el texto de cada una de las páginas (para ello hay que emplear el sistema que hemos visto antes, en la opción “Capturar imagen” que aparece tras presionar “Mantener”), pero sí que podemos previsualizarlas/escucharlas con VoiceOver.

Con este modo la aplicación irá capturando de forma continua las páginas que le pongamos delante de la cámara. Esto es muy práctico y rápido sobre todo si tenemos activada la opción de captura automática, pues basta con ir sustituyendo y colocando encima de la mesa una página tras otra para que la aplicación las vaya capturando. Eso sí, al momento de cambiar una por otra, tenemos que tener la precaución de tapar el objetivo de la cámara para que no continúe capturando sin querer. Yo lo que hago, es que mientras coloco la siguiente página a escanear, me acerco el objetivo de la cámara al pecho para taparlo. Y si se trata de un libro, lo que hago es que voy tapando con un folio en blanco la página contraria a la que deseo escanear. Luego, pasó el folio a la página ya capturada y muevo el móvil a la otra hoja.

Todas las páginas que se van capturando con esta función, se pueden previsualizar de forma individual en esta misma pantalla. Cuando guardemos el resultado, se creará un único documento con todas ellas juntas.

 

Cómo reconocer con Voice dream Reader un documento PDF inaccesible

Esto es algo que tan sólo podréis hacer los que tengáis instalada la aplicación Voice dream Reader en vuestros iPhone, pero ya que he hecho referencia varias veces en este artículo a esta app y a esta función, os pongo a continuación como se hace.

En ocasiones recibimos documentos PDF por mail o WhatsApp que son inaccesibles ya que son un escaneado guardado como imagen. El lector de pantalla VoiceOver no es capaz de leer estos archivos por sí mismo, pero Voice Dream Reader sí (y sin necesidad de tener instalada Voice Dream Scanner). Los pasos para realizar este proceso son los siguientes:

  1. Hay que abrir primero el documento PDF en Voice Dream Reader desde la aplicación en la que tengamos ese archivo (a través del menú “Compartir”).
  2. Una vez importado el documento, lo seleccionamos en la biblioteca y lo abrimos realizando una doble pulsación con un dedo. En ese momento la propia aplicación reconoce que se trata de un PDF inaccesible y nos pregunta que si deseamos realizar OCR en él. Decimos que sí para iniciar el proceso de reconocimiento, el cual se lleva a cabo en segundo plano.
  3. Una vez finalizado el reconocimiento ya tendremos disponible en pantalla el documento totalmente accesible para ser reproducido desde el propio Voice Dream Reader, o para exportarlo a cualquier otra ubicación/aplicación.

 

Ahora, si volvemos atrás, a la biblioteca, observaremos que aparentemente tenemos dos documentos: el PDF inaccesible original y el PDF reconocido. Se trata del mismo archivo, de hecho, si entramos en el inaccesible se abre el reconocido, y si eliminamos éste, se eliminan ambos.

Nota: Si al empezar a reproducir el documento en Voice Dream Reader, éste se lee con la voz en inglés, tenéis que pulsar el botón “configuración de audio” y seleccionar de nuevo el idioma español y la voz deseada.

 

Descarga Voice dream Scanner para iOS desde la AppStore.

 

Autor, Jaime Franco

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable Grupo SucDePoma.
  • Finalidad  Moderar los comentarios. Responder las consultas.
  • Legitimación Tu consentimiento.
  • Destinatarios  Grupo SucDePoma.
  • Derechos Acceder, rectificar y suprimir los datos.
  • Información Adicional Puedes consultar la información detallada en la Política de Privacidad.