Categorías
Artículos

Voice Dream Scanner, eficaz y práctico OCR que no precisa conexión a Internet

Si estáis buscando una aplicación para vuestros iPhone o iPad que sea capaz de reconocer el texto de todo tipo de documentos impresos de forma efectiva, sencilla y sin precisar conexión a Internet, y no os importa gastaros unos pocos euros en un pago único, la protagonista de este artículo es una muy buena elección.

 

¿Qué es Voice Dream Scanner?

Se trata de una aplicación OCR (reconocedor óptico de caracteres) que emplea la inteligencia artificial y que nos permite reconocer por medio de la cámara trasera de nuestro dispositivo el texto impreso en cualquier superficie (como libros, carteles, menús de restaurantes, tickets…), Así como el texto Que aparece en la pantalla del ordenador cuando éste se cuelga. Incluso permite reconocer el texto que haya en fotografías, importándolas desde la propia aplicación o desde otras por medio de una extensión que se añade al menú “Compartir”. Lamentablemente, no nos permite reconocer los archivos PDF inaccesibles tipo imagen, lo cual se debe hacer desde Voice Dream Reader.

La aplicación sorprende por su rapidez, sencillez y efectividad. Sus características principales son:

  • No requiere de conexión a Internet.
  • Como el reconocimiento se realiza en el propio dispositivo, la privacidad está garantizada.
  • Integra un reproductor «texto a voz» que emplea las voces del sistema o las compradas en Voice dream Reader.
  • Proporciona una ayuda sonora a modo de asistencia al enfocar los documentos, que nos indica que todo el documento se encuentra en el campo de visión de la cámara, así como la cantidad de texto reconocido. Además, podemos configurar la app para que ella misma dispare la cámara en cuanto considere que el documento está bien enfocado.
  • Permite guardar/compartir el texto escaneado.
  • Detección automática de los bordes de la página del documento por si deseamos recortar la imagen.
  • Detección automática de orientación de documentos y auto rotación.
  • Detección automática del idioma del reconocimiento.
  • Mejora automática de la imagen.
  • Modo por lotes para escanear varias páginas rápidamente.
  • Las palabras se resaltan en el texto mientras son verbalizadas.
  • Se puede seleccionar la voz del sintetizador, cambiar su velocidad y podemos utilizar tanto las voces del sistema como las premium compradas en Voice Dream Reader.
  • Aunque no es gratuita, el precio es muy asequible y es de un solo pago (sin suscripciones mensuales). En el momento de la redacción de esta entrada el coste es de unos siete euros.

 

Finalmente, comentar que aunque Voice Dream Reader a partir de la versión 4.12 incorpora un OCR para escanear textos impresos con la cámara trasera de nuestro dispositivo, su funcionalidad no es exactamente la misma que nos ofrece Voice Dream Scanner. Por ejemplo, el OCR incorporado en Reader no tiene el reproductor «texto a voz» y ofrece menos posibilidades a la hora de compartir el resultado del escaneo. Tan sólo lo envía a su biblioteca. Aunque desde allí, por supuesto, lo podemos compartir a otros sitios.

 

Descripción del interfaz

Su apariencia es sencilla y funcional. En la pantalla principal encontramos los siguientes botones:

  • “Menú”. Aquí es donde podemos acceder entre otras cosas, a la configuración de la aplicación para modificar algunos parámetros como por ejemplo el idioma, la ayuda sonora a la hora de enfocar los documentos, la mejora de las imágenes, la lectura automática del texto escaneado tras ser reconocido, o que se muestre sin formato el texto resultante de la captura.
  • «Importar foto». Desde aquí podemos acceder a la fototeca de nuestro iPhone para reconocer el texto que aparezca en las fotografías.
  • “Detección de límites”. Función que detecta automáticamente los bordes de la página del documento en el caso de que deseemos recortar el texto.
  • “Linterna”. Para activar/desactivar la luz del flash si hay poca iluminación.
  • “Modo por lotes”. Función que se puede activar en caso de que queramos reconocer de forma rápida un documento con muchas páginas y deseemos que el resultado sea un único archivo.
  • “Capturar imagen”. Este botón se encuentra en la parte central inferior de la pantalla y es el que dispara la cámara para realizar el reconocimiento (siempre y cuando no tengamos activado la captura automática). Como ayuda al enfoque del documento a escanear, la aplicación emite un tono que nos indica cuando está bien enfocado y se detectan adecuadamente sus bordes (cuanto más fuerte es este tono, mejor).
  • “Captura automática”. Una función que dispara la captura de forma automática cuando el texto está correctamente enfocado y la cámara permanece estable.

 

Funcionamiento

 

  1. Una vez abierta la app, enfocamos el documento con la cámara trasera del móvil a una distancia de unos 20 cm (dependiendo del tamaño de la página del documento esta distancia puede ser mayor o inferior). Se emite un tono acústico para indicar que se detectan correctamente los bordes del documento y el texto. Si hemos colocado un documento por la cara en la que no hay letras, no escucharemos el tono, lo cual es genial, ya que así no desperdiciamos nuestro tiempo escaneando folios en blanco. Cuando el tono sea más intenso, podemos pulsar el botón que realiza la captura y que se encuentra en la parte inferior central de la pantalla (en el caso de que tengamos activada la captura automática, la propia aplicación dispara la cámara).
  2. Tras realizarse el reconocimiento del texto, pasamos automáticamente a la pantalla de reproducción. Si hemos activado la auto reproducción, la app empezará a leernos automáticamente el texto. Si no, podemos realizar una doble pulsación con dos dedos en medio de la pantalla para escucharlo, o pulsar el botón “Reproducir” (si el texto se lee en un idioma distinto al español o deseamos cambiar la voz seleccionada, debemos ir al botón “Configurar voz” y seleccionar el idioma y la voz deseados). Este mismo botón de reproducción es un ajustable que nos permite avanzar/retroceder por el texto reconocido realizando flicks arriba y abajo. Para pausar la reproducción, podemos realizar una doble pulsación con dos dedos en medio de la pantalla, o presionar el botón “Pausar”.
  3. Si deseamos explorar el texto por medio de VoiceOver, debemos ir al botón “Ver texto o imagen” y pulsarlo de forma que quede en “Mostrando texto”. Luego nos desplazamos al cuadro donde se muestra el texto, y a través del rotor, podemos navegar por líneas, palabras o caracteres.
  4. Si no queremos guardar la imagen o ésta no ha sido bien reconocida, debemos pulsar el botón “Descartar”. En el caso de que deseemos guardar la imagen, debemos pulsar el botón “Mantener”.
  5. Al pulsar el botón “Mantener”, vamos a una nueva pantalla en la que aparte de la vista de la página o páginas reconocidas, aparecen varios botones interesantes:

 

  • “Limpiar”. Para borrar la página o páginas escaneadas y volver a la pantalla inicial.
  • “Guardar”. Para guardar el texto en la aplicación Voice Dream Reader, guardarlo/compartirlo como PDF o archivo de texto sin formato, o copiarlo. Si seleccionamos la opción de guardarlo como archivo PDF o texto, aparece una pantalla para ponerle un título, y tras presionar el botón “Aceptar” nos aparece la típica pantalla para guardar/compartir. Si seleccionamos la opción de copiar, esto nos copia el documento en el portapapeles para poder pegarlo directamente donde queramos.
  • “Capturar imagen”. Este botón nos permite realizar otra captura para añadir una nueva página al documento actual. Tras presionarlo, o esperar a que se dispare la captura automática, nos lleva a la pantalla de reproducción, y si pulsamos el botón de “Mantener”, volvemos a esta misma página donde en la vista previa aparecerá la página anterior y esta nueva. Esta acción la podemos realizar tantas veces como deseemos antes de guardar/compartir el documento que incluirá todas las páginas reconocidas. La diferencia entre esto o activar el modo “Modo por lotes” en la página principal, es que de esta forma podemos escuchar la reproducción de cada página antes de escanear la siguiente, mientras que en el modo por lotes podemos ir pulsando el botón de capturar la imagen repetidamente ante cada página nueva, sin necesidad de pasar por la pantalla de reproducción.

 

Cómo capturar varias páginas de forma seguida en el “Modo por lotes”

Esta función nos puede resultar útil en el caso de que deseemos reconocer varias páginas seguidas de un mismo documento extenso o de un libro, todo ello de forma rápida y que el resultado sea un solo archivo.

Tal y como hemos visto antes, esto no nos permite reproducir el texto de cada una de las páginas (para ello hay que emplear el sistema que hemos visto antes, en la opción “Capturar imagen” que aparece tras presionar “Mantener”), pero sí que podemos previsualizarlas/escucharlas con VoiceOver.

Con este modo la aplicación irá capturando de forma continua las páginas que le pongamos delante de la cámara. Esto es muy práctico y rápido sobre todo si tenemos activada la opción de captura automática, pues basta con ir sustituyendo y colocando encima de la mesa una página tras otra para que la aplicación las vaya capturando. Eso sí, al momento de cambiar una por otra, tenemos que tener la precaución de tapar el objetivo de la cámara para que no continúe capturando sin querer. Yo lo que hago, es que mientras coloco la siguiente página a escanear, me acerco el objetivo de la cámara al pecho para taparlo. Y si se trata de un libro, lo que hago es que voy tapando con un folio en blanco la página contraria a la que deseo escanear. Luego, pasó el folio a la página ya capturada y muevo el móvil a la otra hoja.

Todas las páginas que se van capturando con esta función, se pueden previsualizar de forma individual en esta misma pantalla. Cuando guardemos el resultado, se creará un único documento con todas ellas juntas.

 

Descarga Voice dream Scanner para iOS desde la AppStore.

 

Autor, Jaime Franco

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Grupo SucDePoma.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Descubre más desde SucDePoma

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver
Privacidad