Categorías
Artículos

Office Lens, potente OCR gratuito de Microsoft

Una de las aplicaciones más útiles que podemos llegar a tener en nuestros smartphones, sin duda, es la de un buen OCR que nos permita en cualquier momento poder reconocer todo tipo de documento impreso. Cartas, recibos, menús de restaurantes, tickets, carteles… Todo ello puede ser accesible gracias a Office Lens, una aplicación de Microsoft que transforma a nuestro smartphone en un eficaz escáner de bolsillo.

 

Descripción de la aplicación

Nota elaborada en febrero de 2020: Esta app era mucho más usable en sus versiones iniciales. Actualmente, aunque continúa siendo un OCR bastante eficaz, no proporciona guiado verbal en tiempo real a la hora de enfocar los documentos. Además, el Lector Inmersivo no es tan funcional como antes. Es más recomendable emplear la aplicación Seeing AI, también desarrollada por Microsoft y mucho más indicada para nuestro colectivo de personas ciegas y con baja visión. Esta entrada ha sido actualizada teniendo en cuenta esos cambios.

 

Office Lens es un eficaz y gratuito OCR (reconocedor óptico de caracteres) que ha sido creado por Microsoft. Presenta muchas funciones interesantes como el modo “Lector inmersivo” (que lee en voz alta el texto reconocido) y diversas opciones para exportar los documentos escaneados a OneNote, pdf, One Drive, o convertirlos en documentos editables de PowerPoint y Word, así como la posibilidad de compartirlos por correo o WhatsApp.

Cabe destacar que es preciso disponer de una cuenta de Microsoft para usar sus principales funciones como el “Lector inmersivo”. En caso de no tenerla vale la pena crearse una para usar esta aplicación.

 

Breve descripción de su interfaz

Antes de explicar cómo se realiza la captura de un documento, paso a describir algunos de los botones que nos encontramos en su pantalla inicial:

  • “Flash”. Para activar/desactivar o poner en automático el flash de la cámara.
  • “Más opciones”. Aquí podemos acceder a los archivos recientemente escaneados o a la configuración de nuestra cuenta de Microsoft.
  • “Galería”. Para desplegar y visualizar de forma rápida las fotografías que tenemos en la fototeca de nuestro móvil (esto se puede contraer para que no esté aquí en medio).
  • “Elegir una foto de la biblioteca”.  Nos permite ir a la fototeca (galería nativa) para seleccionar e importar imágenes para reconocer el texto que haya en ellas. Aquí también se accede nuevamente a la galería de Office Lens.
  • “Botón capturar”. Aquí es donde tenemos que presionar para realizar la captura de un documento.
  • “Modo de cámara”. Un selector que nos permite seleccionar por medio de flicks hacia arriba o abajo el tipo de documento que vamos a reconocer. Lo usual es tenerlo en “Documento”, a no ser que vayamos a capturar una pizarra una tarjeta de presentación.

 

Funcionamiento

1º. Para escanear un documento, lo primero que tenemos que hacer es buscar el botón “Capturar” que se encuentra en la parte inferior de la pantalla, justo encima del selector ajustable “Modo de cámara”, y dejar el foco de VoiceOver ahí. En anteriores versiones de esta aplicación, cuando nos ubicábamos encima de este botón, el programa, o mejor dicho, VoiceOver, nos guiaba verbalmente para enfocar el texto, pero lamentablemente, ya no es así.

2º. Colocamos el documento a escanear encima de la mesa, aunque también podemos sacar una foto a un texto que esté colgado en una pared o un tablero (es importante que alrededor del documento no hayan otros textos u objetos cercanos para que el programa reconozca bien los bordes del documento). Seguidamente, ponemos el móvil paralelo a la superficie del texto, a una distancia de unos 30 centímetros con la cámara enfocándolo, y cuando creamos que lo tenemos bien enfocado, realizamos una doble pulsación en cualquier parte de la pantalla para presionar el botón de captura, que es donde previamente hemos colocado el foco de VoiceOver (se escucha el sonido que emite la cámara cuando toma una foto). Eso sí, procurad realizar la doble pulsación suavemente, intentando que el móvil no se mueva al realizar ese gesto, sino, la captura saldrá movida.

3º. Una vez realizada la foto, se abre una nueva pantalla en la que entre otros botones, está el botón “Listo” (que es para enviar o exportar la imagen a donde queramos), el botón “Agregar una imagen” (por si queremos tomar más fotografías, por ejemplo en el caso de que queramos reconocer un documento de varias hojas de un tirón. Algo que yo no recomiendo, porque si nos equivocamos al escanear alguna de las hojas, luego no sabremos cuál de todas las que hemos escaneado es la errónea), y el botón “Cancelar” (para descartar la imagen tomada).

4º. Para continuar con el proceso debemos darle al botón “Listo”, y entonces nos aparece una nueva pantalla en la que aparte de encontrarnos un cuadro de edición para etiquetar el documento, observamos una lista de opciones, entre las cuales, si deseamos leer la imagen como si fuese un documento, debemos presionar en “Lector inmersivo” (la primera vez que usamos el programa, tras presionar esa opción, debemos introducir una cuenta de Microsoft, que si no tenemos, podemos crear desde aquí, eso sí, con el consiguiente inconveniente de tener que rellenar un CAPTCHA, que aunque se puede reproducir, siempre es algo lioso, sobre todo si se hace desde el móvil, por lo que recomiendo crear antes la cuenta desde un ordenador).

5º. El reconocimiento se hace on Line y al finalizar nos aparece una nueva pantalla con el texto reconocido por el que podemos avanzar o retroceder realizando flicks con tres dedos de abajo hacia arriba o viceversa, un botón de reproducción/pausa, un botón para configurar la voz (la cual es la propia de Microsoft y que se reproduce también on Line), y un botón “Menú” en el que se puede cambiar la letra y el color de la pantalla. La primera vez que empleemos la aplicación, deberemos seleccionar la voz y su velocidad.

Se puede pausar o reanudar la reproducción del texto realizando dos Toques con dos dedos, pero no se puede retroceder en la reproducción, por lo que si necesitamos hacer esto, es mejor explorar el documento reconocido por medio de VoiceOver.

Si la imagen no se ha escaneado correctamente, nos sale un mensaje en el que se nos pide que volvamos atrás para repetir la fotografía. En ese caso, debemos retroceder presionando el botón de “Atrás” que aparece en ese mensaje, y luego volver a presionar el botón “Atrás” que hay arriba a la izquierda para ir a la pantalla anterior. Una vez en esa pantalla, eliminamos la imagen tomada presionando el botón “Descartar”. Al eliminarla, volveremos a estar en la primera pantalla para repetir la captura.

6º. Una vez hemos leído el texto, para cerrar adecuadamente el documento, sin que se queden almacenadas imágenes que luego nos dificultarán sucesivos reconocimientos, debemos presionar el botón “Atrás” de esta pantalla para volver al anterior paso, donde deberemos presionar nuevamente “Atrás”, y finalmente, en la nueva pantalla, el botón “Descartar”. En anteriores versiones, en esta pantalla del Lector Inmersivo se podía pulsar un botón “Cerrar” para volver a la página principal, pero ahora, aunque hay un botón “Salí”, éste no realiza ninguna acción (pudiera ser que en futuras versiones solucionen este problema).

7º. En el caso que deseemos guardar la imagen tomada, estando ubicados en el Lector Inmersivo, debemos pulsar el botón “Atrás” para ir a la pantalla anterior. Una vez ahí, se nos presentan varias opciones, y dependiendo de si queremos guardar lo escaneado como imagen o como texto, debemos elegir una u otra. Si guardamos la imagen en Word, PDF, OneDrive u OneNote, la imagen se guarda como texto reconocido. En cambio, en el resto de opciones, como enviarla por correo o compartirla, se hará como una imagen, es decir, como una fotografía.

 

Descarga Office Lens desde la App store.

 

Deja un comentario