Cómo encontrar un texto en documentos escaneados

Con la informática parecía que el papel iba a tener los días contados. Sin embargo, lejos de ser así, hay momentos en los que parece que hay más papeles que antes, hasta el punto de formar un caos que lo arrasa todo.

Vamos a tratar la gestión del papel con cierto detenimiento para, así, tomar en consideración la solución propuesta. Porque ni el papel ni su gestión, salen gratis. Incluso el papel inútil sale caro.


PAPELES INÚTILES

Hay dos tipos de papeles completamente inútiles:

Los de nacimiento
Es decir, los que nos llegan y que ni sirven ni nos servirán jamás. Por ejemplo, el mismo sobre que contiene una factura. Pero también la gran oferta de un super sofá, la promo de un viaje que detestamos, otro prospecto más del ibuprofeno, etc.

Los que se hacen inútiles con el tiempo
Por ejemplo, una factura de teléfono de hace 20 años y que, además, es de una compañía que ya no existe. O los extractos del banco del siglo pasado, el manual de la primera lavadora que tuvimos… Y así, una lista inagotable. Aunque algunos podríamos conservarlos como recuerdo.

Tanto en un caso como en otro, deshacerse del papel no sale gratis. Ni a título individual ni colectivo. Un problema añadido es que ciertos papeles no pueden deshecharse sin haberse destruido antes: son aquellos que contienen datos personales o información confidencial. ¡Deberemos comprar una destructora de papel o contratar un servicio de destrucción! Ésto, lo de destruir el papel con determinados datos, es obligatorio para las empresas y autónomos.

 


LOS PROBLEMAS DEL PAPEL ÚTIL

Una vez separado lo inútil del resto, y eliminada la desagradable sensación de desorden, el papel genera algunos inconvenientes que nos obligan a destinar ciertos recursos: tiempo y espacio.

Tiempo
Se diría que los papeles nacen (cual setas), se reproducen frenéticamente, y pueblan las mesas hasta invadirlas por completo. Gestionar el papel consume tiempo. Habrá que clasificarlo de alguna manera para que, cuando necesitemos un papelito, no suponga una cruzada encontrarlo.

Algunos expertos confiesan que el tiempo que consume todo el papel que pasa por nuestras vidas es el mismo tanto si lo ordenamos con esmero como si lo metemos en sacos de patatas reciclados. En el primer caso, pasaremos la juventud clasificándolo; en el segundo, la vejez buscándolo.

Espacio
Y claro: una sola hoja de papel apenas ocupa sitio. Pero las miles de hojas que solemos acumular pueden llenar muebles o incluso salas enteras. Necesitaremos unos cuantos archivadores y cierto mobiliario para cobijarlo. También habrá que pensar en no dejarlo en la calle: a veces ocupan tanto espacio que pueden llenar almacenes o edificios enteros, como en el caso de los bancos.

Dinero
Si calculamos que todo junto (el papel, los archivadores y los muebles) ya cuestan un buen dinero, y que ocupa un espacio desproporcionado para su utilidad, veremos que el papel no es cosa de broma. Deberemos optimizar su gestión.

El objetivo
Sin profundizar demasiado, buscaremos la manera para que el papel nos ocupe el menor espacio posible y nos quite el menor tiempo posible. Además, puestos a pedir, nos pediremos la máxima comodidad: que no nos asustemos cuando necesitemos un papel. Y ya, por supuesto, que podamos acceder a ese papel desde cualquier lugar. Y una inversión mínima, apenas perceptible, claro. Esta propuesta está pensada para hogares, autónomos y pequeñas empresas que quieran recuperar el espacio y el tiempo conquistados por tanto papel.

 


UNA SOLUCIÓN PRÁCTICA

Siempre nos ha causado una desagradable sensación dejar la mesa impoluta (sin una solitaria mota de polvo sobre ella, sin una minúscula hojita de papel, con los bolígrafos guardaditos en el cajón)… Y encontrarla con centenares de papeles rebosando los bordes a la vuelta: albaranes de los transportistas, unas cuantas facturas, una promo de la tarjeta de crédito, la convocatoria de la escuela de los nenes, un plan de jubilación que promete menos dinero que el invertido, una cupón para depilarnos las cejas a 500 kilómetros de aquí… ¡El caos reina de nuevo y amenaza con convertirnos en parte de él!

Vamos a ver como podemos minimizar las molestias que supone el bendito papel.

Acción preventiva
Por suerte, la mayoría de las empresas ofrecen a sus clientes la posibilidad de recibir las facturas por correo electrónico o, incluso, ni eso. Es el caso de los bancos; antes enviaban todos los recibos por correo ordinario (cobrándonos el sello a veces). Ahora los deja “guardados” en su web quedando a tu disposición por si lo necesitas.

Casi todas las empresas, casi todas las entidades ofrecen la posibilidad de sustituir el correo ordinario por opciones electrónicas que, al menos, no ocupan nuestro espacio. Es muy buena idea, sobre todo para los particulares, conseguir que no llegue nada por correo ordinario.

Incluso la administración nos ofrece la fantástica opción de recibir las multas de forma más rápida y cómoda: debes aprovechar todas las opciones posibles para que el papel no ocupe ni tu mesa, ni tus cajones, ni tu vida. Cuando recibas una multa electrónica, mira el lado positivo: ha cuidado el medio ambiente.

Escanear “casi” todo el papel restante
Evidentemente, hay papeles que los tienes que conservar en su formato original. No vamos a llegar al extremo de escanear el pasaporte o las escrituras del piso para destruirlo todo seguidamente. Aquello que sea necesario, que realmente es bien poco, debe guardarse tal y como es.

Y lo que no nos comprometa, pero que decidamos guardar, podemos escanearlo. Por ejemplo, el acta de la comunidad no hace falta guardarlas en papel; ni un comunicado del gimnasio, un folleto informativo, un pequeño manual, un ticket, etc.

Cómo guardar los documentos escaneados
Aquí prevalece el grado de meticulosidad de cada cual. Pero nosotros hemos optado por una forma rápida de guardar, a cambio del riesgo de perder algo de tiempo al buscar. Porque está muy claro que si nos entretenemos a clasificar por carpetas, subcarpetas, y con los nombres de archivo que eviten cualquier duda, casi es mejor y más rápido guardarlo todo en formato físico.

Así que optaremos por un escáner con alimentador de hojas de doble cara. Podemos separar los documentos de una y de dos caras. Y luego, los escanearemos tal cual, de forma automática y dejando que el escáner les asigne un nombre correlativo.

La mejor tecnología al alcance de todos
A pesar de que hay muchas soluciones OCR (que reconocen el texto dentro de un archivo PDF procedente de un escáner), siendo las que funcionan algo bien de pago, hemos optado por una opción gratuita, que ofrece gran seguridad y que casi nadie sabe: guardaremos todos los documentos en Google Drive.

¿Por qué? Pues porque es muy difícil, por no decir prácticamente imposible, que allí se pierdan. Además de guardarlos en la nube, estarán en tu ordenador, por si la nube se “evapora”.

Google Drive indexa todo tipo de archivos, detectando incluso las palabras de cualquier foto. Lo mismo hace con cualquier tipo de documento escaneado. No obstante, nada es perfecto. Pero gran parte de todo lo demás, es peor.

La contrapartida es que Google sabe de nosotros más que nosotros mismos. Pero si a ti te da igual, porque al final también se enterará, puedes servirte de su aparente generosidad (a cambio de saberlo todo de ti) para tener una vida más cómoda. Si utilizas Google Maps en el coche, los chicos de Google pueden saber dónde has ido, cuanto has tardado en llegar, las fotos que has hecho, e incluso dónde trabajas. Ellos cruzan toda tu información para vender publicidad. Si aceptamos el trato, bien. Y si no, tendremos que buscar otra opción aún más cara. Pero sigamos.


NUESTRO KIT DE DIGITALIZACIÓN

Veamos, a velocidad del rayo, los componentes necesarios para construir nuestro laboratorio de digitalización de documentos.

1.- Impresora multifunción HP 8710. Es una impresora multifunción cuyo único defecto es que puede ser demasiado voluminosa para ciertas estancias. A cambio, tiene un precio más que atractivo, la tinta sale más barata que en la mayoría de las impresoras de una gama inferior, escanea a doble cara, puede enviar una página escaneada por email y el escaneado de fotos es más que correcto.

2.- Una cuenta de Gmail. Posiblemente ya la tengas. De esta cuenta, nos centraremos en uno de los muchos componentes que nos facilitan la vida: Google Drive.

3.- El software de sincronización Google Backup&Sync. Se encarga de guardar en la nube de Google los archivos de las carpetas que seleccionemos durante la configuración de esta utilidad.

 


CONFIGURACIÓN BÁSICA

Gmail. Si ya tenemos una cuenta de Gmail, ya tenemos todo lo que de Google nos hace falta. En caso contrario, deberemos crear una cuenta en Gmail, daremos toda la información que nos pida, y el Gigante de Google ya se encargará de recopilar lo que a él le interese.

El ordenador. Configuraremos una carpeta compartida que será la encargada de guardar todos los archivos escaneados. No es demasiado difícil.

El escáner. Conviene activar la función de escanear en carpeta. Esta impresora permite programar distintas configuraciones. Por ejemplo, podemos crear una para los documentos de una sola cara y otra para los de dos caras. O una para color y otra para blanco y negro (ocupan menos espacio). No entraremos en detalles.

Google Backup&Sync. Es una pequeña utilidad a la que deberemos dar los datos de nuestra cuenta de Gmail y especificar la carpeta de nuestro ordenador donde se guardan los documentos digitalizados.

 


PROCEDIMIENTO

La idea es apilar unas cuantas hojas para que, con un solo botón del escáner, éste las envíe ya digitalizadas al ordenador. Una vez los documentos “aterrizan” en el Pc, son enviados automáticamente a la nube de Google, que los guardará y los indexará para que su búsqueda sea lo más rápida y eficaz posible. Además, la “nube” cumple las funciones de copia de seguridad. No deberíamos permitirnos el lujo de que se estropeara el disco duro del ordenador y quedarnos sin nuestros documentos.

Para buscar un documento accederemos a Google Drive y actuaremos como si buscáramos una página web. Por ejemplo, si buscamos una nómina de 2015, podríamos incluir en el buscador “líquido a percibir octubre 2015”.

Veamos un sencillo ejemplo de lo que Google es capaz de encontrar en nuestros documentos. Antes, entraremos en Drive: https://drive.google.com que nos pedirá nuestro nombre de usuario y contraseña:

CONCLUSIÓN

Esta solución, al alcance de los bolsillos más humildes, no pretende, ni mucho menos, competir con las grandes soluciones de archivo documental que ofrece el mercado. Pero sí ofrecer cierta comodidad a la hora de guardar (y poder localizar) esa enorme cantidad de papel que pasa por nuestras vidas

Hemos comprobado que, incluso para un gran banco, encontrar un papel (un cheque ingresado hace unos meses) le es engorroso. Por lo visto, lo guardan por fechas. Pero pasa que, a veces, algún papel se guarda incorrectamente: ¡ya tenemos el lío montado! Por eso, pretender la perfección es mucha pretensión.

Sobre las copias de seguridad. Si bien, como hemos comentado, los documentos escaneados están copiados en la nube, podría darse el caso de que un virus encripte los ficheros y sustituya los de la nube por los infectados, quedándonos sin nada válido. Es por eso que es obligatorio realizar copias de seguridad regularmente. Salvo estos virus, nuestros documentos ganan en seguridad si, por ejemplo, se nos estropea el disco duro.