| Artículos | 01 FEB 2001

Aplicaciones OCR

Tags: Histórico
El primer paso hacia la gestión documental
Ramón A. Fernández.
El tratamiento digital de la información es una imperiosa necesidad que se incrementa a medida que las herramientas informáticas ganan terreno en el mundo empresarial. El proceso de trasladar la infinidad de documentos escritos al versátil soporte digital, puede convertirse en una ímproba y laboriosa tarea digna de titanes de otros tiempos, o simplemente un juego niños con la inestimable ayuda del software OCR.

Cualquier empresa de hoy en día no podría sobrevivir sin la existencia de documentos en papel, con independencia de su tamaño, forma o color. Asimismo, y sin lugar a dudas, los numerosos documentos impresos que se generan a diario están directamente relacionados con buena parte de los procesos de cualquier empresa. Es por ello que se necesita que estos estén fácilmente accesibles por todos los usuarios que vayan a necesitarlos. En este sentido, la primera medida, y solución menos efectiva, es realizar una fotocopia según el número de destinatarios, lo cual hace que existan múltiples copias de un único documento almacenadas por toda la empresa.
Además, las empresas necesitan, cada vez más, sistemas eficientes que les permitan controlar la documentación que se genera tanto interna como externamente. Por estos y por otros muchos motivos, la gestión de la información es una pieza clave dentro de cualquier negocio. Asimismo, la manera óptima de almacenarla, recuperarla y gestionarla, será uno de los aspectos más importantes a tener en cuenta dentro de los sistemas de información de la empresa.
Por otro lado, el papel, como medio tradicional de soporte de la información, va perdiendo, afortunadamente, fuerza frente a los soportes digitales, debido a que el coste asociado a la manipulación y mantenimiento del mismo es mucho más elevado. Como claro ejemplo sirva ver la diferencia de costes existente entre enviar un mensaje de correo electrónico y una carta postal, sin hablar de la eficacia y rapidez que caracteriza al primero de los sistemas. Obviando, además, la más que notable diferencia de volumen y peso que ocupan los archivos en uno y otro formato.
Dentro de este entorno, cada vez más competitivo, muchas empresas están tratando de llevar a cabo y materializar lo antes posible la idea de oficina sin papel.
Para poder poner en práctica este nuevo sistema de trabajo, la informática es la herramienta que posibilita el tratamiento digital de la información. Pero no toda la información está en condiciones de ser tratada directamente por las distintas aplicaciones de software. Gran parte de la información con la que una empresa necesita trabajar se encuentra impresa en papel, debiendo realizar un proceso previo de conversión para que pueda ser utilizada en los programas informáticos. Existen varios métodos de trasladar el texto impreso de un documento a un formato digital como, por ejemplo, mediante la laboriosa tarea de teclear uno por uno los caracteres que conforman el documento en cuestión o mediante el dictado del texto al ordenador, y su posterior interpretación por un software de reconocimiento de la voz.
De todas formas, el método más efectivo cuando el texto se presenta nítido e impreso en caracteres de imprenta es el escaneado y su posterior tratamiento con un software de OCR (Optical Caracter Recognition, reconocimiento óptico de caracteres).
Este proceso permite que los abundantes documentos que llenan los armarios y estanterías de cualquier oficina sean almacenados como archivos de texto en su correspondiente formato digital. Además del sustancial ahorro de espacio, esta metodología de trabajo incrementa la velocidad de acceso y recuperación de la información, eliminando muchos de los costes asociados a la manipulación de la misma. Igualmente, proporciona una gran ventaja competitiva frente al resto de las compañías que realicen su trabajo basándose en la metodología tradicional del uso del tangible papel.

Del papel al disquete
En los albores de la informática, los programas de reconocimiento óptico de caracteres fueron una grata sorpresa tanto en el ámbito doméstico como en las oficinas. Gracias a su funcionalidad, estas aplicaciones realizaban, con mayor o menor éxito, el casi mágico proceso de convertir, con ayuda de un escáner, los textos procedentes de documentos impresos en archivos digitales. Con la ventaja añadida de que estos ficheros digitalizados y "reconocidos" son perfectamente utilizables y manipulables por la mayoría de los procesadores de textos de aquellos primeros años.
No hace falta enumerar la larga lista de ventajas que supone el que un documento esté en un archivo digital, frente a los cuantiosos inconvenientes que acarrea tener ese mismo documento en una hoja de papel impresa. No obstante, la popularidad de estos programas no es tan abrumadora como cabría pensar en un principio, así como deseable por parte de sus fabricantes. El problema está motivado, no tanto por su utilidad intrínseca que es, sin lugar a dudas, muy elevada, sino por el hecho de que estos productos son herramientas poco prácticas para la inmensa mayoría de los usuarios domésticos. No obstante, prácticamente cualquier escáner, incluso los de gama baja, trae consigo un software de OCR, generalmente versiones limitadas, con lo que las necesidades esporádicas y básicas de esta clase de usuarios están cubiertas. Asimismo, los usuarios particulares, salvo raras excepciones, no se suelen hacer un uso exhaustivo del software OCR, ya que prácticamente no realizan ningún tipo de labor documental.
En otras palabras, en un entorno doméstico habitual, el usuario no acostumbra a realizar el tratamiento digital de abundante documentación escrita, más bien se limita a la confección de pequeños documentos o trabajos que suele solventar mediante el tradicional tecleado. Sin embargo, los más atrevidos disponen de los medios necesarios e, incluso, saben hacer un uso medianamente eficiente de los programas de reconocimiento de voz o texto.
En cambio, en el ámbito profesional y relacionado con el mundo empresarial la cosa cambia drásticamente. Primero, porque toda empresa que se precie maneja una significativa cantidad de información en formato papel. Y, en segundo lugar, porque la información en formato digital puede estar disponible en cualquier punto del planeta en cuestión de segundos mientras que un documento impreso está a merced de los variados servicios de mensajería y correspondencia de cada lugar o país.
Es en este tipo de ambientes donde el binomio escáner/software OCR empieza a desempeñar un papel decisivo en el porvenir de cualquier negocio. Sin querer entrar ni profundizar en los diversos aspectos que influyen en la adopción de los diversos sistemas de la gestión documental, como escáneres o sistemas de reconocimiento ICR y OMR, el propósito de este artículo es presentar y comparar las últimas versiones de los programas OCR que acaban de aparecer en el mercado, y que se ajustan en buena parte a las necesidades un amplio sector de consumidores, ya sean pequeñas y medianas empresas como usuarios particulares.

En busca de la perfección
El software de reconocimiento óptico de caracteres ha experimentado una curiosa evolución durante estos últimos años. Originalmente, todo lo que se pedía a esta clase de software era la mayor precisión posible en la interpretación del texto para, posteriormente, utilizar un procesador de texto con e
Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios