
Aventuras en OCR: también usted puede obtener buenos resultados |
 |
 |
 |
En otros tiempos, la idea de usar un escáner para convertir documentos impresos en texto que se pudiese manipular y convertir provocaba estremecimientos a muchos valientes. Si bien el reconocimiento óptico de caracteres (OCR) parecía una buena idea en teoría, hasta hace poco, el enorme trabajo que suponía limpiar el texto escaneado no compensaba el posible ahorro de tiempo. Parecía más fácil volver a escribir un texto que aplicarle software OCR.
|
 |
 |
 |
El tiempo y la tecnología han cambiado todo |
 |
 |
y el OCR no es una excepción. Ahora este software es una forma práctica y rápida de convertir grandes cantidades de texto impreso (así como imágenes y tablas) en un archivo informático que se puede editar a voluntad. Cuando comience a trabajar con software OCR de ese tipo integrado en el directorio de escaneado disponible con muchos escáneres HP Scanjet, dedique un tiempo a preparar los documentos originales y controle unos pocos detalles durante el proceso de OCR. De este modo sus tareas de OCR tendrán un rotundo éxito. Ahorrará tiempo y convertirá contenido a un formato con el que podrá trabajar.
|
 |
Comience con un original de calidad |
 |
 |
Cuanto mejor sea el estado del documento original, mejores serán los resultados del OCR. Aunque no todos los documentos que escanee tienen por qué estar impecables, los consejos siguientes le ayudarán a preparar sus documentos para un escaneado más satisfactorio.

- Calidad: Comience siempre con un original de alta calidad. Desgarrones, arrugas y manchas pueden confundir al software OCR y producir errores en los resultados finales. Si el original está sucio, retóquelo con líquido corrector o haga una fotocopia para mejorar el contraste.
- Sencillez: El software OCR prefiere en general grandes cantidades de texto limpio sin columnas, reglas, cuadros de texto y otros elementos de diseño.
- Parámetros: El escaneado de texto desde una página con múltiples columnas es sencillo si se trata cada columna como un componente más pequeño. Los programas de OCR suelen permitir la selección de determinadas áreas de una página de texto. Si define cada columna como un campo de texto independiente, el proceso de OCR comenzará en la primera columna, luego pasará a la segunda y así sucesivamente.
|
|
 |
Consejos para una mejor ejecución |
 |
 |
Cuando esté listo para escanear documentos, siga estas sugerencias para mejorar los resultados:

- Compruebe la configuración del escáner. Compruebe que el escáner no utiliza la configuración de oscilación o de medios tonos. Si bien esta configuración puede mejorar la calidad del escaneado fotográfico, dificulta el procesamiento de texto que realiza el software de OCR.
- Tenga en cuenta el color del papel. Si escanea texto impreso en papel de color, aumente el brillo y el contraste un 10% aproximadamente.
- Incremente la resolución. Obtendrá mejores resultados con una imagen de 200 ppp que con una imagen de 100 ppp, y todavía mejores si la imagen tiene 600 ppp. Sin embargo, antes de aumentar la resolución del escáner, recuerde que los escaneados de alta resolución ocupan mucho espacio en la unidad de disco duro. Deberá encontrar un equilibrio entre el espacio disponible y la resolución.
- Compruebe que ha seleccionado el idioma correcto. Compruebe que el software OCR está configurado para procesar el idioma adecuado. La mayoría de los programas de OCR admiten varios idiomas. Por tanto, compruebe que el idioma seleccionado es el que desea.
- Utilice el método de ensayo y error. Si va a escanear un documento extenso, pruebe a escanear la primera página y, a continuación, procesarla hasta obtener el texto final. De este modo tendrá más oportunidades para localizar y resolver posibles errores o deficiencias.
- Trabaje con el equipo correcto. Cuanto más rápidos sean el procesador y el escáner, menos tiempo tendrá que esperar. Necesitará un mínimo de 64 MB de RAM (aunque sería preferible 128 MB) para funciones básicas como diferenciar imágenes y texto, identificar caracteres y convertir el diseño de un documento a formato electrónico. Además, si necesita escanear muchas páginas al mismo tiempo, le conviene invertir en un alimentador automático de documentos (ADF).
- Lea el manual. Cuanto mejor conozca una herramienta, más correctamente la utilizará. Antes de comenzar a escanear y a ejecutar el OCR, dedique un tiempo a leer los manuales y archivos con información reciente (léame) del escáner y del software. Los treinta minutos que dedique a conocer las herramientas de OCR que tiene a su disposición le pueden servir para ahorrar horas e incrementar considerablemente su productividad.
|
|
 |
|
 |
|