[1] La información digitalizada queda registrada en un dispositivo de almacenamiento de datos y puede ser usada para otras operaciones o archivada para futuras consultas sin perder calidad o claridad por el paso del tiempo.
[2] La información queda registrada por señales binarias; la calidad y contenido de las copias siempre es idéntica a la del documento original.
El comienzo de la digitalización, se dio debido a la necesidad del ser humano por almacenar y transmitir la información necesaria en distintos soportes.
En 1895 el instrumento utilizado se denominaba Telediágrafo, permitía transmitir las imágenes al formato digital por medio de métodos eléctricos.
En los años 40, con la construcción de las primeras computadoras, se empezaron a agregar números para realizar múltiples cálculos.
[3] Estos primeros aparatos mencionados al capturar los documentos que pretendían digitalizarse contenían una deficiente resolución, pero con el avance de la tecnología y el paso del tiempo han mejorado notablemente hasta la actualidad, utilizando para el proceso de digitalización sistemas mucho más innovadores y eficaces.
[4] El soporte óptico permite analizar elementos del documento como (imágenes, tablas, texto, etc.) para su posterior digitalización.
Este sistema revolucionó el mundo digital, pudiendo evitar la introducción manual de los datos a un ordenador y reconociéndolos automáticamente.
Con el paso del tiempo la técnica se ha ido perfeccionando con la evolución y mejora de su efectividad.
En el sector cultural, en la preservación del patrimonio, el OCR digitaliza principalmente documentos históricos en soporte microfilm o papel.
En este contexto la digitalización es un paso importante e indispensable para la publicación de documentos con la información necesaria para el fin mencionado.
La metodología propuesta pretende normalizar el proceso por el cual se obtienen los documentos a ser publicados dentro de una Biblioteca Virtual.
La digitalización de documentos es un proceso muy normalizado, debe hacerse bajo unas condiciones determinadas y unos requerimientos básicos para una correcta digitalización, es por eso que necesita unas características técnicas definidas, las cuales pueden depender del formato de origen del documento y la finalidad que se le vaya a dar a la copia digitalizada.
A cada píxel se le asigna un valor tonal que está representado por un código binario.
Dado que el tamaño del archivo se representa en Bytes (8 bits), dividiremos el resultado por 8.
[8] La compresión se utiliza para reducir el tamaño del fichero de imagen para su almacenamiento, su procesamiento y transmisión.
El tamaño del fichero para las imágenes digitales puede ser muy grande, lo que requiere mayores recursos informáticos para su almacenamiento, procesamiento y transmisión.
Los sistemas de compresión sin pérdidas reducen el código binario sin desechar o suprimir ninguna información.
Cada uno con sus características específicas, sus ventajas e inconvenientes,[8] algunos ejemplos son: La clave del proceso de digitalización es el compromiso entre el dispositivo de captura y el reproductor para que el resultado represente la fuente original con la mayor fidelidad posible.
Igualmente se hará constar las cuestiones relativas a las restricciones de acceso cuando sea preciso.
Otros métodos de preprocesamiento Este artículo toma como entrada una inscripción en piedra capturada por una cámara.
La cámara utilizada para capturar estas imágenes son de muy alta resolución o calidad (DSLR).
El umbral adaptativo que utiliza un filtro gaussiano depende del valor de la desviación estándar.