- El proceso de digitalización
- Archivos digitales
- Versiones de una digitalización
- La preservación es un proceso continuo
- Procedencia y calidad de los materiales
- Metadatos técnicos
- Preservación digital
- OCR — Reconocimiento de texto
- Derechos y titulares
- Políticas de publicación
- Control de acceso
- Escala de calidad RetroRevistas
- ¿Qué es un TruePDF?
- Recomendaciones de digitalización
El proceso de digitalización
La digitalización es el proceso de convertir un ejemplar físico de una revista en archivos digitales accesibles, preservados y documentados. En RetroRevistas, la digitalización va más allá del simple escaneo: cada archivo digitalizado está asociado a un número concreto del catálogo, documentado con sus metadatos técnicos y verificado periódicamente para garantizar su integridad a largo plazo.
El sistema distingue entre el número como entidad catalogada (la revista en sí, con sus artículos y metadatos) y la digitalización como el proceso y resultado técnico de convertirlo a formato digital. Un mismo número puede tener varias digitalizaciones: una primera versión de baja calidad, una segunda mejorada, una tercera con OCR incorporado.
- Se digitaliza el ejemplar físico y se sube el archivo al número correspondiente
- Se registran los metadatos técnicos del proceso de escaneo
- Se asigna un nivel de calidad según la escala RetroRevistas
- Opcionalmente, se procesa el texto mediante OCR para hacer el contenido indexable
- El sistema verifica periódicamente la integridad del archivo
- Una vez validada, la digitalización se publica siguiendo la política de la revista
Archivos digitales
Cada número puede tener asociados varios archivos digitales según su tipo:
- PDF del número completo — el documento principal
- Portada — imagen de la portada en alta resolución
- Miniatura — imagen reducida para vistas de listado
- Extras — encartes, pósters, separatas u otros materiales adicionales
- ePub o CBZ — versiones en formatos alternativos de lectura, cuando existan
Cada archivo dispone de sumas de comprobación (checksums) que permiten verificar en cualquier momento que el archivo no ha sufrido alteraciones desde que fue añadido al archivo. El sistema registra también el tamaño del archivo y dónde está almacenado.
Versiones de una digitalización
RetroRevistas permite gestionar múltiples versiones de la digitalización de un mismo número. Cada versión tiene su propio número de versión y puede hacer referencia a la versión anterior de la que deriva.
Esto es útil cuando se mejora la calidad de una digitalización existente: la versión anterior no se elimina, sino que queda registrada en el historial. El sistema indica cuál es la versión publicada actualmente y permite auditar todo el proceso de mejora.
Cuando se publica una digitalización, el sistema registra automáticamente la fecha y el responsable de la publicación. Si se aplica una excepción a la política habitual (por ejemplo, publicar antes de lo previsto), se requiere una justificación que queda documentada.
La preservación es un proceso continuo
La preservación documental no termina cuando una revista es escaneada. Un mismo número puede recibir mejoras a lo largo del tiempo:
- Nuevas digitalizaciones de mayor calidad
- OCR más preciso o generado con herramientas mejoradas
- Corrección de páginas defectuosas o faltantes
- Incorporación de metadatos adicionales
- Identificación de artículos y asociación con juegos, autores o empresas
- Mejora de la valoración de calidad
RetroRevistas considera cada publicación como un documento vivo cuyo nivel de conservación puede seguir mejorando con el paso de los años. El sistema de versiones permite registrar esta evolución sin perder el historial de mejoras anteriores.
Procedencia y calidad de los materiales
Los materiales conservados por RetroRevistas proceden de múltiples fuentes. Algunos documentos han sido digitalizados específicamente para el proyecto. Otros proceden de colecciones particulares, aportaciones de colaboradores o trabajos de preservación realizados anteriormente.
Por este motivo pueden existir diferentes versiones de una misma publicación con distintos niveles de calidad, resolución o procesamiento. Siempre que es posible se intenta conservar la mejor versión disponible y mantener un historial que permita incorporar futuras mejoras.
La diversidad de origen hace especialmente importante el sistema de fuentes documentales y el control de calidad de las digitalizaciones. La escala de calidad RetroRevistas permite reflejar y gestionar esa realidad de forma objetiva y comparable entre publicaciones.
Metadatos técnicos
Para cada archivo digitalizado se puede registrar información sobre el proceso técnico de escaneo:
- Escáner utilizado (modelo y fabricante)
- Resolución del escaneo (en DPI)
- Perfil de color empleado
- Software utilizado para la digitalización
- Persona que realizó el escaneo
- Fecha del escaneo
- Notas técnicas sobre el proceso o el estado del original
Estos metadatos son valiosos para evaluar la calidad de la digitalización, para reproducir el proceso en futuras versiones mejoradas y para cumplir con los estándares de documentación de archivos digitales a largo plazo.
Preservación digital
La preservación digital va más allá de guardar los archivos: implica garantizar que siguen siendo accesibles e íntegros con el paso del tiempo. Los archivos digitales pueden corromperse por fallos de hardware, errores de software o simplemente por el deterioro natural de los medios de almacenamiento.
RetroRevistas implementa verificación periódica de integridad de los archivos. El sistema calcula y compara regularmente las sumas de comprobación de cada archivo. Si un archivo difiere de su estado original verificado, el sistema lo detecta y lo registra, permitiendo tomar medidas correctivas antes de que el daño sea irreparable.
Cada verificación queda registrada con su resultado, el algoritmo utilizado y la fecha. Este historial de verificaciones es la evidencia documental de que el archivo ha sido mantenido activamente y no ha sufrido degradación.
OCR — Reconocimiento de texto
El reconocimiento óptico de caracteres (OCR, por sus siglas en inglés) es el proceso mediante el cual un archivo de imágenes escaneadas se convierte en texto legible por máquinas. Aplicado a las revistas digitalizadas, el OCR permite que el texto de los artículos sea indexable y buscable.
Una digitalización con OCR incorporado (nivel 9 en la escala de calidad RetroRevistas) es significativamente más útil para investigación que una digitalización de igual calidad visual pero sin OCR: permite buscar términos concretos dentro del contenido de las revistas.
El sistema gestiona los procesos OCR asociados a cada archivo, registra el resultado del reconocimiento, el proveedor utilizado y la confianza del resultado. Permite comparar resultados de distintos proveedores o re-ejecutar el proceso cuando mejoran las herramientas disponibles, sin perder el trabajo anterior.
Derechos y titulares
Antes de publicar el contenido digitalizado de una revista, es necesario determinar quién ostenta los derechos sobre ese contenido. RetroRevistas distingue entre la editorial que publicó originalmente la revista y el titular actual de los derechos, que puede ser diferente:
- Una editorial activa que sigue operando
- Una empresa que adquirió los derechos tras el cierre de la editorial original
- Un particular que heredó o adquirió los derechos
- Titular desconocido — no se ha podido determinar quién ostenta los derechos
- Dominio público — el contenido ha pasado a ser de libre acceso
Esta distinción es fundamental para aplicar correctamente las políticas de publicación y actuar de forma responsable con el contenido del archivo.
Políticas de publicación
Cada revista puede tener configurada una política que determina cuándo y cómo se hace accesible su contenido digitalizado. Las políticas permiten respetar acuerdos con titulares de derechos o establecer períodos de espera antes de la publicación:
| Política | Comportamiento |
|---|---|
| Acceso inmediato | El contenido se publica en cuanto se aprueba la digitalización, sin período de espera |
| Embargo de 30 días | El contenido permanece restringido durante 30 días desde la digitalización antes de publicarse |
| Embargo de 90 días | El contenido permanece restringido durante 90 días antes de publicarse |
| Aprobación manual | El contenido requiere aprobación explícita de un administrador; no se publica de forma automática |
Las políticas se configuran por revista pero pueden sobreescribirse para digitalizaciones concretas cuando las circunstancias lo justifiquen. Cualquier excepción queda documentada con su justificación y el responsable de la decisión.
Control de acceso
Más allá de cuándo se publica el contenido, el sistema permite configurar quién puede accederlo una vez publicado. Las opciones incluyen si el contenido es de libre acceso, si requiere que el usuario esté registrado para verlo o descargarlo, y si existen límites de descarga por usuario.
Esta configuración es independiente de la política de publicación: la primera determina el cuándo se publica, la segunda determina el quién puede acceder.
Escala de calidad RetroRevistas
RetroRevistas utiliza una escala propia de 0 a 10 para clasificar la calidad de cada digitalización. El objetivo es reflejar de forma objetiva el estado real de preservación de cada número y facilitar la identificación de materiales que podrían beneficiarse de una nueva digitalización de mayor calidad.
| Nivel | Descripción |
|---|---|
| 0 | Sin evaluar — la digitalización no ha sido revisada todavía |
| 1 | Ilegible — el contenido no puede leerse ni aprovecharse |
| 2 | Muy deficiente — legible con gran dificultad; imágenes muy degradadas |
| 3 | Deficiente — legible parcialmente; calidad insuficiente para consulta cómoda |
| 4 | Bajo — legible pero con defectos notables: inclinaciones, recortes, manchas |
| 5 | Aceptable — consulta posible; calidad mínima para el archivo |
| 6 | Bueno — calidad correcta para uso habitual |
| 7 | Muy bueno — calidad alta; texto claro e imágenes bien preservadas |
| 8 | Excelente sin OCR — digitalización de alta calidad sin texto indexable |
| 9 | Excelente con OCR — digitalización de alta calidad con texto reconocido e indexable |
| 10 | TruePDF — documento digital original sin pérdida de calidad |
La escala permite priorizar los esfuerzos de redigitalización: los números con nivel 1–4 son candidatos directos a mejora. Los niveles 8 y 9 representan el objetivo habitual para cualquier digitalización nueva. El nivel 10 (TruePDF) es el estándar máximo cuando existe el archivo digital original.
¿Qué es un TruePDF?
Un TruePDF es un documento generado directamente a partir de los archivos digitales originales con los que se maquetó la publicación, sin necesidad de escaneo ni proceso OCR posterior.
A diferencia de un PDF obtenido mediante digitalización de papel, un TruePDF conserva de forma nativa el texto, las imágenes y la maquetación original con la máxima fidelidad posible. El texto es completamente seleccionable e indexable, y la resolución de las imágenes corresponde a la del material original.
El TruePDF representa el nivel 10 de la escala de calidad RetroRevistas y constituye la mejor fuente posible para la preservación a largo plazo. Cuando existe un TruePDF de un número, tiene prioridad sobre cualquier otra versión digitalizada.
Recomendaciones de digitalización
Las siguientes recomendaciones sirven de referencia para cualquier proceso de digitalización destinado al archivo de RetroRevistas:
- Resolución para PDF final: 300 DPI como mínimo
- Resolución para copia maestra: 600 DPI sin compresión con pérdida
- OCR: recomendado siempre que sea técnicamente viable
- Fotografías con móvil: no aptas para el archivo; solo aceptables como respaldo provisional
- Corrección previa: corregir inclinaciones, recortes incorrectos y defectos visibles antes de publicar
- Copias maestras: conservar siempre el archivo sin compresión con pérdida cuando sea posible
La calidad de la digitalización afecta directamente la utilidad del archivo a largo plazo. Una digitalización deficiente puede ser suficiente para consulta ocasional, pero no para preservación ni para procesos de OCR fiables.