RetroRevistas Documentación de referencia

El proceso de digitalización

La digitalización es el proceso de convertir un ejemplar físico de una revista en archivos digitales accesibles, preservados y documentados. En RetroRevistas, la digitalización va más allá del simple escaneo: cada archivo digitalizado está asociado a un número concreto del catálogo, documentado con sus metadatos técnicos y verificado periódicamente para garantizar su integridad a largo plazo.

El sistema distingue entre el número como entidad catalogada (la revista en sí, con sus artículos y metadatos) y la digitalización como el proceso y resultado técnico de convertirlo a formato digital. Un mismo número puede tener varias digitalizaciones: una primera versión de baja calidad, una segunda mejorada, una tercera con OCR incorporado.

Flujo general
  1. Se digitaliza el ejemplar físico y se sube el archivo al número correspondiente
  2. Se registran los metadatos técnicos del proceso de escaneo
  3. Se asigna un nivel de calidad según la escala RetroRevistas
  4. Opcionalmente, se procesa el texto mediante OCR para hacer el contenido indexable
  5. El sistema verifica periódicamente la integridad del archivo
  6. Una vez validada, la digitalización se publica siguiendo la política de la revista

Archivos digitales

Cada número puede tener asociados varios archivos digitales según su tipo:

  • PDF del número completo — el documento principal
  • Portada — imagen de la portada en alta resolución
  • Miniatura — imagen reducida para vistas de listado
  • Extras — encartes, pósters, separatas u otros materiales adicionales
  • ePub o CBZ — versiones en formatos alternativos de lectura, cuando existan

Cada archivo dispone de sumas de comprobación (checksums) que permiten verificar en cualquier momento que el archivo no ha sufrido alteraciones desde que fue añadido al archivo. El sistema registra también el tamaño del archivo y dónde está almacenado.

Versiones de una digitalización

RetroRevistas permite gestionar múltiples versiones de la digitalización de un mismo número. Cada versión tiene su propio número de versión y puede hacer referencia a la versión anterior de la que deriva.

Esto es útil cuando se mejora la calidad de una digitalización existente: la versión anterior no se elimina, sino que queda registrada en el historial. El sistema indica cuál es la versión publicada actualmente y permite auditar todo el proceso de mejora.

Cuando se publica una digitalización, el sistema registra automáticamente la fecha y el responsable de la publicación. Si se aplica una excepción a la política habitual (por ejemplo, publicar antes de lo previsto), se requiere una justificación que queda documentada.

La preservación es un proceso continuo

La preservación documental no termina cuando una revista es escaneada. Un mismo número puede recibir mejoras a lo largo del tiempo:

  • Nuevas digitalizaciones de mayor calidad
  • OCR más preciso o generado con herramientas mejoradas
  • Corrección de páginas defectuosas o faltantes
  • Incorporación de metadatos adicionales
  • Identificación de artículos y asociación con juegos, autores o empresas
  • Mejora de la valoración de calidad

RetroRevistas considera cada publicación como un documento vivo cuyo nivel de conservación puede seguir mejorando con el paso de los años. El sistema de versiones permite registrar esta evolución sin perder el historial de mejoras anteriores.

Procedencia y calidad de los materiales

Los materiales conservados por RetroRevistas proceden de múltiples fuentes. Algunos documentos han sido digitalizados específicamente para el proyecto. Otros proceden de colecciones particulares, aportaciones de colaboradores o trabajos de preservación realizados anteriormente.

Por este motivo pueden existir diferentes versiones de una misma publicación con distintos niveles de calidad, resolución o procesamiento. Siempre que es posible se intenta conservar la mejor versión disponible y mantener un historial que permita incorporar futuras mejoras.

La diversidad de origen hace especialmente importante el sistema de fuentes documentales y el control de calidad de las digitalizaciones. La escala de calidad RetroRevistas permite reflejar y gestionar esa realidad de forma objetiva y comparable entre publicaciones.

Metadatos técnicos

Para cada archivo digitalizado se puede registrar información sobre el proceso técnico de escaneo:

  • Escáner utilizado (modelo y fabricante)
  • Resolución del escaneo (en DPI)
  • Perfil de color empleado
  • Software utilizado para la digitalización
  • Persona que realizó el escaneo
  • Fecha del escaneo
  • Notas técnicas sobre el proceso o el estado del original

Estos metadatos son valiosos para evaluar la calidad de la digitalización, para reproducir el proceso en futuras versiones mejoradas y para cumplir con los estándares de documentación de archivos digitales a largo plazo.

Preservación digital

La preservación digital va más allá de guardar los archivos: implica garantizar que siguen siendo accesibles e íntegros con el paso del tiempo. Los archivos digitales pueden corromperse por fallos de hardware, errores de software o simplemente por el deterioro natural de los medios de almacenamiento.

RetroRevistas implementa verificación periódica de integridad de los archivos. El sistema calcula y compara regularmente las sumas de comprobación de cada archivo. Si un archivo difiere de su estado original verificado, el sistema lo detecta y lo registra, permitiendo tomar medidas correctivas antes de que el daño sea irreparable.

Cada verificación queda registrada con su resultado, el algoritmo utilizado y la fecha. Este historial de verificaciones es la evidencia documental de que el archivo ha sido mantenido activamente y no ha sufrido degradación.

OCR — Reconocimiento de texto

El reconocimiento óptico de caracteres (OCR, por sus siglas en inglés) es el proceso mediante el cual un archivo de imágenes escaneadas se convierte en texto legible por máquinas. Aplicado a las revistas digitalizadas, el OCR permite que el texto de los artículos sea indexable y buscable.

Una digitalización con OCR incorporado (nivel 9 en la escala de calidad RetroRevistas) es significativamente más útil para investigación que una digitalización de igual calidad visual pero sin OCR: permite buscar términos concretos dentro del contenido de las revistas.

El sistema gestiona los procesos OCR asociados a cada archivo, registra el resultado del reconocimiento, el proveedor utilizado y la confianza del resultado. Permite comparar resultados de distintos proveedores o re-ejecutar el proceso cuando mejoran las herramientas disponibles, sin perder el trabajo anterior.

Derechos y titulares

Antes de publicar el contenido digitalizado de una revista, es necesario determinar quién ostenta los derechos sobre ese contenido. RetroRevistas distingue entre la editorial que publicó originalmente la revista y el titular actual de los derechos, que puede ser diferente:

  • Una editorial activa que sigue operando
  • Una empresa que adquirió los derechos tras el cierre de la editorial original
  • Un particular que heredó o adquirió los derechos
  • Titular desconocido — no se ha podido determinar quién ostenta los derechos
  • Dominio público — el contenido ha pasado a ser de libre acceso

Esta distinción es fundamental para aplicar correctamente las políticas de publicación y actuar de forma responsable con el contenido del archivo.

Políticas de publicación

Cada revista puede tener configurada una política que determina cuándo y cómo se hace accesible su contenido digitalizado. Las políticas permiten respetar acuerdos con titulares de derechos o establecer períodos de espera antes de la publicación:

PolíticaComportamiento
Acceso inmediato El contenido se publica en cuanto se aprueba la digitalización, sin período de espera
Embargo de 30 días El contenido permanece restringido durante 30 días desde la digitalización antes de publicarse
Embargo de 90 días El contenido permanece restringido durante 90 días antes de publicarse
Aprobación manual El contenido requiere aprobación explícita de un administrador; no se publica de forma automática

Las políticas se configuran por revista pero pueden sobreescribirse para digitalizaciones concretas cuando las circunstancias lo justifiquen. Cualquier excepción queda documentada con su justificación y el responsable de la decisión.

Control de acceso

Más allá de cuándo se publica el contenido, el sistema permite configurar quién puede accederlo una vez publicado. Las opciones incluyen si el contenido es de libre acceso, si requiere que el usuario esté registrado para verlo o descargarlo, y si existen límites de descarga por usuario.

Esta configuración es independiente de la política de publicación: la primera determina el cuándo se publica, la segunda determina el quién puede acceder.

Escala de calidad RetroRevistas

RetroRevistas utiliza una escala propia de 0 a 10 para clasificar la calidad de cada digitalización. El objetivo es reflejar de forma objetiva el estado real de preservación de cada número y facilitar la identificación de materiales que podrían beneficiarse de una nueva digitalización de mayor calidad.

NivelDescripción
0Sin evaluar — la digitalización no ha sido revisada todavía
1Ilegible — el contenido no puede leerse ni aprovecharse
2Muy deficiente — legible con gran dificultad; imágenes muy degradadas
3Deficiente — legible parcialmente; calidad insuficiente para consulta cómoda
4Bajo — legible pero con defectos notables: inclinaciones, recortes, manchas
5Aceptable — consulta posible; calidad mínima para el archivo
6Bueno — calidad correcta para uso habitual
7Muy bueno — calidad alta; texto claro e imágenes bien preservadas
8Excelente sin OCR — digitalización de alta calidad sin texto indexable
9Excelente con OCR — digitalización de alta calidad con texto reconocido e indexable
10TruePDF — documento digital original sin pérdida de calidad

La escala permite priorizar los esfuerzos de redigitalización: los números con nivel 1–4 son candidatos directos a mejora. Los niveles 8 y 9 representan el objetivo habitual para cualquier digitalización nueva. El nivel 10 (TruePDF) es el estándar máximo cuando existe el archivo digital original.

¿Qué es un TruePDF?

Un TruePDF es un documento generado directamente a partir de los archivos digitales originales con los que se maquetó la publicación, sin necesidad de escaneo ni proceso OCR posterior.

A diferencia de un PDF obtenido mediante digitalización de papel, un TruePDF conserva de forma nativa el texto, las imágenes y la maquetación original con la máxima fidelidad posible. El texto es completamente seleccionable e indexable, y la resolución de las imágenes corresponde a la del material original.

El TruePDF representa el nivel 10 de la escala de calidad RetroRevistas y constituye la mejor fuente posible para la preservación a largo plazo. Cuando existe un TruePDF de un número, tiene prioridad sobre cualquier otra versión digitalizada.

Recomendaciones de digitalización

Las siguientes recomendaciones sirven de referencia para cualquier proceso de digitalización destinado al archivo de RetroRevistas:

  • Resolución para PDF final: 300 DPI como mínimo
  • Resolución para copia maestra: 600 DPI sin compresión con pérdida
  • OCR: recomendado siempre que sea técnicamente viable
  • Fotografías con móvil: no aptas para el archivo; solo aceptables como respaldo provisional
  • Corrección previa: corregir inclinaciones, recortes incorrectos y defectos visibles antes de publicar
  • Copias maestras: conservar siempre el archivo sin compresión con pérdida cuando sea posible

La calidad de la digitalización afecta directamente la utilidad del archivo a largo plazo. Una digitalización deficiente puede ser suficiente para consulta ocasional, pero no para preservación ni para procesos de OCR fiables.