Origen de la colección
La colección actual procede de múltiples fuentes acumuladas durante años de trabajo colaborativo. Incluye digitalizaciones realizadas por particulares, aportaciones de la comunidad, material preservado previamente y nuevas digitalizaciones efectuadas específicamente para RetroRevistas.
El objetivo de la plataforma es unificar, documentar y conservar todas estas fuentes dentro de un catálogo coherente y verificable: con metadatos de procedencia, control de calidad, verificación de integridad y políticas de publicación claras para cada material.
La diversidad de origen del material hace especialmente importante el sistema de fuentes documentales y el control de calidad de las digitalizaciones. No todo el material tiene el mismo nivel de preservación, y la plataforma permite reflejar y gestionar esa realidad.
Estado actual del sistema
RetroRevistas es actualmente un sistema de catalogación y administración. El panel de administración web es la interfaz principal del sistema: permite gestionar el catálogo completo de revistas, números, artículos, autores y videojuegos, así como las digitalizaciones, importaciones, colecciones y la configuración general.
El catálogo está operativo con un modelo de datos completo que cubre desde la gestión del contenido editorial hasta la preservación digital, pasando por la trazabilidad, las fuentes externas y el sistema de colecciones. La plataforma está diseñada para incorporar una API pública, un frontend de consulta y un protocolo de federación con otros archivos similares.
Federación
La federación es la capacidad de RetroRevistas de sincronizarse e interoperar con otros archivos similares distribuidos, formando una red de conocimiento sobre la historia de la prensa de videojuegos. En un futuro, distintos archivos podrían compartir entradas del catálogo, enriquecer mutuamente sus datos o permitir búsquedas federadas.
El sistema ya está preparado para la federación: cada entidad del catálogo tiene un identificador único global que la hace reconocible con independencia de en qué instancia del sistema esté registrada. Los identificadores históricos de cada entrada también se preservan, garantizando que los enlaces entre archivos federados sigan funcionando aunque se actualicen los nombres o títulos.
El registro de nodos federados permite documentar con qué otros archivos se mantiene relación, cuándo fue la última sincronización exitosa y cuál es el estado de cada conexión. El protocolo de comunicación entre nodos se definirá en coordinación con los archivos participantes.
OCR
El reconocimiento óptico de caracteres convierte los archivos escaneados en texto indexable, habilitando la búsqueda de texto completo dentro del contenido de las revistas. El sistema gestiona los procesos de OCR de forma modular e independiente del proveedor utilizado.
El diseño permite trabajar con distintos proveedores de OCR sin alterar el catálogo: Tesseract, Google Vision, AWS Textract u otros. Un mismo archivo puede procesarse con distintos proveedores para comparar resultados o mejorar la calidad del reconocimiento cuando aparezcan herramientas mejores.
El panel de administración incluye una vista para monitorizar el estado de los procesos OCR, ver sus resultados y relanzar el procesamiento cuando sea necesario.
API pública
La API pública es la capa de acceso programático al catálogo de RetroRevistas. La plataforma está diseñada para soportarla: el catálogo, los identificadores únicos de las entidades y las políticas de acceso por revista están concebidos desde el principio con la API como destino natural.
Qué expondrá la API
La API pública está planificada como una interfaz REST que permita consultar el catálogo con paginación, filtrado y búsqueda. Los recursos principales serán:
- Revistas y sus números
- Artículos y autores
- Videojuegos y plataformas
- Colecciones públicas
El acceso a archivos digitalizados a través de la API estará condicionado por las políticas de publicación y el control de acceso configurado para cada revista.
Identificadores estables
Los identificadores únicos globales asignados a cada entidad son los que se usarán en la API. Son estables, no secuenciales y reconocibles fuera del sistema, lo que los hace adecuados como referencias externas de larga duración. La preservación del historial de identificadores garantiza que las URLs semánticas sigan funcionando aunque se corrija el nombre o el título de una entrada.
Frontend público
El frontend público es la interfaz de consulta del archivo para los usuarios finales. Está planificado como una aplicación web que permita navegar y buscar en el catálogo sin necesidad de acceso al panel de administración.
Las funcionalidades previstas para el frontend público incluyen:
- Navegación por cabeceras de revista y sus números, con ficha de detalle completa
- Búsqueda de texto completo en el contenido de los artículos cuando el OCR esté disponible
- Fichas de autores con su bibliografía completa dentro del archivo
- Fichas de videojuegos con todos los artículos que los analizaron
- Colecciones temáticas públicas
- Valoraciones y listas personales para usuarios registrados
Visión de evolución
RetroRevistas está diseñado para crecer de forma orgánica a lo largo del tiempo. Las decisiones arquitectónicas del sistema están orientadas a facilitar esa evolución sin rupturas:
Todos los tipos y estados del catálogo son configurables desde el panel. Añadir un nuevo tipo de publicación o un nuevo estado de digitalización no requiere modificar el sistema.
Conectar con una nueva base de datos externa no requiere alterar la estructura del catálogo: basta con registrar la nueva fuente y empezar a asociar identificadores.
Cualquier renombrado o corrección en el catálogo preserva los identificadores anteriores. Los enlaces publicados siguen funcionando.
Los identificadores únicos globales y el registro de nodos federados están listos para conectar RetroRevistas con otros archivos similares cuando el protocolo esté definido.
El procesamiento OCR es independiente del proveedor. Mejorar la calidad del reconocimiento de texto usando herramientas más avanzadas no requiere alterar el catálogo.
El modelo de colecciones puede ampliarse a nuevos tipos de entidad sin afectar las colecciones ya existentes.