MP.IF.9 Instalaciones alternativas
Objetivo
Establecer y mantener instalaciones alternativas totalmente operativas que garanticen la continuidad ininterrumpida de servicios médicos críticos, incluyendo el procesamiento de imágenes dermatológicas de Legit Health Plus, ante cualquier falla, desastre o evento disruptivo que afecte las instalaciones principales.
Marco normativo y cumplimiento
Real Decreto 311/2022 (ENS)
- Artículo 33: Instalaciones alternativas
- Anexo II, Medida MP.IF.9: Protección de las instalaciones e infraestructuras
Regulaciones de dispositivos médicos
- Reglamento (UE) 2017/745 (MDR):
- Artículo 10.9: Sistemas de gestión de calidad
- Anexo I, Cap. I: Requisitos generales de seguridad y funcionamiento
- ISO 13485:2016: Sistema de gestión de calidad para dispositivos médicos
- Cláusula 4.2.5: Control de documentos
- Cláusula 8.5.1: Control de la producción y de la prestación del servicio
- ISO 14971:2019: Gestión de riesgos para dispositivos médicos
- IEC 80001-1: Redes de TI que incorporan dispositivos médicos
Normativas de protección de datos
- RGPD/LOPD-GDD: Protección de datos personales de salud
- Ley 41/2002: Autonomía del paciente e historia clínica digital
Estándares de continuidad de negocio
- ISO 22301: Sistemas de gestión de continuidad del negocio
- NIST SP 800-34 Rev. 1: Plan de contingencia para sistemas de información
Documentos de referencia
Procedimientos internos
- GP-110 Esquema Nacional de Seguridad
- T-030-006 Incident Response Plan
- R-TF-013-002 Risk Management File
- OP.CONT Plan de continuidad de servicio
Referencias externas
- CCN-STIC 804: Medidas de implantación del ENS
- CCN-STIC 822: Guía de configuración segura para servicios en la nube
- AEMPS: Guías de buenas prácticas para software médico
Definiciones
Instalaciones alternativas
Sitios físicos geográficamente separados de las instalaciones principales, completamente equipados y configurados para mantener las operaciones críticas de Legit Health Plus durante eventos disruptivos.
RTO (Recovery Time Objective)
Tiempo máximo aceptable de interrupción del servicio médico. Para Legit Health Plus: ≤ 4 horas.
RPO (Recovery Point Objective)
Cantidad máxima de datos médicos que se pueden perder durante un incidente. Para datos de pacientes: ≤ 15 minutos.
Sitio espejo (Hot Site)
Instalación alternativa completamente operativa con replicación en tiempo real de datos y sistemas.
Arquitectura de instalaciones alternativas
Clasificación de sitios alternativos
Sitio Principal (Madrid)
- Ubicación: Calle Princesa 31, 28008 Madrid
- Función: Operaciones principales de desarrollo y procesamiento
- Capacidad: 100% de la carga operacional
- Personal: 15 empleados permanentes
Sitio Alternativo A (Barcelona) - Hot Site
- Ubicación: Avinguda Diagonal 640, 08017 Barcelona
- Distancia: >500 km del sitio principal
- Función: Respaldo inmediato con capacidad total
- RTO: ≤ 2 horas
- RPO: ≤ 15 minutos
- Personal: 8 empleados dedicados + personal remoto
- Estado: Activo 24/7 con replicación sincrónica
Sitio Alternativo B (Valencia) - Warm Site
- Ubicación: Avenida de Francia 20, 46023 Valencia
- Distancia: >350 km del sitio principal
- Función: Respaldo secundario con capacidad reducida (70%)
- RTO: ≤ 24 horas
- RPO: ≤ 1 hora
- Personal: 4 empleados + escalabilidad remota
- Estado: Semi-activo con replicación asincrónica
Sitio de Almacenamiento Remoto (Sevilla) - Cold Site
- Ubicación: Polígono Industrial Sur, 41020 Sevilla
- Función: Respaldo de datos a largo plazo y archivo
- RTO: ≤ 72 horas
- RPO: ≤ 24 horas
- Uso: Recuperación ante desastres catastróficos
Criterios geográficos y ambientales
Separación geográfica
- Distancia mínima: 300 km entre sitios principales
- Zonas sísmicas: Diferentes niveles de riesgo sísmico
- Cuencas hidrográficas: Diferentes para evitar inundaciones concurrentes
- Redes eléctricas: Distintas compañías suministradoras
Evaluación de riesgos ambientales
Tabla de evaluación de riesgos por ubicación:
| Sitio ID | Ubicación | Riesgo sísmico | Riesgo inundación | Riesgo incendio | Red eléctrica | Proveedor Internet Primario | Proveedor Internet Secundario | Última evaluación | Próxima revisión |
|---|---|---|---|---|---|---|---|---|---|
| SITIO-MAD | Madrid - Princesa 31 | Bajo | Bajo | Medio | Iberdrola | Movistar | Orange | 2024-01-15 | 2024-07-15 |
| SITIO-BCN | Barcelona - Diagonal 640 | Medio | Bajo | Medio | Endesa | Vodafone | Movistar | 2024-01-15 | 2024-07-15 |
| SITIO-VLC | Valencia - Francia 20 | Bajo | Medio | Medio | Naturgy | Orange | Vodafone | 2024-01-15 | 2024-07-15 |
Campos de la base de datos de ubicaciones:
- ID del sitio: Identificador único (clave primaria)
- Ubicación: Descripción de la ubicación física
- Riesgo sísmico: Clasificación (Bajo/Medio/Alto)
- Riesgo de inundación: Clasificación (Bajo/Medio/Alto)
- Riesgo de incendio: Clasificación (Bajo/Medio/Alto)
- Red eléctrica: Proveedor de electricidad
- Proveedores de Internet: Primario y secundario
- Fechas de evaluación: Última realizada y próxima programada
Infraestructura técnica por sitio
Hardware médico crítico
Servidores de procesamiento de imágenes
Sitio Madrid (Principal):
- Servidores AI: 4x NVIDIA DGX A100 para ML/AI dermatológico
- Almacenamiento: 500TB NVMe SSD en configuración RAID 10
- Red: 100 Gbps entre servidores, 10 Gbps WAN
- Backup: Respaldo incremental cada 15 minutos
Sitio Barcelona (Hot):
- Servidores AI: 4x NVIDIA DGX A100 (idéntica configuración)
- Almacenamiento: 500TB replicado síncronamente desde Madrid
- Red: 100 Gbps interna, enlaces redundantes 10 Gbps a Madrid
- Estado: Activo con balanceo de carga 30/70
Sitio Valencia (Warm):
- Servidores AI: 2x NVIDIA DGX A100 + escalabilidad cloud
- Almacenamiento: 200TB con replicación asincrónica
- Red: 50 Gbps interna, 5 Gbps WAN
- Activación: Automática cuando Barcelona no disponible
Equipamiento médico especializado
Sistema de inventario de equipamiento médico alternativo:
Inventario por sitio:
| Sitio | Servidores IA | Almacenamiento (TB) | Equipos de calibración | UPS (kVA) | Generador (kVA) |
|---|---|---|---|---|---|
| Madrid | 4 | 500 | Dermatoscopio Heine Delta 20, ColorChecker X-Rite | 200 | 500 |
| Barcelona | 4 | 500 | Dermatoscopio Heine Delta 20, ColorChecker X-Rite | 200 | 500 |
| Valencia | 2 | 200 | Dermatoscopio Heine Delta 20 | 100 | 250 |
Procedimiento de verificación de capacidad alternativa:
Para verificar si un sitio alternativo puede soportar la carga del sitio origen, se deben evaluar los siguientes criterios:
- Servidores suficientes: El sitio destino debe tener al menos el 70% de la capacidad de servidores IA del sitio origen
- Almacenamiento suficiente: El sitio destino debe tener al menos el 80% de la capacidad de almacenamiento del sitio origen
- Energía suficiente: El sitio destino debe tener al menos el 80% de la capacidad UPS del sitio origen
La verificación se considera exitosa cuando todos los criterios se cumplen satisfactoriamente.
Red de comunicaciones redundante
Conectividad entre sitios
-
Madrid ↔ Barcelona:
- Enlace primario: Fibra dedicada 10 Gbps (Telefónica)
- Enlace secundario: MPLS 5 Gbps (Orange)
- Enlace terciario: SD-WAN 1 Gbps (Vodafone)
-
Madrid ↔ Valencia:
- Enlace primario: Fibra dedicada 5 Gbps (Telefónica)
- Enlace secundario: MPLS 2 Gbps (Orange)
-
Barcelona ↔ Valencia:
- Enlace de respaldo: MPLS 2 Gbps (Telefónica)
Protocolos de conmutación automática
Sistema de gestión de enlaces redundantes:
Enlaces activos monitorizados:
- Madrid-Barcelona primario: Activo
- Madrid-Barcelona secundario: Activo
- Madrid-Valencia primario: Activo
- Barcelona-Valencia respaldo: Activo
Umbrales de latencia máxima:
- Madrid-Barcelona: 50 ms
- Madrid-Valencia: 40 ms
- Barcelona-Valencia: 45 ms
Procedimiento de monitorización continua:
- Monitoreo de enlaces: Verificación continua del estado de cada enlace
- Medición de latencia: Comparación con umbrales establecidos
- Medición de pérdida de paquetes: Alerta si supera el 0.1%
- Activación de respaldo: Conmutación automática al enlace de respaldo cuando se detecta degradación
Procedimiento de failover automático:
- Activación del sitio alternativo: Inicio del proceso de conmutación
- Sincronización de datos críticos: Asegurar que todos los datos estén actualizados en el sitio destino
- Redirección del tráfico de pacientes: Cambio de rutas de red hacia el sitio alternativo
- Notificación al personal médico: Informar sobre el cambio de sitio operativo
Replicación de datos médicos
Estrategia de replicación por niveles
Nivel 1: Datos críticos de pacientes (RPO ≤ 15 min)
- Contenido: Imágenes dermatológicas en procesamiento, diagnósticos activos
- Método: Replicación síncrona Madrid → Barcelona
- Verificación: Checksums MD5 cada 5 minutos
- Almacenamiento: SSD NVMe con respaldo inmediato
Nivel 2: Datos importantes (RPO ≤ 1 hora)
- Contenido: Imágenes archivadas, reportes históricos, configuraciones
- Método: Replicación asincrónica hacia todos los sitios
- Verificación: Verificación integral diaria
- Almacenamiento: SSD híbrido con compresión
Nivel 3: Datos de archivo (RPO ≤ 24 horas)
- Contenido: Logs del sistema, datos de auditoría, backups históricos
- Método: Transferencia batch nocturna
- Verificación: Verificación semanal
- Almacenamiento: HDD con deduplicación
Implementación técnica de replicación
Sistema de replicación de datos médicos:
Sitios de destino para replicación:
- Barcelona
- Valencia
- Sevilla
Tipos de replicación según criticidad:
| Tipo | RPO (minutos) | Método |
|---|---|---|
| Crítica | 15 | Síncrona |
| Importante | 60 | Asíncrona |
| Archivo | 1440 | Batch |
Procedimiento de replicación de imágenes dermatológicas:
-
Inicio del proceso de replicación
- Registro del tiempo de inicio
- Cálculo del hash SHA-256 de integridad de la imagen
-
Generación de metadatos médicos
- ID del paciente
- Fecha y hora de captura
- Hash de integridad
- Clasificación de urgencia
- Estado de procesamiento IA
-
Replicación según urgencia
- Si es crítica: Replicación síncrona inmediata a Barcelona
- Para todos los casos: Replicación asíncrona a Valencia y Sevilla
-
Verificación de integridad
- Obtención del hash de cada sitio
- Comparación con el hash de referencia de Madrid
- Identificación de inconsistencias
- Reparación automática si se detectan discrepancias
-
Registro y notificación
- Tiempo total de replicación
- Número de sitios replicados
- Hash de verificación final
- Estado de éxito de la operación
Procedimientos de activación
Matriz de decisión para activación
| Tipo de Incidente | Sitio Alternativo | Tiempo Activación | Autorización Requerida |
|---|---|---|---|
| Fallo eléctrico localizado | Barcelona (Hot) | ≤ 30 minutos | CTO + Responsable Médico |
| Incendio instalaciones | Barcelona (Hot) | ≤ 2 horas | CEO + CTO + Responsable Médico |
| Inundación mayor | Valencia (Warm) | ≤ 6 horas | CEO + Board directivo |
| Terremoto/catástrofe | Sevilla (Cold) | ≤ 72 horas | Comité de crisis completo |
| Ciberataque masivo | Aislamiento + Barcelona | ≤ 4 horas | CISO + Autoridades |
| Pandemia/cierre forzoso | Operación remota distribuida | ≤ 24 horas | CEO + Recursos Humanos |