Skip to main content
QMSQMS
QMS
  • Welcome to your QMS
  • Quality Manual
  • Procedures
    • GP-001 Control of documents
    • GP-002 Quality planning
    • GP-003 Audits
    • GP-004 Vigilance system
    • GP-005 Human Resources and Training
    • GP-006 Non-conformity, Corrective and Preventive actions
    • GP-007 Post-market surveillance
    • GP-008 Product requirements
    • GP-009 Sales
    • GP-010 Purchases and suppliers evaluation
    • GP-011 Provision of service
    • GP-012 Design, redesign and development
    • GP-013 Risk management
    • GP-014 Feedback and complaints
    • GP-015 Clinical evaluation
    • GP-016 Traceability and identification
    • GP-017 Technical assistance service
    • GP-018 Infrastructure and facilities
    • GP-019 Software validation plan
    • GP-020 QMS Data analysis
    • GP-021 Communications
    • GP-022 Document translation
    • GP-023 Change control management
    • GP-024 Predetermined Change Control Plan
    • GP-025 Usability and Human Factors Engineering
    • GP-027 Corporate Governance
    • GP-028 AI Development
    • GP-029 Software Delivery and Commissioning
    • GP-030 Cyber Security Management
    • GP-050 Data Protection
    • GP-051 Security violations
    • GP-052 Data Privacy Impact Assessment (DPIA)
    • GP-100 Business Continuity (BCP) and Disaster Recovery plans (DRP)
    • GP-101 Information security
    • GP-200 Remote Data Acquisition in Clinical Investigations
    • GP-026 Market-specific product requirements
    • GP-110 Esquema Nacional de Seguridad
      • ORG Marco organizativo
      • OP Marco operacional
        • OP.PL Planificación
          • OP.PL.1 Análisis de Riesgos
          • OP.PL.2 Arquitectura de Seguridad
          • OP.PL.3 Adquisición de nuevos componentes
          • OP.PL.4 Dimensionamiento y Gestión de Capacidades
          • OP.PL.5 Componentes Certificados
        • OP.ACC Control de acceso
        • OP.EXP Explotación
        • OP.EXT Servicios externos
        • OP.NUB Servicios en la nube
        • OP.CONT Continuidad del servicio
        • OP.MON Monitorización del sistema
      • MP Medidas de protección
      • Sin asignar
      • Real Decreto 311/2022, de 3 de mayo, por el que se regula el Esquema Nacional de Seguridad.
  • Records
  • Legit.Health Plus Version 1.1.0.0
  • Legit.Health Plus Version 1.1.0.1
  • Licenses and accreditations
  • Applicable Standards and Regulations
  • Grants
  • Pricing
  • Public tenders
  • Procedures
  • GP-110 Esquema Nacional de Seguridad
  • OP Marco operacional
  • OP.PL Planificación
  • OP.PL.4 Dimensionamiento y Gestión de Capacidades

OP.PL.4 Dimensionamiento y Gestión de Capacidades

Documentos de referencia​

  • ISO/IEC 27000
    • 27002:2013
      • 12.1.3 - Gestión de capacidades
  • NIST SP 800-53 rev.4
    • [SA-2] Allocation of Resources
    • [AU-4] Audit Storage Capacity

Definiciones​

  • EAL. Evaluation Assurance Level. Niveles de confianza en la evaluación.
  • TOE. Target of Evaluation. Objetivo de evaluación.

Guía de implantación​

  1. Conviene destacar que esta medida de seguridad no es meramente técnica, sino que tiene implicaciones presupuestarias y por ello debe gestionarse con tiempo para que las necesidades queden debidamente recogidas en los presupuestos. Si en todas las medidas de seguridad hay que huir de la improvisación, en esta con mayor razón.

  2. Nótese que en entornos flexibles como es el empleo de recursos en la nube, el dimensionado efectivo del sistema puede ser dinámico, adecuándose a las necesidades del servicio.

Implementación en Legit Health Plus​

Marco de Dimensionamiento y Gestión de Capacidades​

Estrategia de Capacity Management​

Legit Health Plus implementa un enfoque proactivo de gestión de capacidades que abarca:

  • Planificación de capacidad basada en proyecciones de crecimiento
  • Monitorización continua de recursos y rendimiento
  • Escalado automático en infraestructura cloud
  • Optimización de costes mediante rightsizing
  • Gestión de picos de demanda estacionales o excepcionales
  • Planificación presupuestaria a medio y largo plazo

Modelo de Capacidad Multinivel​

La gestión de capacidades se estructura en múltiples niveles:

Jerarquía del Modelo de Capacidad:

Nivel 1: Business Capacity

  • Métricas: Usuarios, Transacciones comerciales
  • ↓

Nivel 2: Service Capacity

  • Métricas: API Calls, Imágenes Procesadas
  • ↓

Nivel 3: Application Capacity

  • Métricas: Instancias de Aplicación, Modelos ML
  • ↓

Nivel 4: Infrastructure Capacity

  • Métricas: Compute, Storage, Network
  • ↓

Nivel 5: Resource Capacity

  • Métricas: CPU, Memory, Disk

Dimensionamiento por Componentes​

Infraestructura de Aplicación​

Servicios Core - Dimensionamiento Actual:

ComponenteConfiguración ActualCapacidad MáximaUtilización Target
API Gateway4x ECS Tasks (2 vCPU, 4GB)1000 req/sec70% CPU
ML Inference2x GPU instances (g4dn.xlarge)100 concurrent80% GPU
Image ProcessingAuto-scaling 2-10 tasks500 images/min75% CPU
Auth Service2x ECS Tasks (1 vCPU, 2GB)200 auth/sec60% CPU
Background Jobs3x ECS Tasks (1 vCPU, 2GB)1000 jobs/hour70% CPU

Infraestructura de Datos​

Almacenamiento - Capacidad Planificada:

SistemaConfiguraciónCapacidad ActualProyección 12MCrecimiento Anual
DocumentDB3-node cluster (r6g.large)1TB5TB400%
S3 StorageStandard + IA tiers50TB200TB300%
Redis Cache2x r6g.large cluster32GB128GB300%
CloudWatch Logs30-day retention500GB/month2TB/month300%
Backup StorageS3 Glacier Deep Archive100TB500TB400%

Red y Conectividad​

Ancho de Banda Planificado:

Planificación de Capacidad de Red:

ComponenteCapacidad ActualCapacidad ProyectadaNotas
Internet Gateway10 Gbps50 GbpsBottleneck: Ráfagas de carga de imágenes
Tráfico Inter-AZ5 Gbps20 GbpsReplicación BD, failover cross-AZ
Conexiones VPN2x 1 Gbps4x 10 GbpsIntegraciones con proveedores sanitarios
CDN (CloudFront)IlimitadoIlimitadoOptimización: Estrategia caching regional

Modelos de Demanda y Proyecciones​

Patrones de Uso Identificados​

Análisis de Demanda Histórica:

MétricaQ1 2024Q2 2024Q3 2024Q4 2024Proyección Q1 2025
Usuarios Activos5,0008,00012,00018,00027,000
Imágenes/Día10,00016,00024,00036,00054,000
API Calls/Día100K160K240K360K540K
Storage (TB)1525385585
Concurrent Users2003204807201,080

Factores de Crecimiento​

Drivers de Demanda:

  • Expansión geográfica: +200% usuarios por nueva región
  • Nuevas especialidades médicas: +50% por especialidad
  • Integraciones con HIS/EHR: +300% API calls por integración
  • Mejoras en algoritmos: +25% precisión → +40% retención
  • Programas de screening: Picos estacionales +500%

Modelado Predictivo​

Modelos de Forecasting:

Modelo de Predicción de Capacidad:

Parámetros Base:

  • Crecimiento mensual base: 15%

Factores Estacionales:

TrimestreFactorDescripción
Q11.2Temporada alta screening
Q20.9Temporada baja
Q31.0Normal
Q41.1Temporada conferencias

Multiplicadores de Expansión:

EventoMultiplicador
Nueva región2.0x
Nueva especialidad1.5x
Cliente enterprise3.0x

Intervalos de Confianza:

PercentilCálculo
p50Proyección base
p80Proyección base × 1.4
p95Proyección base × 1.8

Auto-scaling y Elasticidad​

Políticas de Auto-scaling​

ECS Auto-scaling Configuration:

Configuración de Auto-scaling para Servicios API:

Target Tracking (Escalado Basado en Objetivos):

  • CPU: Mantener 70% utilización
  • Memoria: Mantener 75% utilización

Step Scaling (Escalado por Pasos):

Scale Out (Aumentar Capacidad):

CondiciónAcción
RequestCount > 500/min+2 tasks
RequestCount > 1000/min+4 tasks

Scale In (Reducir Capacidad):

CondiciónAcción
RequestCount < 200/min-1 task (mínimo 2)

Configuración de Auto-scaling para ML Inference:

Scheduled Scaling (Escalado Programado):

HorarioCapacidad MínimaCapacidad Máxima
Horas laborales4 instancias20 instancias
Fuera de horario2 instancias10 instancias

Predictive Scaling (Escalado Predictivo):

  • Estado: Activado
  • Período de predicción: 7 días
  • Buffer de capacidad: 20%

Database Auto-scaling​

DocumentDB Scaling Strategy:

MétricaThresholdAcción
CPU > 80%5 min sustainedAdd read replica
Connections > 90%2 min sustainedScale up instance class
Storage > 85%Alert onlyManual review required
Network I/O > 80%10 min sustainedConsider sharding

Storage Tiering Automático​

S3 Lifecycle Policies:

Políticas de Lifecycle para S3:

Imágenes Médicas:

TransiciónTiempo
Standard → IA30 días
IA → Glacier90 días
Glacier → Deep Archive365 días
ExpiraciónNunca (retención regulatoria)

Logs de Aplicación:

TransiciónTiempo
Standard → IA7 días
IA → Glacier30 días
Expiración2555 días (7 años regulatorio)

Datos de Backup:

ConfiguraciónValor
Almacenamiento inicialGlacier Deep Archive (inmediato)
Expiración2920 días (8 años)

Monitorización y Alerting​

Métricas de Capacidad Críticas​

Dashboard Principal - KPIs de Capacidad:

MétricaSLAWarningCriticalFrecuencia
API Response Time< 500ms p95> 400ms> 800ms1 min
Image Processing Time< 30s p95> 25s> 45s1 min
Database CPU< 70% avg> 60%> 85%5 min
Storage Usage< 80%> 70%> 90%15 min
Concurrent UsersN/A> 80% capacity> 95% capacity1 min
Error Rate< 0.1%> 0.05%> 0.2%1 min

Alerting Automático​

Alert Routing Matrix:

Matriz de Enrutamiento de Alertas:

Alertas de Capacidad - Nivel Warning:

  • Destinatarios: DevOps, SRE Team
  • Tiempo de escalado: 30 minutos
  • Canales: Slack, Email

Alertas de Capacidad - Nivel Critical:

  • Destinatarios: On-call, CTO, DevOps
  • Tiempo de escalado: 5 minutos
  • Canales: PagerDuty, Teléfono, Slack
  • Acciones automáticas: Trigger escalado, Crear incidente

Alertas de Presupuesto:

  • Destinatarios: FinOps, CTO
  • Umbrales: 50%, 80%, 95%, 100% del presupuesto
  • Frecuencia: Diaria

Observabilidad Avanzada​

Stack de Monitorización:

HerramientaFunciónMétricas Clave
CloudWatchAWS metrics, logsInfrastructure, application metrics
DataDogAPM, syntheticsEnd-to-end latency, user experience
GrafanaDashboardsBusiness metrics, capacity trends
PrometheusCustom metricsApplication-specific KPIs
ELK StackLog analysisError patterns, usage analytics

Optimización de Costes​

FinOps - Gestión Financiera de Cloud​

Estructura de Costes Actual (Mensual):

CategoríaCoste% TotalOptimización Identificada
Compute (ECS/EC2)$15,00035%Reserved Instances: -25%
Storage (S3/EBS)$8,00018%Lifecycle policies: -30%
Database$12,00028%Rightsizing: -20%
Network/CDN$5,00012%Caching optimization: -15%
Monitoring/Logs$3,0007%Retention policies: -25%
Total$43,000100%Potential savings: -23%

Strategies de Optimización​

Cost Optimization Roadmap:

Hoja de Ruta de Optimización de Costes:

Q1 2025:

IniciativaAhorro Mensual
Estrategia Reserved Instances$3,750
Políticas lifecycle S3$2,400
Subtotal Q1$6,150/mes

Q2 2025:

IniciativaAhorro Mensual
Rightsizing de bases de datos$2,400
Optimización retención logs$750
Subtotal Q2$3,150/mes

Q3 2025:

IniciativaAhorro Mensual
Spot instances para batch jobs$1,500
Optimización CDN$750
Subtotal Q3$2,250/mes

Resumen Anual:

  • Ahorro anual total: $139,800
  • ROI de la optimización: 340%

Capacity Planning - Presupuestos​

Proyecciones Presupuestarias​

Budget Planning FY2025:

TrimestreUsuarios ProyectadosCoste InfraestructuraCrecimiento
Q130,000$52,000/mes+21%
Q240,000$68,000/mes+31%
Q355,000$89,000/mes+31%
Q475,000$118,000/mes+33%
Total FY-$1,308,000/año+180%

Contingency Planning​

Escenarios de Capacidad:

EscenarioProbabilidadImpacto CosteContingencia
Crecimiento Base60%Budget baselinePlanned scaling
Crecimiento Acelerado25%+40% budgetEmergency scaling fund
Pandemia/Screening masivo10%+200% capacitySpot instances + CDN boost
Recession/Slow growth5%-30% demandScale-down automation

Gestión de Recursos Especializados​

GPU Computing para ML​

Configuración GPU Clusters:

Configuración de Clusters GPU para ML:

Cluster de Entrenamiento:

  • Instancias: 4x p3.8xlarge (GPU V100)
  • Patrón de uso: Trabajos de entrenamiento por lotes (batch)
  • Optimización de costes: Spot instances (ahorro 70%)

Cluster de Inferencia:

  • Instancias: 6x g4dn.xlarge (GPU T4)
  • Patrón de uso: Inferencia en tiempo real
  • Escalado: Auto-scale 2-20 instancias

Entorno de Desarrollo:

  • Instancias: 2x g4dn.large
  • Patrón de uso: Desarrollo de modelos
  • Programación: Pool de recursos compartidos

Specialized Storage Requirements​

Medical Imaging Storage:

TipoRendimientoCapacidadCoste/TB/mesUse Case
EFS (General)100 MB/s1TB$300Shared model artifacts
S3 StandardN/A50TB$23Active image processing
S3 IAN/A150TB$12.50Recent images (30-90 days)
S3 GlacierMinutes500TB$4Archive (90+ days)
S3 Deep ArchiveHours2PB$1Long-term regulatory

Business Continuity y Disaster Recovery​

RTO/RPO Requirements​

Recovery Objectives por Servicio:

ServicioRTORPODR Strategy
API Core15 min1 minMulti-AZ + auto-failover
ML Inference30 min5 minMulti-region model deployment
Database1 hour15 minCross-region read replica
File Storage4 hours1 hourCross-region replication
Monitoring5 minReal-timeMulti-region deployment

Capacity for DR​

DR Infrastructure Sizing:

Dimensionamiento de Infraestructura DR:

Configuración de Regiones:

  • Región primaria: eu-west-1 (100% capacidad)
  • Región DR: eu-central-1 (warm standby)

Asignación de Capacidad DR:

ComponenteCapacidad DR
Compute50% de primaria (escalado bajo demanda)
Storage100% (replicación continua)
Network100% (conexiones redundantes)

Escenarios de Failover:

EscenarioRTO
Mantenimiento planificadoZero downtime
Fallo de Availability Zone< 15 minutos
Fallo de región< 4 horas

Impacto en Costes:

  • Incremento de coste de infraestructura: +35%

Compliance y Auditoría​

Capacity Management Audit Trail​

Auditoría de Decisiones de Capacidad:

Requisitos de Auditoría de Gestión de Capacidad:

Cambios de Capacidad:

  • Aprobación requerida: Cambios > 25% de capacidad
  • Documentación: Justificación de negocio + evaluación técnica
  • Retención: 7 años

Variaciones Presupuestarias:

  • Umbral de notificación: ±15% del presupuesto mensual
  • Escalado: Notificación a CFO + CTO
  • Ciclo de revisión: Mensual

SLAs de Performance:

  • Monitorización: Continua
  • Reporting: Informes mensuales de SLA
  • Cumplimiento: Adhesión a SLA requerida ≥ 99%

Regulatory Compliance para Healthcare​

Medical Device Capacity Requirements:

RegulaciónRequirementImplementation
FDA QSRChange control for capacityFormal approval process
EU MDRPerformance monitoringContinuous metrics collection
HIPAAAvailability requirements99.9% uptime SLA
GDPRData processing capacityPrivacy by design scaling

Automatización y Tooling​

Infrastructure as Code​

Capacity Automation Stack:

Stack de Automatización de Capacidad:

Herramientas de Infraestructura:

HerramientaFunción
TerraformAprovisionamiento infraestructura
AnsibleGestión de configuración
HelmDespliegues Kubernetes

Herramientas de Monitorización:

HerramientaFunción
PrometheusRecolección de métricas
GrafanaVisualización
AlertManagerEnrutamiento de alertas

Herramientas de Optimización:

HerramientaFunción
AWS Cost ExplorerAnálisis de costes
AWS Compute OptimizerRecomendaciones rightsizing
Scripts personalizadosAutomatización cleanup

Self-Healing Infrastructure​

Automated Remediation:

Procedimiento de Auto-Remediación:

Alerta: CPU Alta

  1. Verificar: ¿Es posible escalar horizontalmente?
    • SÍ → Activar auto-scaling
    • NO → Crear incidente "Intervención manual requerida"

Alerta: Almacenamiento Lleno

  1. Verificar: ¿Es almacenamiento de logs?
    • SÍ → Ejecutar limpieza de logs antiguos
    • NO → Expandir tier de almacenamiento

Alerta: Presión de Memoria

  1. Reiniciar servicios intensivos en memoria
  2. Verificar mejora
    • NO mejoró → Escalar tamaño de instancia (scale up)

Métricas y KPIs​

Operational Excellence KPIs​

MétricaTargetQ4 2024Trend
Capacity Utilization70-80%74%✅
Cost per Transaction< $0.02$0.018↓
Auto-scaling Events< 50/day32/day✅
Capacity Planning Accuracy±10%±8%✅
Time to Scale< 5 min3.2 min✅
Budget Variance±5%+3%✅

Business Impact Metrics​

Business KPITargetCurrentImpact
Revenue per GB$0.15$0.18↑ 20%
User Satisfaction> 4.5/54.7/5↑
Time to Market< 2 weeks10 days↑ 30%
Cost of Downtime< $1K/hour$0/hour✅

Roadmap de Evolución​

Capacity Management Maturity​

Niveles de Madurez:

  1. Reactive (Actual): ✅ Monitoring, alerting, manual scaling
  2. Proactive (Q1 2025): 🔄 Predictive scaling, cost optimization
  3. Predictive (Q3 2025): 📋 ML-based forecasting, automated optimization
  4. Autonomous (2026): 📋 Self-managing infrastructure, AI-driven decisions

Technology Evolution​

Emerging Technologies:

Hoja de Ruta Tecnológica:

2025:

TecnologíaDescripciónBeneficio
Serverless MLAWS Lambda + SageMaker inferenceEscalabilidad elástica
Spot FleetBatch workloads en spot instances80% ahorro costes
Graviton ProcessorsARM-based AWS Graviton20% mejor precio/rendimiento

2026:

TecnologíaDescripciónBeneficio
Kubernetes AdoptionMigración a EKSMejor utilización recursos
Service MeshIstio para gestión tráficoObservabilidad avanzada
Chaos EngineeringPruebas resilencia automatizadasMayor disponibilidad

2027:

TecnologíaDescripciónBeneficio
Quantum-ReadyCriptografía resistente a quánticaSeguridad futura
Edge ComputingDespliegue inferencia regionalBaja latencia
AI OpsOperaciones completamente automáticasOperaciones autónomas

Anexo A: Capacity Sizing Calculator​

Calculadora de Capacidad:

Parámetros de Entrada:

  • Tasa de crecimiento (por defecto: 15% mensual)
  • Factor estacional (por defecto: 1.0)

Cálculo de Proyección de Capacidad:

Fórmula: capacidad_proyectada = uso_actual × (1 + tasa_crecimiento)^meses × factor_estacional

Ejemplo:

  • Uso actual: 100 unidades
  • Crecimiento: 15% mensual
  • Proyección a 6 meses: 100 × (1.15)⁶ × 1.0 = 231 unidades

Cálculo de Coste:

ComponenteCoste Unitario
Compute$0.05 por CPU-hora
Storage$0.023 por GB
Network$0.09 por GB transferido
ML Inference$0.001 por request

Coste Total: Suma de todos los componentes

Anexo B: Emergency Scaling Runbook​

Procedimiento de Escalado de Emergencia:

  1. Detección: Alert automática o manual
  2. Evaluación: Determinar scope y urgencia (< 5 min)
  3. Autorización: Auto-aprobada si < 200% capacity
  4. Ejecución: Terraform apply + monitoring
  5. Validación: Verificar métricas en 15 min
  6. Comunicación: Stakeholder notification
  7. Post-mortem: Análisis de causa raíz en 48h

Signature meaning

The signatures for the approval process of this document can be found in the verified commits at the repository for the QMS. As a reference, the team members who are expected to participate in this document and their roles in the approval process, as defined in Annex I Responsibility Matrix of the GP-001, are:

  • Author: Team members involved
  • Reviewer: JD-003, JD-004
  • Approver: JD-001
Previous
OP.PL.3 Adquisición de nuevos componentes
Next
OP.PL.5 Componentes Certificados
  • Documentos de referencia
  • Definiciones
  • Guía de implantación
  • Implementación en Legit Health Plus
    • Marco de Dimensionamiento y Gestión de Capacidades
      • Estrategia de Capacity Management
      • Modelo de Capacidad Multinivel
    • Dimensionamiento por Componentes
      • Infraestructura de Aplicación
      • Infraestructura de Datos
      • Red y Conectividad
    • Modelos de Demanda y Proyecciones
      • Patrones de Uso Identificados
      • Factores de Crecimiento
      • Modelado Predictivo
    • Auto-scaling y Elasticidad
      • Políticas de Auto-scaling
      • Database Auto-scaling
      • Storage Tiering Automático
    • Monitorización y Alerting
      • Métricas de Capacidad Críticas
      • Alerting Automático
      • Observabilidad Avanzada
    • Optimización de Costes
      • FinOps - Gestión Financiera de Cloud
      • Strategies de Optimización
    • Capacity Planning - Presupuestos
      • Proyecciones Presupuestarias
      • Contingency Planning
    • Gestión de Recursos Especializados
      • GPU Computing para ML
      • Specialized Storage Requirements
    • Business Continuity y Disaster Recovery
      • RTO/RPO Requirements
      • Capacity for DR
    • Compliance y Auditoría
      • Capacity Management Audit Trail
      • Regulatory Compliance para Healthcare
    • Automatización y Tooling
      • Infrastructure as Code
      • Self-Healing Infrastructure
    • Métricas y KPIs
      • Operational Excellence KPIs
      • Business Impact Metrics
    • Roadmap de Evolución
      • Capacity Management Maturity
      • Technology Evolution
    • Anexo A: Capacity Sizing Calculator
    • Anexo B: Emergency Scaling Runbook
All the information contained in this QMS is confidential. The recipient agrees not to transmit or reproduce the information, neither by himself nor by third parties, through whichever means, without obtaining the prior written permission of Legit.Health (AI LABS GROUP S.L.)