BLOG

Resiliencia global: Protección de infraestructura crítica ante interrupciones en la nube

Miniatura de Chin Keng Lim
Chin Keng Lim
Publicado el 16 de octubre de 2024

Las recientes interrupciones globales causadas por CrowdStrike crearon una llamada de atención para muchas organizaciones. Los directorios de las empresas están preguntando a los CIO cómo pueden mitigar la próxima interrupción global, que podría causar interrupciones en sus aplicações de misión crítica (sin que sea culpa suya). Los gobiernos de todo el mundo también se preguntan cómo prevenir los daños colaterales de esa perturbación global en los servicios públicos esenciales, especialmente en la infraestructura de información crítica (ICI), como la banca, el transporte y la atención de la salud.

Según un informe reciente de Gartner sobre la creación de resiliencia digital, la gran mayoría de las organizaciones (88%) tienen una estrategia de resiliencia digital definida. Sin embargo, las interrupciones globales de los proveedores de servicios en la nube (CSP) y de los proveedores de seguridad de software como servicio (SaaS) continúan afectando colateralmente a las organizaciones. Esto demuestra que la estrategia de resiliencia digital vigente hoy en día en la mayoría de las organizaciones puede no haber considerado los puntos únicos de falla de los CSP y los proveedores de seguridad SaaS.

El tiempo de inactividad no planificado de una aplicação no es sólo una violación del cumplimiento; puede generar insatisfacción que podría hacer que sus clientes se vayan a la competencia. Esto significa que el tiempo de inactividad puede generar pérdidas en múltiples niveles, pero trabajar en la protección de su infraestructura y aplicações también puede conducir a un mejor cumplimiento, una experiencia del cliente más satisfactoria y, al mismo tiempo, ayudar a reducir los costos de infraestructura.

Comprender el costo total de las operaciones locales en comparación con las de la nube es clave. La nube puede resultar rentable gracias a su elasticidad, que le permite adaptarse a los aumentos repentinos de uso y reducir los costos con su modelo de pago por uso. Si la implementación de una aplicação de misión crítica adopta un patrón de diseño de nube híbrida activo-activo, y se tiene en cuenta el ciclo de vida del hardware existente en el cálculo, verá un ahorro de costos sustancial, hasta un 75 % para cargas de trabajo de inteligencia artificial (IA), según una investigación de Dell .

¿Qué es la resiliencia global?

La resiliencia global se refiere a la capacidad de las organizaciones para resistir, adaptarse y recuperarse de fallas de infraestructura global y ciberataques. Implica desarrollar estrategias, capacidades e infraestructura para prevenir, detectar, responder y recuperarse de cortes eléctricos globales.

Un aspecto clave de la resiliencia global es mantener una infraestructura robusta, donde los sistemas de TI y las redes sean flexibles, escalables y capaces de manejar cargas o fallas inesperadas. Esto se logra aprovechando los entornos multicloud y maximizando el valor que ofrece la nube.

Igualmente importante es mantener la máxima eficacia en ciberseguridad. Se deben implementar fuertes medidas de seguridad para protegerse contra amenazas cibernéticas y, al mismo tiempo, garantizar la integridad y disponibilidad de los datos, sin introducir puntos únicos de falla. Es fundamental reconocer que muchas soluciones SaaS de ciberseguridad basadas en la nube son, arquitectónicamente, puntos únicos de falla, lo que significa que cuando fallan, sus clientes sufren impactos colaterales.

Los procesos adaptables también son esenciales para la resiliencia global. Las empresas necesitan desarrollar flujos de trabajo operativos flexibles que puedan adaptarse rápidamente a los cambios en el entorno, las condiciones del mercado o la tecnología. Esto garantiza la capacidad de adaptarse rápidamente ante nuevos desafíos.

¿Qué pueden hacer las empresas para ser más resilientes a nivel global?

Las empresas deben centrarse en tres acciones clave al diseñar aplicações globalmente resilientes.

  1. Clasifique las aplicações en cuatro niveles
    Comience por identificar y categorizar sus aplicações en los siguientes niveles:

    • Aplicações de misión crítica: Exigir resiliencia global, garantizando que siempre estén operativos, sin importar las circunstancias.
    • Aplicações críticas para el negocio: La resiliencia global es opcional pero se recomienda para reducir las disrupciones.
    • Aplicações empresariales-operativas: Mantener operaciones regulares pero no requerir resiliencia global.
    • Aplicações administrativas: Aplicações no esenciales que respaldan las funciones comerciales pero que no son fundamentales para la continuidad inmediata.
  2. Asignar patrones de diseño de resiliencia global a cada nivel de aplicação
    Dependiendo del nivel, las empresas pueden implementar diferentes patrones de resiliencia:

    • Implementación distribuida:
      • Híbrido escalonado: Las aplicações front-end se implementan en la nube, mientras que los sistemas back-end existentes permanecen locales.
      • Híbrido particionado: Combina la nube pública y las instalaciones locales en una implementación activa-activa, lo que proporciona resiliencia ante fallas de un solo sitio y optimiza los costos.
      • Análisis híbrido: Separa las tareas de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP), lo que permite que la nube pública gestione análisis complejos mientras mantiene las operaciones centrales en las instalaciones.
      • Híbrido de borde: Administra cargas de trabajo críticas para el negocio y sensibles al tiempo localmente (por ejemplo, inferencia de IA en el borde de la red) mientras usa la nube/local para otras tareas.
         
    • Implementación redundante:
      • Patrón redundante: Distribuye cargas de trabajo en diferentes nubes o entornos según las necesidades de producción y desarrollo.
      • Patrón híbrido de continuidad de negocio: Utiliza conmutación por error en la nube pública para lograr sistemas de reserva en frío rentables.
      • Patrón de estallido de nubes: Maneja cargas de trabajo de base de forma privada y las transfiere a la nube para obtener capacidad adicional cuando es necesario.
  3. Adapte las arquitecturas de referencia de resiliencia global a cada nivel
    Las empresas deben establecer una arquitectura de referencia basada en estos niveles de aplicação . Esto sirve como guía estratégica para implementar cargas de trabajo existentes y nuevas, acortando el tiempo para obtener valor y alineando las necesidades de resiliencia técnica y comercial. Para aplicações de misión crítica , un patrón de diseño "híbrido particionado" es esencial. Esto significa implementar la misma interfaz tanto en entornos locales como en la nube para garantizar la resiliencia ante fallas en un solo sitio. Al seguir estos pasos, las empresas no solo pueden proteger sus operaciones sino también obtener la flexibilidad necesaria para prosperar en un entorno global impulsado por la nube.
La resiliencia global se puede mejorar adaptando las arquitecturas de referencia de resiliencia a cada nivel.
La resiliencia global se puede mejorar adaptando las arquitecturas de referencia de resiliencia a cada nivel.

¿Existen marcos de referencia sobre resiliencia global?

Existen varios marcos y modelos de resiliencia digital que las organizaciones pueden adoptar para mejorar su capacidad de responder y recuperarse ante las disrupciones. Algunos de los marcos notables incluyen:

  • Marco de ciberseguridad del Instituto Nacional de Estándares y Tecnología (NIST)
  • Organización Internacional de Normalización (ISO)/Comisión Electrotécnica Internacional (IEC) 27001
  • Objetivos de Control para la Información y Tecnologías Relacionadas (COBIT)
  • Biblioteca de Infraestructura de Tecnologías de la Información (ITIL)
  • Marco de gestión de la continuidad del negocio (BCM)
  • Ley de Resiliencia Operativa Digital (DORA)
  • Integración del modelo de madurez de capacidad (CMMI)

Al adoptar estos marcos, las organizaciones pueden crear un enfoque estructurado para mejorar su resiliencia digital y prepararse mejor para posibles disrupciones.

Estrategias clave para la resiliencia global

Garantizar la resiliencia global requiere alta disponibilidad, escalabilidad y seguridad sólida para las aplicações. Las organizaciones pueden lograr esto aprovechando tecnologías clave que mejoran tanto el rendimiento como la protección.

ADC: El controlador de entrega de aplicaciones (ADC) BIG-IP de F5, el ADC F5 NGINX y el controlador de entrega de aplicação como servicio (ADCaaS) en la nube distribuida pueden optimizar la distribución del tráfico y escalar aplicações en centros de datos, nubes y entornos híbridos para garantizar la disponibilidad y el rendimiento.

Ciberseguridad: Herramientas como los firewalls de aplicação web (WAF), la seguridad de la interfaz de programación de aplicação (API) y la protección contra denegación de servicio (DoS) protegen las aplicações contra amenazas cibernéticas, garantizando la continuidad incluso durante los ataques.

Implementaciones en la nube e híbridas: Las redes multicloud y las configuraciones híbridas mejoran la flexibilidad, lo que permite una respuesta rápida a las interrupciones.

Automatización y orquestación: La automatización de la entrega y la seguridad de las aplicação reduce los errores y los tiempos de respuesta, lo que mejora la resiliencia.

Visibilidad y análisis: La monitorización y el análisis en tiempo real permiten ofrecer respuestas proactivas a problemas de rendimiento y amenazas a la seguridad.

Al implementar estas tecnologías, las organizaciones pueden garantizar que sus aplicações permanezcan disponibles, escalables y seguras en un entorno digital en constante cambio.

Desarrollo de una estrategia integral de resiliencia global

En el mundo interconectado de hoy, desarrollar resiliencia global es crucial para mantener la integridad de las aplicações. Al centrarse en áreas clave como la distribución de aplicação , la ciberseguridad sólida y las estrategias de nube adaptables, las organizaciones pueden proteger mejor sus servicios de las interrupciones y escalar para satisfacer las demandas cambiantes. La implementación de la automatización y la obtención de visibilidad en tiempo real del rendimiento del sistema pueden fortalecer aún más los esfuerzos de resiliencia. Con un enfoque integral y bien pensado, las empresas pueden garantizar que sus aplicações sigan siendo confiables, seguras y listas para enfrentar los desafíos del mañana.

Chatee con nosotros en GovWare en Singapur del 15 al 17 de octubre en el Sands Expo Convention Center, stand P06, donde compartiremos conocimientos sobre cómo puede construir y fortalecer la resiliencia cibernética y de la nube, y proteger, entregar y optimizar aplicaciones en cualquier lugar.