BLOG

Globale Resilienz: Schutz kritischer Infrastrukturen bei Cloud-Ausfällen

Chin Keng Lim Miniaturbild
Chin Keng Lim
Veröffentlicht am 16. Oktober 2024

Die jüngsten weltweiten Ausfälle durch CrowdStrike waren für viele Organisationen ein Weckruf. Die Vorstände der Unternehmen fragen ihre CIOs, wie sie den nächsten weltweiten Stromausfall abmildern können, der (ohne ihr Verschulden) zu Störungen ihrer unternehmenskritischen Anwendungen führen könnte. Regierungen weltweit fragen sich zudem, wie sich der Kollateralschaden verhindern lässt, der durch derartige globale Störungen wichtiger öffentlicher Dienste entsteht, insbesondere bei kritischer Informationsinfrastruktur (CII) wie dem Bank-, Transport- und Gesundheitswesen.

Einem aktuellen Gartner-Bericht zum Aufbau digitaler Resilienz zufolge verfügt die große Mehrheit der Organisationen (88 %) über eine definierte Strategie zur digitalen Resilienz. Allerdings wirken sich weltweite Ausfälle bei Cloud-Service-Providern (CSPs) und Software-as-a-Service-(SaaS)-Sicherheitsanbietern weiterhin negativ auf Unternehmen aus. Dies zeigt, dass die heute in den meisten Organisationen umgesetzte Strategie zur digitalen Ausfallsicherheit einzelne Ausfallpunkte von CSPs und SaaS-Sicherheitsanbietern möglicherweise nicht berücksichtigt hat.

Ungeplante Anwendungsausfallzeiten stellen nicht nur einen Verstoß gegen die Vorschriften dar; sie können auch zu Unzufriedenheit führen, die Ihre Kunden zur Konkurrenz abwandern lassen könnte. Das bedeutet, dass Ausfallzeiten zu Verlusten auf mehreren Ebenen führen können. Wenn Sie jedoch an der Sicherung Ihrer Infrastruktur und Anwendungen arbeiten, kann dies auch zu einer besseren Compliance und einem zufriedenstellenderen Kundenerlebnis führen und gleichzeitig zur Senkung der Infrastrukturkosten beitragen.

Der Schlüssel liegt darin, die Gesamtkosten des Betriebs vor Ort im Vergleich zu denen in der Cloud zu verstehen. Die Cloud kann aufgrund ihrer Elastizität kosteneffizient sein, da sie Nutzungsspitzen bewältigen kann und mit ihrem Pay-as-you-go-Modell die Kosten senkt. Wenn bei der Bereitstellung einer unternehmenskritischen Anwendung ein Active-Active-Hybrid-Cloud-Designmuster verwendet wird und der Lebenszyklus der vorhandenen Hardware in die Berechnung einbezogen wird, können erhebliche Kosten eingespart werden – laut Untersuchungen von Dell bis zu 75 % bei Workloads mit künstlicher Intelligenz (KI).

Was ist globale Resilienz?

Unter globaler Resilienz versteht man die Fähigkeit von Organisationen, globalen Infrastrukturausfällen und Cyberangriffen standzuhalten, sich daran anzupassen und sich davon zu erholen. Dabei geht es um die Entwicklung von Strategien, Fähigkeiten und Infrastrukturen zur Vorbeugung, Erkennung, Reaktion auf und Behebung globaler Ausfälle.

Ein wesentlicher Aspekt globaler Resilienz ist die Aufrechterhaltung einer robusten Infrastruktur, in der IT-Systeme und Netzwerke flexibel und skalierbar sind und unerwartete Belastungen oder Ausfälle bewältigen können. Dies wird durch die Nutzung von Multicloud-Umgebungen und die Maximierung des von der Cloud gebotenen Werts erreicht.

Ebenso wichtig ist die Aufrechterhaltung höchster Wirksamkeit der Cybersicherheit. Zum Schutz vor Cyberbedrohungen müssen strenge Sicherheitsmaßnahmen umgesetzt werden, die gleichzeitig die Datenintegrität und -verfügbarkeit gewährleisten – ohne einzelne Ausfallpunkte einzuführen. Es ist wichtig zu erkennen, dass viele Cloud-basierte SaaS-Lösungen für Cybersicherheit architektonisch einzelne Ausfallpunkte aufweisen. Wenn diese Lösungen ausfallen, haben die Kunden mit entsprechenden Konsequenzen zu kämpfen.

Auch für die globale Widerstandsfähigkeit sind anpassungsfähige Prozesse von entscheidender Bedeutung. Unternehmen müssen flexible Betriebsabläufe entwickeln, die sich schnell an Veränderungen der Umgebung, der Marktbedingungen oder der Technologie anpassen können. Dadurch wird die Fähigkeit sichergestellt, sich schnell auf neue Herausforderungen einzustellen.

Was können Unternehmen tun, um global widerstandsfähiger zu sein?

Unternehmen müssen sich bei der Entwicklung global belastbarer Anwendungen auf drei Schlüsselmaßnahmen konzentrieren.

  1. Kategorisieren Sie Anwendungen in vier Ebenen
    Beginnen Sie mit der Identifizieren und Kategorisieren Ihrer Anwendungen in die folgenden Ebenen:

    • Unternehmenskritische Anwendungen: Erfordern globale Ausfallsicherheit und stellen sicher, dass sie unabhängig von den Umständen immer einsatzbereit sind.
    • Geschäftskritische Anwendungen: Globale Ausfallsicherheit ist optional, wird jedoch zur Reduzierung von Störungen empfohlen.
    • Betriebswirtschaftliche Anwendungen: Behalten Sie den regulären Betrieb bei, erfordern Sie jedoch keine globale Ausfallsicherheit.
    • Verwaltungsanwendungen: Nicht unbedingt erforderliche Anwendungen, die Geschäftsfunktionen unterstützen, für die unmittelbare Kontinuität jedoch nicht entscheidend sind.
  2. Ordnen Sie jeder Anwendungsebene globale Entwurfsmuster für die Ausfallsicherheit zu.
    Je nach Ebene können Unternehmen unterschiedliche Resilienzmuster implementieren:

    • Verteilte Bereitstellung:
      • Abgestufter Hybrid: Front-End-Anwendungen werden in der Cloud bereitgestellt, während vorhandene Back-End-Systeme vor Ort verbleiben.
      • Partitionierter Hybrid: Kombiniert die öffentliche Cloud und lokale Umgebungen in einer Active-Active-Bereitstellung, bietet Widerstandsfähigkeit gegen Einzelstandortausfälle und optimiert die Kosten.
      • Analytics-Hybrid: Trennt die Aufgaben der Online-Transaktionsverarbeitung (OLTP) und der Online-Analyseverarbeitung (OLAP), sodass die öffentliche Cloud komplexe Analysen verarbeiten kann, während die Kernvorgänge vor Ort aufrechterhalten werden.
      • Edge-Hybrid: Verwaltet zeitkritische, geschäftskritische Workloads lokal (z. B. KI-Inferenz am Netzwerkrand), während die Cloud/vor Ort für andere Aufgaben genutzt wird.
         
    • Redundanter Einsatz:
      • Redundantes Muster: Verteilt Arbeitslasten je nach Produktions- und Entwicklungsanforderungen auf verschiedene Clouds oder Umgebungen.
      • Hybridmuster für Geschäftskontinuität: Nutzt öffentliches Cloud-Failover für kostengünstige Cold-Standby-Systeme.
      • Muster der Wolkenbildung: Behandelt grundlegende Arbeitslasten privat und verlagert sie bei Bedarf in die Cloud, um zusätzliche Kapazitäten bereitzustellen.
  3. Passen Sie globale Referenzarchitekturen für Ausfallsicherheit an jede Ebene an
    Unternehmen sollten eine Referenzarchitektur basierend auf diesen Anwendungsebenen erstellen. Dies dient als strategischer Leitfaden für die Bereitstellung vorhandener und neuer Workloads, für die Verkürzung der Wertschöpfungszeit und für die Abstimmung der Anforderungen an technische und geschäftliche Ausfallsicherheit. Für unternehmenskritische Anwendungen ist ein „partitioniertes Hybrid“-Entwurfsmuster unerlässlich. Dies bedeutet, dass in lokalen und Cloud-Umgebungen dasselbe Frontend eingesetzt wird, um die Widerstandsfähigkeit gegenüber Einzelsiteausfällen zu gewährleisten. Durch das Befolgen dieser Schritte können Unternehmen nicht nur ihren Betrieb absichern, sondern auch die nötige Flexibilität erlangen, um in einer globalen, Cloud-basierten Umgebung erfolgreich zu sein.
Die globale Ausfallsicherheit kann durch die Anpassung der Ausfallsicherheitsreferenzarchitekturen an jede Ebene verbessert werden.
Die globale Ausfallsicherheit kann durch die Anpassung der Ausfallsicherheitsreferenzarchitekturen an jede Ebene verbessert werden.

Gibt es Rahmenbedingungen für globale Resilienz?

Es gibt verschiedene Frameworks und Modelle zur digitalen Resilienz, die Unternehmen übernehmen können, um ihre Reaktionsfähigkeit auf Störungen und die Erholung davon zu verbessern. Zu den bemerkenswerten Frameworks gehören:

  • Rahmenwerk für Cybersicherheit des Nationalen Instituts für Standards und Technologie (NIST)
  • Internationale Organisation für Normung (ISO)/Internationale Elektrotechnische Kommission (IEC) 27001
  • Kontrollziele für Informationen und verwandte Technologien (COBIT)
  • Bibliothek der Informationstechnologie-Infrastruktur (ITIL)
  • Rahmenwerk für das Business Continuity Management (BCM)
  • Gesetz zur digitalen Betriebsresilienz (DORA)
  • Integration des Capability Maturity Model (CMMI)

Durch die Einführung dieser Frameworks können Unternehmen einen strukturierten Ansatz entwickeln, um ihre digitale Widerstandsfähigkeit zu verbessern und sich besser auf potenzielle Störungen vorzubereiten.

Schlüsselstrategien für globale Resilienz

Um eine globale Ausfallsicherheit zu gewährleisten, sind hohe Verfügbarkeit, Skalierbarkeit und robuste Sicherheit für Anwendungen erforderlich. Organisationen können dies erreichen, indem sie wichtige Technologien nutzen, die sowohl die Leistung als auch den Schutz verbessern.

ADCs: Der BIG-IP App Delivery Controller (ADC), F5 NGINX ADC und der verteilte Cloud Application Delivery Controller as a Service (ADCaaS) von F5 können die Verkehrsverteilung optimieren und Anwendungen über Rechenzentren, Clouds und Hybridumgebungen hinweg skalieren, um Verfügbarkeit und Leistung sicherzustellen.

Cybersicherheit: Tools wie Web Application Firewalls (WAFs), API-Sicherheit (Application Programming Interface) und Denial-of-Service-Schutz (DoS) schützen Anwendungen vor Cyberbedrohungen und gewährleisten Kontinuität auch während Angriffen.

Cloud- und Hybridbereitstellungen: Multicloud-Networking und Hybrid-Setups verbessern die Flexibilität und ermöglichen eine schnelle Reaktion auf Störungen.

Automatisierung und Orchestrierung: Durch die Automatisierung der Anwendungsbereitstellung und -sicherheit werden Fehler reduziert und Reaktionszeiten verkürzt, was die Ausfallsicherheit verbessert.

Sichtbarkeit und Analyse: Echtzeitüberwachung und -analyse ermöglichen proaktive Reaktionen auf Leistungsprobleme und Sicherheitsbedrohungen.

Durch die Implementierung dieser Technologien können Unternehmen sicherstellen, dass ihre Anwendungen in einer sich ständig verändernden digitalen Umgebung verfügbar, skalierbar und sicher bleiben.

Aufbau einer umfassenden globalen Resilienzstrategie

In der heutigen vernetzten Welt ist der Aufbau globaler Ausfallsicherheit von entscheidender Bedeutung für die Wahrung der Integrität von Anwendungen. Durch die Konzentration auf Schlüsselbereiche wie Anwendungsbereitstellung, robuste Cybersicherheit und anpassbare Cloud-Strategien können Unternehmen ihre Dienste besser vor Störungen schützen und sie an die sich ändernden Anforderungen anpassen. Durch die Implementierung von Automatisierung und die Echtzeit-Einsicht in die Systemleistung können die Resilienzbemühungen weiter gestärkt werden. Mit einem umfassenden, durchdachten Ansatz können Unternehmen sicherstellen, dass ihre Anwendungen zuverlässig und sicher bleiben und den Herausforderungen von morgen gewachsen sind.

Chatten Sie vom 15. bis 17. Oktober mit uns bei GovWare in Singapur im Sands Expo Convention Center am Stand P06. Wir geben Ihnen dort Einblicke, wie Sie Cyber- und Cloud-Resilienz aufbauen und stärken und Apps überall sichern, bereitstellen und optimieren können.