Überspringen zu Hauptinhalt

Zero Downtime?! Die SLAs von AWS & root360 im Detail

Ein Service Level Agreement (SLA) ist ein Rahmenvertrag zwischen Auftraggeber und Dienstleister. Der Begriff stammt ursprünglich aus dem Bereich der IT-Dienstleistungen, wird heute aber auch bei anderen Dienstleistungen verwendet. Dabei werden u.a. Details zur Verfügbarkeit des Service, Reaktionszeit, Leistungsumfang und Schnelligkeit der Bearbeitung definiert. Üblicherweise werden SLAs in verschiedenen Stufen mit unterschiedlichen Leistungsumfang und Preis angeboten.

Service Level Agreements von AWS

Die Managed Cloud Lösung von root360 basiert auf der Infrastruktur von Amazon Web Services (AWS). AWS garantiert dabei verschiedene Servicelevel für seine Dienste, zum Beispiel:

  • RDS 99,95%
  • EC2 99,99%
  • ElastiCache 99.90%
  • Elasticsearch 99.90%
  • EFS 99.90%
  • S3 99,90%

Durch die Kombination der einzelnen Komponenten in einer Cloud-Umgebung ergibt sich eine SLA-Kette deren Verfügbarkeit nochmals von den einzelnen Komponenten leicht abweicht. Wie man die Verfügbarkeiten eines individuellen Anwendungsszenarios berechnet, wird im AWS Whitepaper “Reliability Pillar” erklärt. 

Im Folgenden zeigen wir anhand eines Use-Cases, wie diese Berechnung der Verfügbarkeit aussehen kann.

Infrastruktur des Use Cases
Service SLASLA mit Abhängigkeit (Kette)Mögliches Redundanz-Level des ServiceService SLA mit Redundanz-beachtungSLA mit Abhängigkeit (Kette) inkl. Redundanz-beachtung
RDS99.9599.9500299.997599.9975
EC299.9999.9400299.999999.9974
ElastiCache99.9099.8400299.990099.9874
Elasticsearch 99.90%99.9099.7400399.999099.9864
EFS 99.90%99.9099.6400199.900099.8864
S3 99,90%99.9099.5400199.900099.7864

Doch was bedeutet nun genau eine Gesamtverfügbarkeit von 99,5% bzw. 99,8%? Um dafür ein besseres Verständnis zu bekommen, ist es üblich dies auf ein Kalenderjahr umzurechnen. So sind bei 99.5% Verfügbarkeit 40,3 Stunden Ausfall pro Jahr möglich. Bei einer redundanten Cloud-Umgebung mit einer Verfügbarkeit von 99,8% reduziert sich der mögliche Ausfall auf 18,7 Stunden pro Jahr.

Welche Gesamtverfügbarkeit garantiert root360?

In der Praxis erreichen Cloud Umgebungen eine Gesamtverfügbarkeit von über 99,99%. Dies wird durch eine redundante Auslegung von Hardware-Ressourcen sowie auf minimale Downtime ausgelegte Deployment- und Maintenance-Prozesse erreicht.

Eine Gesamtverfügbarkeit von 99,9% bedeutet theoretisch einen Ausfall von 8,76 Stunden pro Jahr, dessen Zeitpunkt ungewiss ist. Wir empfehlen daher eine redundante Auslegung von Hardware-Komponenten um sich dem  Ziel “Zero Downtime” anzunähern. Dies bedeutet, dass bei Ausfall einer einzelnen Komponente, trotzdem ein nahtloser Weiterbetrieb der gesamten Cloud-Umgebung gewährleistet wird. Auch ungeplante Downtimes, z.B. durch notwendige Deployments oder Maintenance-Prozesse, können so minimiert werden.

Service Level Agreements von root360

Da unsere Managed Cloud Lösung auf AWS basiert, profitiert diese natürlich von der hohen Verfügbarkeit, welche AWS für seine Services garantiert. Darüber hinaus setzen wir, wenn nötig bzw. gewünscht, auf redundante Cloud-Infrastrukturen. Unsere Erreichbarkeit rundet das Gesamtpaket dann noch einmal ab: sollten wirklich einmal Probleme auftreten, sind wir zur Stelle, um diese zu analysieren und zu lösen. Die Erreichbarkeit unseres Support-Teams bieten wir in zwei Stufen an:

  • 24/7: jeden Tag 00:00 bis 24:00 Uhr, mit einer Stunde Reaktionszeit
  • 9/5: Montag bis Freitag (ohne gesetzliche Feiertage) von 09:00 bis 18:00 Uhr, mit einer Stunde Reaktionszeit (Dies empfehlen wir z.B. für Stage-Umgebungen)

Fazit

Für geschäftskritische Anwendungen sind Managed Cloud Lösungen das Mittel der Wahl, da mit einer redundanten Cloud-Umgebung, das Ziel “Zero Downtime” möglich ist. Eine erhöhte Verfügbarkeit ist meist auch mit erhöhten Kosten verbunden. Aus diesem Grund sollte man in einer Erstanalyse zunächst bewerten, welche Anforderungen im konkreten Fall zu erfüllen sind. Anhand dessen, kann dann die optimale Cloud-Infrastruktur erarbeitet werden.

An den Anfang scrollen