Neues/Tools

Digitale Ausfallsicherheit: Online um jeden Preis

Digitale Ausfallsicherheit: Online um jeden Preis
Lilit Schoo
2. Juli 2019
Zuletzt aktualisiert: 2. Juli 2019

Es dürfte mittlerweile keine Einwände mehr geben, wenn man folgende Aussage tätigt: Jedes Unternehmen ist heute „irgendwie“ digital. Und sei es nur der vernetzte PC im Hinterzimmer eines kleinen, ansonsten völlig analogen Handwerksbetriebes.

Diese Tatsache schafft aber einer weiteren Tatsache Raum: Je höher der Digitalisierungsgrad eines Unternehmens, vor allem im Bezug auf seine Vertriebsmodelle, desto stärker ist diese Firma darauf angewiesen, bedingungslos 24/7 online und erreichbar zu sein. Ausfälle darf es schlicht und ergreifend nicht geben, weil dann im Zweifelsfall das gesamte Unternehmen stillsteht.

Doch wie stellt man dies an?

Memory Mirroring

Der vielleicht wichtigste Schritt, denn man tun kann, ist, sich etwas einzugestehen:

Absolut nichts ist hundertprozentig ausfallsicher

Ebenso wie das teuerste Fahrzeug eine Panne erleiden kann, kann auch ein sehr hochwertiger Rack-Server einen Ausfall erleben, weil irgendein Bauteil kaputtgeht – warum auch immer.

Aus diesem Grund sollte es für Unternehmen, die ihre kritischen Daten auf eigenen Servern hosten, fast schon obligatorisch sein, Memory Mirroring zu betreiben.

Dabei wird, stark vereinfacht, der Speicher eines Chipsatzes aufgeteilt. Das halbiert zwar die Leistung, bedarf dementsprechend doppelter Ausgaben. Dafür ist aber gewährleistet, dass selbst dann, wenn eine Speicherhälfte ausfällt, die zweite nahtlos übernehmen kann, ohne dass es zu einem Komplettausfall des Systems käme.

Vereinheitlichung

Einer der wichtigsten Gründe, warum es in Bitrix24 die Option gibt, ein einheitliches Menü zu konfigurieren, ist folgender: Jeder Account bekommt die gleichen Dinge zu sehen, jeder kann sich auf den gleichen Wissensstand bringen.

Auch das ist letzten Endes ein Baustein der Ausfallsicherheit. Allerdings geht diese noch viel weiter. Denn obschon unterschiedlichste Hard- und Softwarekomponenten durch die Expertise eines guten IT-Teams harmonisch miteinander arbeiten können, sieht es doch so aus, dass ein „Mischmasch“ von Herstellern und Systemen nicht nur die Komplexität erhöht, sondern auch die Fehleranfälligkeit.

Das kann sich bereits darin manifestieren, dass die Fehlersuche enorm erschwert wird. Und je nachdem, um welchen Teil des Systems es sich dreht, auch, dass nach einem Ausfall die Integration von Reserven zum langwierigen Unterfangen wird.

Das altbekannte KISS-Prinzip bietet auch hier Abhilfe: Eine stringente Systemarchitektur, die für jeden User gleich ist.

Vernetzung flexibilisieren

Je starrer ein Netzwerk, desto mehr läuft alles darauf hinaus, dass jeder Baustein dieses Systems fehlerfrei arbeiten muss – gemäß der Maxime, wonach alles ein gewisses Ausfallrisiko hat, ist das eigentlich ein Unding.

Eine schlagkräftige Lösung dagegen ist es, die Vernetzung des Unternehmens über ein SD-WAN aufzubauen, mehr dazu hier. Denn durch die Architektur dieser auf Software basierenden Weitverkehrsnetze wird nicht nur die Bandbreite besser ausgenutzt, sondern es findet ein intelligentes Routing statt, durch das jederzeit Traffic umgesteuert werden kann.

Das hat nebenbei auch noch den Vorteil, dass es den Normalbetrieb günstiger macht, weil voluminöser Traffic über das reguläre Internet übertragen werden kann.

Kühlungs-Redundanz

Eines der größten Probleme bei Hardware ist die Kühlung, besonders in großen Rechenzentren. Dabei gilt, je mehr digitale Komponenten im oberen Temperaturbereich operieren müssen, desto größer ist das Risiko, dass dadurch ihre Ausfallsicherheit negativ beeinträchtigt wird. Das gilt selbst dann, wenn dieser obere Bereich noch zum „sicheren“ Betriebsbereich gehört. Dann führt zu große Wärmebelastung vielleicht nicht kurzfristig zu Schäden, kann aber auf lange Sicht die Lebensdauer der Komponenten reduzieren.

Besonders kritisch ist das in einem Umfeld, in dem die Kühlungsleistung nicht fail-safe ausgelegt ist. Das bedeutet, sie ist so konfiguriert, dass die notwendige Kühlleistung nur dann bereitgestellt werden kann, wenn alle damit zusammenhängenden Komponenten funktionieren.

Je nach Schwere kann dabei schon ein ausgefallener Lüfter, eine sommerliche Hitzewelle zu einem kapitalen Problem werden, weil sie dem bislang ausreichenden System einen Baustein entnimmt und es so in den unsicheren Betriebsbereich kippen lässt.

Das bedeutet, Kühlsysteme müssen in ihrer Gänze so ausgelegt und vor allem berechnet werden, dass auch dann noch ein sicherer Betrieb möglich ist, wenn ein oder sogar mehrere Komponenten ausfallen, oder sich die Rahmenbedingungen ändern.

Vorratshaltung

Ein Bauteil fällt aus. Durch ein Missgeschick, durch unglückliche Umstände, durch einen simplen Bauteilfehler – also vollkommen gleich weshalb. Das allein ist ein Problem, selbst wenn man redundante Systeme besitzt und so eine temporäre Ausfallsicherheit gegeben ist.

Warum? Weil jetzt keine Redundanz mehr gegeben ist – ein Teil findet sich in Nutzung, das andere funktioniert nicht. Ein Auto, dessen platten Reifen man gegen das Reserverad getauscht hat. Passiert nun noch eine Panne (was nie ausgeschlossen werden darf), war die ganze teure Redundanz vergebene Liebesmüh.

Dagegen hilft nur etwas, das in der heutigen Zeit von Sparsamkeit und Just-in-Time etwas aus der Mode gekommen ist, Vorratshaltung. Dort, wo das Rechenzentrum steht, muss für alle Bauteile, deren Ausfall massive Nachteile hätte, Ersatz vorhanden sein. Das mag je nach Unternehmen viel Kapital binden, aber ungleich teurer wäre es, im Aus-Fall stunden- oder gar tagelang auf ein Teil warten zu müssen. Und: Gerade bei günstigen Komponenten im Stile von Steckern, Lüftern und dergleichen kann auch ruhig großmaßstäblich gelagert werden.


40518 3) paul silvan Unsplash.jpg

Jede digitale Ausfallsicherheit ist nur so gut, wie auch ihr Schutz gegen die simple Störung eines Stromnetzes ist.

Stromsicherheit gewährleisten    

Das gesamte System eines Unternehmens kann absolut krisenfest gestaltet werden. Es braucht jedoch nur einen Baggerführer einige Straßen entfernt, der nicht richtig achtgibt und all das war umsonst.

Denn Stromausfälle kommen alle Tage vor, ihre Zahlen gehen in die Hunderttausende alljährlich. Absolut niemand, der an einem öffentlichen Stromnetz hängt, ist davor gefeit. Und Firmen, die gewisse Rechenaufgaben auslagern, sind sogar doppelt gefährdet – sowohl am eigenen Standort wie dem des Dienstleisters.

Primär sollte das bedeuten, dass zumindest für lebensnotwendige Anwendungen immer ein ständig aktualisiertes In-House-Spiegelbild vorhanden sein sollte. Dazu aber braucht es die Möglichkeit, Strom unabhängig vom Netz zu haben – ebenfalls für besagte lebensnotwendige Anwendungen.

Bei kleinen Unternehmen kann dazu eine Unterbrechungsfreie Stromversorgung (USV) ausreichen – letzten Endes nicht mehr als eine relativ kleine Batterie oder ein System mit Schwungrad, das bei einem Ausfall nahtlos übernimmt, weil es in die Stromversorgung integriert ist.

Das Problem an USVs ist jedoch, dass ihre Leistung, sowohl was die Elektrik wie die Versorgungsdauer anbelangt, stark begrenzt ist. Typische Systeme können nur zweistellige Minutenzahlen überbrücken. Das reicht zwar für viele Stromausfälle, allerdings eben nicht für alle.

Ist die benötigte Leistung, selbst wenn nur kritische Systeme einbezogen werden, zu hoch oder muss eine wesentlich längere Autonomiezeit gewährleistet sein, gibt es keine Alternative zum vollwertigen Notstromaggregat.  

Nur darüber ist eine Versorgung vollkommen unabhängig und für eine nahezu beliebig lange Zeit gewährleistet. Und: Ist sichergestellt, dass dieses Aggregat innerhalb der Laufzeit der USV gestartet werden kann, benötigt es nicht einmal ein aufwendiges automatisches Startsystem.


Free. Unlimited. Online
Mit Bitrix24 können Sie miteinander kommunizieren, an Aufgaben und Projekten gemeinsam arbeiten, Kunden betreuen usw. - und all das an einem Ort.