Ausfallsicherheit einer Produktionsdatenbank

Produktionsdatenbank mit Ausfallsicherheit

Wie ausfallsicher Datenbanken wirklich sind, hängt auch von den gegebenen Backup-Mechanismen ab. Doch die existieren nicht immer, weiß Melanie Krumbein von ITGAIN. Sie ist Solution Consultant und hat mehr als 20 Jahre Erfahrung mit Datenbanken. Im Gespräch erinnert sie sich an ein treffendes Beispiel und erklärt, was wichtig ist, um dauerhaft hochverfügbare Lösungen einzurichten.

Melanie, du hattest es in deinen vielen Projekten vorrangig mit Microsoft-SQL-Servern zu tun. Was sind die häufigsten Probleme? 

Das lässt sich pauschal schwer sagen. Meist geht es um verlorene oder beschädigte Daten. Zum Beispiel ist ein Stück einer Datei nicht sauber geschrieben worden. Und das sorgt dafür, dass ein noch größeres Stück nicht mehr richtig gelesen werden kann. Doch die Fehleranalyse ist das eine. Unsere Aufgabe ist es vor allem, störanfällige Setups von vornherein zu vermeiden. Dass eine systemkritische Datenbank nicht ausreichend gesichert ist, beispielsweise.

Du denkst dabei an einen bestimmten Fall, oder? 

Ja, mir fällt da ein gutes Beispiel ein: ein Hersteller aus der Lebensmittelindustrie. Er produziert Nahrungsergänzungsmittel als Pulver, Kapseln und Tabletten. Über eine SQL-Datenbank steuern die Mitarbeiter dort Mengen von Zutaten oder die benötigten Rezepturen. Alles läuft auf Förderbändern 

Was war passiert 

In dem Fall war es drastisch. An einem Freitagnachmittag funktionierte keine der Maschinen mehr. Alles stand still. Die Ursache war eine Datenbankkorruption in der erwähnten Produktionsdatenbank. Wo genau der Fehler lag, war so schnell nicht zu ermitteln. Hinzu kam, dass der Admin die defekten Abschnitte nicht wiederherstellen konnte. Also wurden wir angefragt und stellten fest: Die eingerichtete Backup-Strategie unterstützte nicht die Art von Wiederherstellung, die wir brauchten. Wir reparierten das System schließlich mit Datenverlust und richteten das Backup korrekt ein, sodass es in Zukunft zumindest zu keinem Datenverlust mehr kommen konnte.

Murphys Gesetz kann überall zuschlagen, dann kann sogar eine sicher aufgesetzte Datenbank kaputt gehen.“ 

Melanie Krumbein, Solution Consultant

Das heißt aber, es gab noch immer nur eine Datenbank. Das klingt nicht nach einer Dauerlösung. Wie ging es weiter?  

Die Geschäftsführung wollte logischerweise ein ausfallsicheres Konzept, das nie wieder eine lange Downtime oder Datenverluste zulassen würde. Also planten wir den Aufbau einer Hochverfügbarkeitslösung mit einer passenden Backup-Strategie. Dazu kamen projekttypische Eigenheiten. 

Kannst du das erklären 

Das Rechenzentrum liegt in der Nähe eines Flusses und fiel ein Jahr zuvor wegen einer Überschwemmung aus, also brauchte es ein räumlich getrenntes Sicherungssystem. Die Produktionshalle befindet sich deshalb auf einer Anhöhe und alle Informationen werden aus dem Rechenzentrum kabellos per Richtfunk gesendet. Das heißt, die Datenpakete durften bei unserem Konzept nicht zu groß sein. In mehreren Schritten planten wir eine Hochverfügbarkeitslösung mit zwei Knoten, also verteilten Servern. Um das alles umsetzen zu können, war also eine Migration der Datenbank von MSSQL2000 nach MSSQL2016 nötig. Hierfür musste zunächst der Anwendungsquellcode auf ein kompatibles Level angehoben werden. Von diesem Zeitpunkt an haben wir per Log Shipping (siehe Info-Kasten) die Veränderung aller Daten festgehalten, um schon vorab eine Rückversicherung gegen erneute Festplattenprobleme zu haben. Schritt zwei war ein neuer Server, mit dem wir die Daten tatsächlich sichern konnten. Über das eingerichtete Log Shipping konnten wir dann nahtlos mit minimaler Downtime von MSSQL2005 nach MSSQL2016 migrieren. 

Einige Monate später, als der Kunde sogar ein zweites Werk am Standort eröffnete und wir einen weiteren Server implementierten, war das System in der finalen Ausbaustufe und sehr stabil. Im Ergebnis spiegeln zwei Knoten permanent die Daten. Geht ein Server kaputt, liegt die Downtime bei wenigen Sekunden. Dann springt der andere Knoten ein. Das heißt in der IT-Welt Failover-System.  

Klingt nachvollziehbar. Was sind die Herausforderungen dabei 

Das Einrichten ist nicht ganz trivial – vom Konzept über das Umschreiben des Quellcodes bis zum Programmieren der Backup-Mechanismen. Da geht es um viele Details beim Aufsetzen und bei der Planung und um viel Überzeugungsarbeit, damit das geplante Konzept als langfristig richtig angesehen wird. Schließlich haben die meisten Admins logischerweise nicht regelmäßig mit einem Systemwechsel zu tun. Hier können wir sehr effektiv helfen 

Wenn du von Überzeugungsarbeit redest: Welche Vorteile bringst du für ein solches Konzept in Anschlag? 

Ein klares Argument ist, dass es am Ende nicht unbedingt mehr kostet. Durch das Prinzip eines Failovers bleiben die Lizenzkosten gering, da man nur den aktiven Knoten lizensiert. Zudem sinkt die Downtime für Wartungsfenster. Denn man kann auf einem der wartenden Server die Updates aufspielen, ohne die Produktion zu stören. Zu einem produktionstechnisch günstigen Zeitpunkt springt man in Sekundenschnelle auf den anderen Server. Am Ende ist aber vor allem die Datensicherheit und die Verfügbarkeit gegeben. Das zahlt sich immer aus, weil man so den Produktionsausfall verhindert 

Welche Erkenntnisse ziehst du aus dem Projekt? 

Erst einmal: Kein Kunde ist gleich. Und was die Datensicherheit angeht, kann ich sagen, Murphys Gesetz kann überall zuschlagen. Es kann sogar eine stabil aufgesetzte Datenbank kaputt gehen. Deshalb ist eine Kombination aus guten Prüfmechanismen und mehreren Knoten die beste Lösung, um Datenverlust zu vermeiden 

Hochverfügbarkeit  

Sie bezeichnet die Fähigkeit eines Systems, trotz Ausfalls einer seiner Komponenten mit einer hohen Wahrscheinlichkeit (oft 99,99 Prozent oder mehr) den Betrieb zu gewährleisten. In den meisten Fällen laufen hochverfügbare Systeme rund um die Uhr.   

Log Shipping  

Es nutzt die Tatsache, dass eine Datenbank aus zwei unterschiedlichen Teilen besteht, den Daten und dem Transaktionslog. Alle Aktionen werden auf den Daten ausgeführt und im Transaktionslog protokolliert. Das Prinzip des Log Shippings beruht darauf, dass nur die Änderungen im Protokoll als Backup auf einer zweiten Datenbank gesichert werden, nicht die Dateien selbst. Das spart Speicherplatz und die Daten können bei Bedarf anhand des Protokolls auf einem anderen Server wiederhergestellt werden. Diese Technik wird von mehreren MSSQL-Server-Versionen unterstützt.  

Failover-System 

Ein Failover-System ist ein Zusammenschluss von mindestens zwei Computern. Beim Ausfall eines Rechners übernimmt ein zweiter Rechner die Aufgabe des ersten. Das Prinzip funktioniert nach der Einteilung in passiv und aktiv. Aktiv ist das Primärsystem, die wartenden passiven Server sind die Backup-Systeme.   

Datenbank Beratung

Architektur und Infrastruktur

Der Betrieb und die Pflege von Datenbanken ist voller Herausforderungen. Wir haben die Antworten. Denn wir verfügen über erfahrene Db2-, Oracle-, MSSQL- und PostgreSQL-Spezialisten für die Plattformen z/OS, Linux, Unix und Windows, die Ihnen bei allen Problemen helfen können. Sie haben beispielsweise Db2 schon lange im Einsatz und Ihr Team ist für das Tagesgeschäft gut eingespielt. Doch nun wollen Sie Ihre SAP-Datenbank vom Host auf UNIX migrieren und Ihre Mitarbeiter wissen nicht wie. Dabei beraten und unterstützen Sie die Spezialisten von ITGAIN. Wir entwickeln Infrastrukturpläne, stellen Infrastruktur bereit, lösen Fragen der Ausfallsicherheit, untersuchen und Lösen Performance-Probleme und vieles mehr.
Vielleicht brauchen Sie auch einen Coach oder eine Schulung in Datenbank-Fragen? Diesen Part übernehmen wir natürlich auch!

Managed Database Services

Managed Services

Mit dem Managed Database Service bietet Ihnen ITGAIN einen umfassenden Baukasten für den Remotebetrieb von Datenbanksystemen: Im Teamwork mit Ihnen definieren unsere Experten einen Leistungskatalog. Er dient als Basis für den Datenbankbetrieb. Das Leistungsspektrum reicht von der reinen Überwachung der Systeme bis hin zum vollständigen Betrieb inklusive Patch- und Problemmanagement. Ihre Vorteile?
Bestehende Betriebsprozesse bleiben erhalten. Unseren Einsatz können Sie außerhalb Ihrer Kernarbeitszeiten planen. Sie profitieren von gesteigerter Verfügbarkeit und höherer Performance Ihrer Datenbanksysteme. Ihre Administratoren werden entlastet. Und der Betrieb ihrer Datenbanksysteme ist auch in der Ferienzeit oder bei Krankheitsfällen gesichert.

Datenbank Architektur

Architektur und Infrastruktur

Wir sind Datenbankarchitekten und Performancespezialisten. Wir beraten, betreiben aber auch hunderte von Datenbanken innerhalb unseres Managed Database Service, stellen eigene Datenbank-Performance-Lösungen her und vertreiben sie weltweit. Deswegen wissen wir genau, welcher Typ Datenbank für Sie optimal ist. NoSQL oder Big-Data-Architekturen beispielsweise bieten in bestimmten Szenarien deutliche Vorteile gegenüber relationalen Datenbanken. Open-Source wie PostgreSQL ist eine echte Alternative, wenn es um stabile und performante Verfügbarkeit von Unternehmensdaten geht. Nutzen Sie unsere Erfahrung aus unzähligen heterogenen Projekten und entwickeln Sie mit uns die passende Lösung!

Neueste Stories