Der Dienstleiter unterhält Großbritanniens größtes Versand- und Kurierdienst-Netzwerk mit mehr als 245 Millionen Sendungen pro Jahr. Die Pakete werden nach Hause zugestellt, an den Arbeitsplatz, den Nachbarn oder einen von 4.500 Paket-Shops. Etwa 95 Prozent erreichen beim ersten Versuch ihren Empfänger.
Paketstau am „Black Friday“
Besonders viele Päckchen gehen am sogenannten „Black Friday“ Ende November raus, an dem Geschäfte und Online-Händler mit Rabatten locken. Viele Kunden freuen sich über ein Schnäppchen in der Vorweihnachtszeit. Allerdings brachte der Paketberg die Auslieferung fast zum Erliegen. Die Db2-Datenbank des Unternehmens konnte die hohe Auftragslast kaum noch bewältigen. Auch ließ sich nur schwer nachvollziehen, wo einzelne Pakete gerade waren und wann sie ausgeliefert wurden. Zudem drohte sich die Gehaltsabrechnung an die Mitarbeiter zu verzögern, die ebenfalls über das System verschickt wird.
Das Problem hatte im Management oberste Priorität. Wir hatten den Betrieb der Datenbank erst kurz zuvor übernommen und sollten die Störung als „Feuerlöscher“ möglichst rasch beheben. Das ganze Wochenende arbeitete unser Team im Drei-Schicht-Betrieb daran, das System zu stabilisieren.
In der Warteschlange
Die Ursache des Problems: Die Datenbank kam nicht mehr nach mit dem Verarbeiten hereinkommender Anfragen. Man kann das vergleichen mit einer Schlange im Supermarkt, wo Kunden – statt sich hintenanzustellen –alle nach vorn drängeln: Das System war überfordert. „Der Operator im Rechenzentrum denkt, es passiert nichts mehr, und bricht den Job ab. Aber in Wahrheit läuft er noch, sogar im gleichen Tempo“, erklärt Teamleiter Thorsten Bultmann. „Das System muss nur viel mehr Aufträge gleichzeitig verarbeiten als üblich und wird dadurch langsamer.“
Bei der Datenanalyse half uns „Speedgain“, ein Monitoring-Tool unter anderem für Db2-Datenbanken. Es zeichnet Kennzahlen und Messwerte auf, speichert, wartet und vergleicht Daten, erstellt Trendcharts und generiert Reports. Speedgain vergleicht die Performance des Systems über einen längeren Zeitraum. „Aus den Daten konnten wir schließen, dass ein Job doppelt so lange brauchte wie üblich – aber das System auch doppelt so viel zu tun hatte. Die Dauer war bei dieser Last also gar nicht ungewöhnlich“, weiß Bultmann.
Bei einem Notfalleinsatz ist es wichtig, trotz Zeitdruck gelassen zu bleiben und nicht in Hektik zu verfallen.“
Thorsten Bultmann, Teamleiter Managed Database Service
Erfolgreiches Performance-Tuning
Anhand grafischer Charts erklärten wir dem Management, dass Datenbank und Server prinzipiell funktionierten und das System nur überlastet war. Gleichzeitig drehten wir an vielen kleinen Stellschrauben, um die Performance der Datenbank zu verbessern. Dazu mussten wir die Daten sichten und sinnvoll verknüpfen. Eine Herausforderung: Manche Jobs benötigten Daten aus älteren Monaten, um erfolgreich abgewickelt zu werden. Bei anderen war unklar, von welchem Server sie ausgeführt wurden. Auch hier erleichterte es uns Speedgain, einen Überblick zu bekommen, und machte uns auf Probleme aufmerksam – wie etwa SQLs, die die Performance schwächten.
Beim Überblicken des Daten-Dickichts profitierten wir von unserer langjährigen Erfahrung im Umgang mit Db2-Datenbanken. „Bei einem Notfalleinsatz ist es wichtig, trotz Zeitdruck gelassen zu bleiben und nicht in Hektik zu verfallen“, weiß Thorsten Bultmann.
Unsere Geduld wurde belohnt: Nach dem Black Friday hellte sich die Stimmung bei dem Dienstleister zu Wochenbeginn auf. Betriebssystem und Paketversand liefen wieder wie gewohnt schnell und zuverlässig.
Unsere zentralen Leistungen
- „Feuerlöscher“ mit langjähriger Erfahrung, um das Problem innerhalb kurzer Zeit zu erkennen und zu lösen
- dauerbesetzte Telefonschaltung und Komplettservice rund um die Uhr: 7 x 24 Stunden
- Speedgain als Monitoring-Tool für Db2-Datenbanken, das Kennzahlen und Messwerte aufzeichnet und mit anschaulichen Grafiken und Reports vergleichbar macht