Overbooking
Overbooking: Ich tue so als ob ich mehr Resourcen zur Verfügung habe als das sie real vorhanden sind. Wird gerne - und kann man auch ohne Probleme bei entsprechender Kontrolle und Planung - im Bereich der Virtualisierung gemacht.
Es ist - mal wieder - Unternehmen-A. Wieder mal der Datenbank-Server. Dieses Mal mit sehr merkwürdigem Verhalten, wie z.B. das Clients mitten in der Arbeit rausfliegen. Und zwar immer dann wenn mehr als ca 20 Mitarbeiter_innen im System angemeldet sind. Ein erster Blick auf den DB-Server - sieht alles normal aus. Ein zweiter Blick in die Logfiles zeigte dann, das da irgendwas mit dem Arbeitsspeicher nicht stimmte. Lauf der IT von Unternehmen-A wäre das unser Problem, da unsere Anwendung ja die Sch… machen würde. Oookayy - damit war der Grundton für die Unterhaltung gesetzt.
Ich schrieb eine Mail an die IT - und an ein paar Entscheider weiter oben - ich hätte gerne mal die Auslastungsdiagramme der Virtualisierungsumgebung für die letzten 2 Tage. Es kamen zurück ein paar zusammengefrickelte und unvollständige Screenshots. Dazu die Ansage das wir uns gefälligst sputen sollen, man könne ja schließlich nicht arbeiten. Mein freundlicher Hinweis das es nach einem Problem der Virtualisierungsumgebung aussieht - den hat man mit einem “Unverschämtheit, wir wissen was wir tun” abgetan. Schön das die Antwort an alle ging - sicher ist sicher.
Wir konnten uns das Verhalten nicht erklären - ich nahm Kontakt zu unseren Entwicklern auf “Sagt mal - ihr spracht neulich von einem Benchmark-Tool, das ihr mal geschrieben habt. Kann ich das bitte mal haben?” Ich bekam das Tool, fuhr nach Hause und installierte das Tool auf 2 Laptops mit Windows, installierte auf einem alten Rechner mit 4 GB RAM ein Linux, eine DB zum spielen - und schraubte auf den beiden Windows-Murmeln die Anfragen immer weiter hoch, bis diese von sich aus schon anfingen zu kotzen. Der einzige, der sich nicht aus der Ruhe bringen lassen hat war der alte Rechner - der hat geswapt, keinen freien RAM mehr gehabt - aber da wo es ging wurden die DB-Queries immer noch ausgeführt. Nur - den Fehler von Unternehmen-A - den sah ich nicht.
Montag Morgen, Telefonkonferenz mit Unternehmen-A: Alles wieder ruhig, alles läuft, alles kein Problem, man bedankte sich für den Einsatz und verschwand aus der TelCo.
Supporter und ich saßen da mit Fragezeichen “WTF war das jetzt?!” Circa 2 Monate später haben wir es erfahren: Man hat den virtuellen Maschinen RAM garantiert - dabei allerdings ein 3:1 Overbooking betrieben. Das geht so lange gut, bis die Maschinen den garantierten RAM wirklich anfordern - den letzten beißen die Hunde. Man hatte - als das anfing - einen neuen SAP-Client und diverse andere neue Software ausgerollt - damit ist der RAM-Bedarf der Worker-Server durch die Decke gegangen. Somit blieb für den DB-Server nur der Griff in's leere…