19. März 2018 - Sebastian Evers
Speichermedium mit Datenverlust:
Zur Wiederherstellung spezifizierte Daten:
Ein hochwichtiger RAID Server aus dem Storage Area Network eines archivarischen Konglomerats war nicht mehr erreichbar. Der Datenbank Server enthielt zwei RAID 5 Verbunde; jedes RAID 5 enthielt jeweils ein logisches Laufwerk und ein RAID war offline. Das ausgefallene RAID 5 Volumen enthielt die Datenbankanwendung und die Datensicherungen davon. Das Produktivsystem war nicht mehr erreichbar nachdem zwei Festplatten ausgefallen waren. Nur noch drei der insgesamt fünf im RAID involvierten Festplatten wurden vom Controller mit "good" ausgegeben.
In Summe waren mit der bereits eingesprungen Hot-Spare drei Datenträger ausgefallen. Der Ausfall der ersten Festplatte war unbemerkt geblieben und lag laut Log bereits einige Monate zurück. Zudem musste festgestellt werden, dass das zweite RAID 5 keinen identischen - beziehungsweise ausreichend aktuellen - Datenbestand enthielt. Es bestand dringlicher Handlungsbedarf und Attingo wurde mit der rund-um-die-Uhr Bearbeitung im Notfall-Datenrettungs-Service beauftragt.
Der komplette RAID 5 Server wurde noch in derselben Nacht von unserem Kurierpartner in unser Labor transportiert. Die Technik konnte bei allen drei ausgefallenen Festplatten physische Defekte diagnostizieren. Die beiden relevanten defekten Festplatten konnten im Reinraumlabor aufbereitet, temporär instand gesetzt und die Rohdaten fast hundertprozentig ausgelesen werden.
Im nächsten Schritt wurden 1 zu 1 Klone der Kundenfestplatten generiert, mit denen der ursprüngliche RAID Verbund in Folge rekonstruiert werden konnte. Das RAID 5 enthielt ein logisches Laufwerk (logical drive) mit zwei logischen Volumen (logical volume). In den logischen Volumen lagen die virtuellen Veritas Maschinen mit UFS Dateisystem und darin waren die gesuchten Sybase Datenbankdateien abgelegt. Die beiden logischen Volumes wurden extrahiert und auf physischen Datenträgern zur Verfügung gestellt.
Beim nachfolgenden Support und Nachbesprechungen zur Wiedereinbindung der rekonstruierten Daten mit der Kundentechnik wurde uns mitgeteilt, dass das gesamte System über einen langen Zeitraum hinweg nicht wie angedacht gelaufen und beaufsichtigt worden war. Die Datensicherungsfunktionen waren abgeschaltet, die E-Mailbenachrichtigungen durch den RAID-Controller waren allesamt deaktiviert und eine regelmäßige Überprüfung des Systems hatte ebenfalls nicht stattgefunden.