Manual Linux Rescue System
Aus EUserv Wiki
Dise1 (Diskussion | Beiträge) (→Technische Limitierungen) |
Seki1 (Diskussion | Beiträge) (→Überprüfen des Arbeitsspeichers) |
||
(Der Versionsvergleich bezieht 18 dazwischenliegende Versionen mit ein.) | |||
Zeile 1: | Zeile 1: | ||
{{Languages|Manual Linux Rescue System}} | {{Languages|Manual Linux Rescue System}} | ||
+ | [[Kategorie:Rescue-System]] | ||
[[Kategorie:Server]] | [[Kategorie:Server]] | ||
Zeile 524: | Zeile 525: | ||
== Prüfen des Filesystems eines Hardware-RAIDs auf Fehler == | == Prüfen des Filesystems eines Hardware-RAIDs auf Fehler == | ||
+ | |||
+ | |||
+ | = Konvertieren eines Filesystems = | ||
+ | == Konvertieren von ext3 auf ext4 == | ||
+ | |||
+ | === Vorbereitung === | ||
+ | |||
+ | Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, darf das Dateisystem nicht eingehängt sein. Sollte das Root-Dateisystem konvertiert werden, so muss dies im Rescue-System durchgeführt werden. | ||
+ | Alle anderen Partitionen, welche zur Konvertierung ausgehangen werden können, benötigen diesen Schritt nicht zwingend. | ||
+ | Für die Konvertierung werden dem ext3-Dateisystem, die spezifischen ext4 Erweiterungen/Eigenschaften hinzugefügt und danach ein zwingend nötiger Dateisystemcheck durchgeführt. | ||
+ | |||
+ | Gehen Sie zur Vorbereitung wie folgt vor: | ||
+ | |||
+ | * Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie [[Kundencenter_Server_Rescue_System | hier]]. | ||
+ | * Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch. | ||
+ | * Ermitteln Sie die genaue Bezeichnung der zu konvertierenden Partition mittels folgender Befehle: | ||
+ | |||
+ | <pre> | ||
+ | fdisk -l | ||
+ | blkid | ||
+ | </pre> | ||
+ | |||
+ | Mit dem ersten Befehl erhalten Sie eine Ausgabe aller Festplatten und deren Partitionen. Der Befehl '''blkid''' gibt die einzigartigen IDs aller Partitionen aus. | ||
+ | |||
+ | '''Hinweis: Die zu ändernde Partition darf bei dem Dateisystemcheck nicht eingehängt sein!''' | ||
+ | |||
+ | === Durchführung === | ||
+ | |||
+ | Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, gehen Sie wie folgt vor: | ||
+ | |||
+ | * Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu: | ||
+ | |||
+ | <pre> | ||
+ | tune2fs -O extents,uninit_bg,dir_index /dev/<Gerätedatei> | ||
+ | </pre> | ||
+ | |||
+ | Für <Gerätedatei> setzen Sie die gerade ermittelte Bezeichnung ein. | ||
+ | |||
+ | * Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch ('''Hinweis: Die Partition darf nicht eingehängt sein!'''): | ||
+ | |||
+ | <pre> | ||
+ | fsck -fCVD /dev/<Gerätedatei> | ||
+ | </pre> | ||
+ | |||
+ | * Mit folgendem Befehl mounten Sie nun die Partition: | ||
+ | |||
+ | <pre> | ||
+ | mount /dev/<Gerätedatei> /mnt | ||
+ | </pre> | ||
+ | |||
+ | Für <Gerätedatei> setzen Sie hier die Bezeichnung der (Root-) Partiton ein. | ||
+ | |||
+ | * Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano. | ||
+ | * Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4": | ||
+ | |||
+ | <pre> | ||
+ | /dev/<Gerätedatei> / ext4 relatime 0 1 | ||
+ | </pre> | ||
+ | |||
+ | * Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal". | ||
+ | |||
+ | Nun wird ab sofort das ext4-Dateisystem genutzt. | ||
+ | |||
+ | |||
+ | === Beispiel === | ||
+ | |||
+ | Im folgenden Beispiel, führen wir die Konvertierung der Root-Partition basierend auf der EUserv Standardpartitionierung durch. Die Standardpartitionierung nutzt für die Root-Partition /dev/sda3 bei Standard Partitionierung bzw. /dev/sda4 bei GPT Partitionierung. In diesem Beispiel nehmen wir die Standard-Partitionierung an. Dabei gehen Sie wie folgt vor: | ||
+ | |||
+ | * Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie [[Kundencenter_Server_Rescue_System | hier]]. | ||
+ | * Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch. | ||
+ | * Prüfen Sie, ob die Partionierung mit der o.g. Standardpartitionierung übereinstimt, bevor Sie weitere Schritte durchführen, geben Sie die folgenden Befehle ein: | ||
+ | |||
+ | <pre> | ||
+ | fdisk -l | ||
+ | blkid | ||
+ | </pre> | ||
+ | |||
+ | Befehl "fdisk -l" Beispielausgabe für Standard Partitionierung: | ||
+ | |||
+ | <pre> | ||
+ | Gerät boot. Anfang Ende Blöcke Id System | ||
+ | /dev/sda1 * 1 62 488281+ 83 Linux | ||
+ | /dev/sda2 62 311 2000976+ 83 Linux | ||
+ | /dev/sda3 311 933 5000977 83 Linux | ||
+ | </pre> | ||
+ | |||
+ | Befehl "blkid" Beispielausgabe für Standard Partitionierung: | ||
+ | |||
+ | <pre> | ||
+ | /dev/sda1: UUID="aa326a61-4c8c-4613-82d4-8c5a1d30d8ce" TYPE="ext2" | ||
+ | /dev/sda2: UUID="bbde6249-1b62-4fbf-b250-9075377417bd" TYPE="swap" | ||
+ | /dev/sda3: UUID="cc3b1ecf-0bb1-459d-bbcf-d80d6dba9077" TYPE="ext3" | ||
+ | </pre> | ||
+ | |||
+ | * Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu: | ||
+ | |||
+ | <pre> | ||
+ | tune2fs -O extents,uninit_bg,dir_index /dev/sda3 | ||
+ | </pre> | ||
+ | |||
+ | * Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch ('''Hinweis: Die Partition darf nicht eingehängt sein!'''): | ||
+ | |||
+ | <pre> | ||
+ | fsck -fCVD /dev/sda3 | ||
+ | </pre> | ||
+ | |||
+ | * Mit folgendem Befehl mounten Sie nun die Partition: | ||
+ | |||
+ | <pre> | ||
+ | mount /dev/sda3 /mnt | ||
+ | </pre> | ||
+ | |||
+ | * Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano. | ||
+ | * Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4": | ||
+ | |||
+ | <pre> | ||
+ | /dev/sda3 / ext4 relatime 0 1 | ||
+ | </pre> | ||
+ | |||
+ | * Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal". | ||
= Überprüfen der Festplatten = | = Überprüfen der Festplatten = | ||
Zeile 724: | Zeile 845: | ||
</pre> | </pre> | ||
- | |||
- | + | = Überprüfen des Arbeitsspeichers = | |
+ | |||
+ | Um einen Check des im Server verbauten Arbeitsspeichers durchzuführen, kann das Tool '''memtester''' verwendet werden. Das Tool steht auf dem EUserv Mirror zur Verfügung und kann unter folgendem Link bezogen werden: | ||
+ | |||
+ | http://mirror.euserv.net/misc/memtester.tar.gz | ||
+ | |||
+ | |||
+ | Um innerhalb des Rescue-Systems eine Überprüfung des Arbeitsspeichers vorzunehmen, gehen Sie bitte wie folgt vor: | ||
+ | |||
+ | * Loggen Sie sich ins Rescue-System ein | ||
+ | |||
+ | * Laden Sie '''memtester''' herunter. Nutzen Sie dafür folgenden Befehl: | ||
+ | |||
+ | <pre>wget http://mirror.euserv.net/misc/memtester.tar.gz</pre> | ||
+ | |||
+ | * Entpacken Sie das Archiv. Nutzen Sie dafür folgenden Befehl: | ||
+ | |||
+ | <pre>tar xfz memtester.tar.gz</pre> | ||
+ | |||
+ | * Wechseln Sie in das entpackte Verzeichnis. Nutzen Sie dafür folgenden Befehl: | ||
+ | |||
+ | <pre>cd memtester</pre> | ||
+ | |||
+ | * Kompilieren Sie das Programm. Nutzen Sie dafür folgenden Befehl: | ||
+ | |||
+ | <pre>make</pre> | ||
+ | |||
+ | Nun können Sie das Programm nach folgendem Muster aufrufen: | ||
+ | |||
+ | <pre>./memtester <Menge Arbeitsspeicher> <Durchläufe></pre> | ||
+ | |||
+ | |||
+ | Die Menge des Arbeitsspeichers können Sie mit dem Befehl '''free -m''' ermitteln. Der entsprechende Wert befindet sich unter der Spalte '''Total'''. | ||
+ | |||
+ | '''Beispiel:''' | ||
+ | |||
+ | <pre>total used free shared buffers cached | ||
+ | Mem: 3821 3444 376 3 1 2717 | ||
+ | -/+ buffers/cache: 724 3096 | ||
+ | Swap: 1953 5 1947</pre> | ||
+ | |||
+ | Um den Arbeitsspeicher nun zweimal zu prüfen, nutzen Sie folgenden Befehl: | ||
- | + | <pre>./memtester 3821 2</pre> |
Aktuelle Version vom 07:14, 15. Jan. 2020
Languages: |
Deutsch • English |
Benutzung des Linux Rescue-Systems
Benutzung des Linux Rescue-Systems
Aktivierung des Linux Rescue-Systems
Um das Linux Rescue-System nutzen zu können, müssen Sie dieses erst über das Kundencenter aktivieren. Wie die Aktivierung erfolgt, können Sie der folgenden Wiki-Anleitung entnehmen:
Verbinden mit dem Linux Rescue-System
Nach der Aktivierung des Linux Rescue-systems, können Sie sich mit diesem verbinden. Hier finden Sie eine Wiki-Anleitung dazu:
Verbinden mit dem Rescue-System
Zurücksetzen des root-Passwortes
Vorbereitung
Um das root-Passwort zu ändern, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
Durchführung
Gehen Sie wie folgt vor um das root-Passwort zu ändern:
- Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):
mount /dev/sdaX /mnt/custom //(Root-Partition) mount /dev/sdaX /mnt/custom/boot //(Boot-Partition) cd /mnt/custom mount --bind /dev dev mount --bind /sys sys mount --bind /proc proc chroot . /bin/bash
- Geben Sie folgenden Befehl als root-Benutzer ein:
passwd
- Geben Sie das neue Passwort ein.
- Geben Sie wiederholt das neue Passwort ein.
- Verlassen Sie nun die chroot-Umgebung und unmounten Sie die Partitionen:
exit umount dev sys proc boot cd .. umount custom
- Deaktivieren Sie über das Kundencenter das Rescue-System.
- Führen Sie über das Kundencenter einen Webreset aus.
Sie haben nun erfolgreich das root-Passwort geändert. Sie können sich nun unter dem neu vergebenen Passwort mit Ihrem System verbinden.
Deaktivieren der Firewall
Vorbereitung
Um die Firewall zu deaktivieren, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
Durchführung
Gehen Sie wie folgt vor um die Firewall zu deaktivieren:
- Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):
mount /dev/sdaX /mnt/custom //(Root-Partition) mount /dev/sdaX /mnt/custom/boot //(Boot-Partition) cd /mnt/custom mount --bind /dev dev mount --bind /sys sys mount --bind /proc proc chroot . /bin/bash
CentOS/Red Hat/Fedora
Geben Sie den folgenden Befehl als root-User ein:
chkconfig --level 2345 iptables off
Debian/Ubuntu
Geben Sie den folgenden Befehl als root-User ein:
update-rc.d -f iptables remove
Wiederherstellen eines fehlerhaften Software-RAID
Prüfung auf MBR-/GPT-Partitionierung
Um zu prüfen, welches Format der Partitionstabellen bei Ihren Festplatten vorliegt, gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
- Prüfen Sie das Format der Partitionstabelle Ihrer Festplatte mit folgendem Befehl (Ersetzen Sie X durch die zu prüfende Festplatte):
parted -s /dev/sdX print
Folgende Ausgabe weist darauf hin, dass die Partitionstabelle das Format MBR hat:
Partition Table: mbr
Folgende Ausgabe weist darauf hin, dass die Partitionstabelle das Format GPT hat:
Partition Table: gpt
RAID1 mit MBR-Partitionierung
Vorbereitung
Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
- Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
- Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat
Eine RAID1-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.
Eine Beispielausgabe:
Personalities : [raid1] md3 : active raid1 sda4[0] sdb4[1] 1847608639 blocks super 1.2 [2/2] [UU] md2 : active raid1 sda3[0] sdb3[1] 1073740664 blocks super 1.2 [2/2] [UU] md1 : active raid1 sda2[0] sdb2[1] 524276 blocks super 1.2 [2/2] [UU] md0 : active raid1 sda1[0] sdb1[1] 8387572 blocks super 1.2 [2/2] [UU] unused devices: <none>
Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.
Eine Beispielausgabe:
Personalities : [raid1] md3 : active raid1 sda4[0] 1843414335 blocks super 1.2 [2/1] [U_] md2 : active raid1 sda3[0] 1073740664 blocks super 1.2 [2/1] [U_] md1 : active raid1 sda2[0] 524276 blocks super 1.2 [2/1] [U_] md0 : active raid1 sda1[0] 12581816 blocks super 1.2 [2/1] [U_] unused devices: <none>
In diesem Bespiel werden die Partitionen auf der zweiten Festplatte sdb nicht angezeigt. Es ist von einem Festplattendefekt auszugehen.
Durchführung
Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:
- Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):
sfdisk -d /dev/sda | sfdisk /dev/sdb
- Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:
sfdisk -R /dev/sdb
- Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:
cat /proc/partitions
- Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdb1 mdadm /dev/md1 -a /dev/sdb2 mdadm /dev/md2 -a /dev/sdb3 mdadm /dev/md3 -a /dev/sdb4
Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:
cat /proc/mdstat
RAID1 mit GPT-Partitionierung
Vorbereitung
Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
- Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
- Prüfen Sie den Zustand des Software-Raids mit folgendem Befehl:
cat /proc/mdstat
Eine RAID1-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.
Eine Beispielausgabe:
Personalities : [raid1] md3 : active raid1 sda4[0] sdb4[1] 1847608639 blocks super 1.2 [2/2] [UU] md2 : active raid1 sda3[0] sdb3[1] 1073740664 blocks super 1.2 [2/2] [UU] md1 : active raid1 sda2[0] sdb2[1] 524276 blocks super 1.2 [2/2] [UU] md0 : active raid1 sda1[0] sdb1[1] 8387572 blocks super 1.2 [2/2] [UU] unused devices: <none>
Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.
Eine Beispielausgabe:
Personalities : [raid1] md3 : active raid1 sda4[0] 1843414335 blocks super 1.2 [2/1] [U_] md2 : active raid1 sda3[0] 1073740664 blocks super 1.2 [2/1] [U_] md1 : active raid1 sda2[0] 524276 blocks super 1.2 [2/1] [U_] md0 : active raid1 sda1[0] 12581816 blocks super 1.2 [2/1] [U_] unused devices: <none>
In diesem Bespiel werden die Partitionen auf der zweiten Festplatte sdb nicht angezeigt. Es ist von einem Festplattendefekt auszugehen.
Durchführung
Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:
- Geben Sie folgenden Befehl ein, um die Partitionstabelle von sda auf die neue Festplatte sdb zu kopieren:
sgdisk -R /dev/sdb /dev/sda
- Vergeben Sie der Festplatte eine neue zufällig UUID:
sgdisk -G /dev/sdb
- Nun kann die Festplatte wieder in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdb1 mdadm /dev/md1 -a /dev/sdb2 mdadm /dev/md2 -a /dev/sdb3 mdadm /dev/md3 -a /dev/sdb4
Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:
cat /proc/mdstat
RAID5/6 mit MBR-Partitionierung
Vorbereitung
Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
- Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
- Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat
Eine RAID5-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.
Eine Beispielausgabe:
Personalities : [raid1] [raid6] [raid5] [raid4] md0 : active raid5 sda7[0] sdc7[2] sdb7[1] 5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]
Eine RAID5-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.
Eine Beispielausgabe:
Personalities : [raid1] [raid6] [raid5] [raid4] md0 : active raid5 sda7[0] sdc7[2] sdb7[1] 5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [UUU_]
In diesem Bespiel fehlt die vierte Platte im RAID5-Verbund.
Durchführung
Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:
- Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):
sfdisk -d /dev/sda | sfdisk /dev/sdd
- Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:
sfdisk -R /dev/sdd
- Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:
cat /proc/partitions
- Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdd1 mdadm /dev/md1 -a /dev/sdd2 mdadm /dev/md2 -a /dev/sdd3 mdadm /dev/md3 -a /dev/sdd4
Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:
cat /proc/mdstat
RAID5/6 mit GPT-Partitionierung
Vorbereitung
Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
- Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
- Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat
Eine RAID5-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.
Eine Beispielausgabe:
Personalities : [raid1] [raid6] [raid5] [raid4] md0 : active raid5 sda7[0] sdc7[2] sdb7[1] 5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]
Eine RAID5-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.
Eine Beispielausgabe:
Personalities : [raid1] [raid6] [raid5] [raid4] md0 : active raid5 sda7[0] sdc7[2] sdb7[1] 5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [UUU_]
In diesem Beispiel fehlt die vierte Platte im RAID5-Verbund.
Durchführung
Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:
- Geben Sie folgenden Befehl ein, um die Partitionstabelle von sda auf die neue Festplatte sdd zu kopieren:
sgdisk -R /dev/sdd /dev/sda
- Vergeben Sie der Festplatte eine neue zufällig UUID:
sgdisk -G /dev/sdd
- Nun kann die Festplatte wieder in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdd1 mdadm /dev/md1 -a /dev/sdd2 mdadm /dev/md2 -a /dev/sdd3 mdadm /dev/md3 -a /dev/sdd4
Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:
cat /proc/mdstat
Prüfen/Wiederherstellen eines fehlerhaften Filesystems
Prüfen/Wiederherstellen des Filesystems einer physischen HDD auf Fehler
Um das Filesystem einer physischen HDD auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):
fsck /dev/sdX
fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.
Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!
Prüfen auf benutzten Filesystem-Typ
Geben Sie folgenden Befehl ein, um zu prüfen welcher Filesystem-Typ benutzt wird (Ersetzen Sie X durch die entsprechende Partition):
parted -s /dev/sdX print
ext2/3/4
Um nun das fehlerhafte Filesystem vom Typ ext2/3/4 wiederherzustellen, geben Sie folgenden Befehl ein (Ersetzen Sie X für die entsprechende Partition):
fsck.ext3 /dev/sdX fsck.ext2 /dev/sdX ...
xfs
Um nun das fehlerhafte Filesystem vom Typ xfs wiederherzustellen, geben Sie die folgenden Befehle ein (Ersetzen Sie X durch die entsprechende Partition):
xfs_check /dev/sdX
xfs_repair /dev/sdX
Prüfen des Filesystems eines Software-RAIDs auf Fehler
Um das Filesystem eines Software-RAIDs auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):
fsck /dev/mdX
fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.
Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!
Prüfen des Filesystems eines Hardware-RAIDs auf Fehler
Konvertieren eines Filesystems
Konvertieren von ext3 auf ext4
Vorbereitung
Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, darf das Dateisystem nicht eingehängt sein. Sollte das Root-Dateisystem konvertiert werden, so muss dies im Rescue-System durchgeführt werden. Alle anderen Partitionen, welche zur Konvertierung ausgehangen werden können, benötigen diesen Schritt nicht zwingend. Für die Konvertierung werden dem ext3-Dateisystem, die spezifischen ext4 Erweiterungen/Eigenschaften hinzugefügt und danach ein zwingend nötiger Dateisystemcheck durchgeführt.
Gehen Sie zur Vorbereitung wie folgt vor:
- Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie hier.
- Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch.
- Ermitteln Sie die genaue Bezeichnung der zu konvertierenden Partition mittels folgender Befehle:
fdisk -l blkid
Mit dem ersten Befehl erhalten Sie eine Ausgabe aller Festplatten und deren Partitionen. Der Befehl blkid gibt die einzigartigen IDs aller Partitionen aus.
Hinweis: Die zu ändernde Partition darf bei dem Dateisystemcheck nicht eingehängt sein!
Durchführung
Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, gehen Sie wie folgt vor:
- Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu:
tune2fs -O extents,uninit_bg,dir_index /dev/<Gerätedatei>
Für <Gerätedatei> setzen Sie die gerade ermittelte Bezeichnung ein.
- Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch (Hinweis: Die Partition darf nicht eingehängt sein!):
fsck -fCVD /dev/<Gerätedatei>
- Mit folgendem Befehl mounten Sie nun die Partition:
mount /dev/<Gerätedatei> /mnt
Für <Gerätedatei> setzen Sie hier die Bezeichnung der (Root-) Partiton ein.
- Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano.
- Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4":
/dev/<Gerätedatei> / ext4 relatime 0 1
- Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal".
Nun wird ab sofort das ext4-Dateisystem genutzt.
Beispiel
Im folgenden Beispiel, führen wir die Konvertierung der Root-Partition basierend auf der EUserv Standardpartitionierung durch. Die Standardpartitionierung nutzt für die Root-Partition /dev/sda3 bei Standard Partitionierung bzw. /dev/sda4 bei GPT Partitionierung. In diesem Beispiel nehmen wir die Standard-Partitionierung an. Dabei gehen Sie wie folgt vor:
- Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie hier.
- Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch.
- Prüfen Sie, ob die Partionierung mit der o.g. Standardpartitionierung übereinstimt, bevor Sie weitere Schritte durchführen, geben Sie die folgenden Befehle ein:
fdisk -l blkid
Befehl "fdisk -l" Beispielausgabe für Standard Partitionierung:
Gerät boot. Anfang Ende Blöcke Id System /dev/sda1 * 1 62 488281+ 83 Linux /dev/sda2 62 311 2000976+ 83 Linux /dev/sda3 311 933 5000977 83 Linux
Befehl "blkid" Beispielausgabe für Standard Partitionierung:
/dev/sda1: UUID="aa326a61-4c8c-4613-82d4-8c5a1d30d8ce" TYPE="ext2" /dev/sda2: UUID="bbde6249-1b62-4fbf-b250-9075377417bd" TYPE="swap" /dev/sda3: UUID="cc3b1ecf-0bb1-459d-bbcf-d80d6dba9077" TYPE="ext3"
- Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu:
tune2fs -O extents,uninit_bg,dir_index /dev/sda3
- Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch (Hinweis: Die Partition darf nicht eingehängt sein!):
fsck -fCVD /dev/sda3
- Mit folgendem Befehl mounten Sie nun die Partition:
mount /dev/sda3 /mnt
- Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano.
- Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4":
/dev/sda3 / ext4 relatime 0 1
- Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal".
Überprüfen der Festplatten
Um die Festplatten auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
HDD-Check mit smartctl / smartmontools
HDD-Check mit smartctl / smartmontools für normale Festplatten
Um mittels smartmontools ein Festplatten-Check durchzuführen, gehen Sie wie folgt vor:
- Starten Sie mittels folgenden Befehls einen kurzen Festplatten-Check (Ersetzen Sie X durch die entsprechende Festplatte):
smartctl -t short /dev/sdX
- Starten Sie mit dem folgenden Befehl einen langen Festplatten-Check (dieser dauert abhängig von der Kapazität der Festplatte 1 bis 6 Stunden):
smartctl -t long /dev/sdX
HDD-Check mit smartctl / smartmontools für Festplatten an HW-Controllern
Um mittels smartmontools eine Überprüfung für Festplatten an 3Ware HW-RAID-Controllern durchzuführen, gehen Sie wie folgt vor:
- Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):
smartctl -d 3ware,X -t short /dev/twa0
- Geben Sie folgenden Befehl ein, um einen langen Festplatten-Check zu starten:
smartctl -d 3ware,X -t long /dev/twa0
Auswertung der Ergebnisse
Geben Sie folgenden Befehl ein, um sich das Ergebnis des Festplatten-Tests anzeigen zu lassen:
smartctl -l selftest /dev/sdX
Das folgende Ausgabebeispiel zeigt, dass der Festplatten-Check erfolgreich war:
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 4970 # 2 Long offline Completed without error 00% 4972
Dieses Ausgabebeispiel zeigt, dass der Festplatten-Check nicht erfolgreich war:
=== START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed: read failure 20% 717 555027747
Melden von Fehlern beim Support
Melden von Fehlern beim Support bei normalen Festplatten
Um den Fehler der Festplatte beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:
smartctl -a /dev/sdX
Melden von Fehlern beim Support bei Festplatten an HW-RAID-Controllern
Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an (Ersetzen Sie dabei X für den entsprechenden Controller-Port, an welchem die Festplatte angeschlossen ist):
smartctl -d 3ware,X -a /dev/twa0
Hardware-RAID
Grundlagen / Allgemeine Informationen
Überprüfen des Status des Controllers
3ware-RAID-Controller
Um den Status des 3ware-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
- Geben Sie den folgenden Befehl ein, um zunächst die ID des Controllers festzustellen (diese ist in der Regel 0) :
dmesg | grep 3ware
Es erscheint folgende Beispielausgabe (die Zahl hinter scsi ist die Controller-ID):
[ 5.487015] scsi4 : 3ware 9000 Storage Controller
- Geben Sie folgenden Befehl ein, um die Informationen des HW-Controllers auszulesen (Ersetzen Sie X durch die entsprechende Controller-ID):
tw_cli /cX show
Es können folgende Beispielausgaben erscheinen:
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy ------------------------------------------------------------------------------ u0 RAID-1 OK - - - 149.001 RiW ON VPort Status Unit Size Type Phy Encl-Slot Model ------------------------------------------------------------------------------ p0 OK u0 149.05 GB SATA 0 - SAMSUNG HD160JJ p1 OK u0 149.05 GB SATA 1 - SAMSUNG HD160JJ
In diesem Fall ist das RAID in einwandfreiem Zustand, erkennbar durch den Status OK.
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB) ------------------------------------------------------------------------ u0 RAID-1 REBUILDING 23% - - - 149.001 u0-0 DISK DEGRADED - - p0 - 149.001 u0-1 DISK OK - - p1 - 149.001 u0/v0 Volume - - - - - 149.001
In diesem Fall führt das Hardware-RAID ein Rebuild durch, erkennbar durch den Status REBUILDING. Die problematische Festplatte ist in diesem Fall die am Port 0 angeschlossene Festplatte (Status DEGRADED).
LSI-RAID-Controller
Um den Status des LSI-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:
- Aktivieren Sie das Rescue-System über das Kundencenter.
- Verbinden Sie sich über SSH mit dem Rescue-System.
- Geben Sie den folgenden Befehl ein:
megacli -AdpAllInfo -aAll
Es erscheint nun eine Ausgabe an Informationen zum LSI-Controller.
Überprüfen des Status der Festplatten
3ware-RAID-Controller
Um mittels smartmontools eine Überprüfung des Status der Festplatten an 3ware-HW-Controllern durchzuführen, gehen Sie wie folgt vor:
- Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):
smartctl -d 3ware,X -a /dev/twa0
LSI-Controller
Um mittels smartmontools eine Überprüfung des Status der Festplatten an LSI-HW-Controllern durchzuführen, gehen Sie wie folgt vor:
- Geben Sie folgenden Befehl ein, um die Device ID der Festplatte am RAID-Controller herauszufinden (Diese kann über die StorCLI angezeigt werden (Spalte DID).:
storcli /c0 /eall /sall show
- Mittels folgenden Befehls können Sie auf die Festplatten per smartctl zugreifen (Ersetzen Sie <X> durch die entsprechende Festplatte und <N> durch die Device ID):
smartctl -a -d megaraid,N /dev/sdX
Melden von Fehlern beim Support
3ware-RAID-Controller
Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:
smartctl -d 3ware,X -a /dev/twa0
LSI-Controller
Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:
smartctl -a -d megaraid,N /dev/sdX
Überprüfen des Arbeitsspeichers
Um einen Check des im Server verbauten Arbeitsspeichers durchzuführen, kann das Tool memtester verwendet werden. Das Tool steht auf dem EUserv Mirror zur Verfügung und kann unter folgendem Link bezogen werden:
http://mirror.euserv.net/misc/memtester.tar.gz
Um innerhalb des Rescue-Systems eine Überprüfung des Arbeitsspeichers vorzunehmen, gehen Sie bitte wie folgt vor:
- Loggen Sie sich ins Rescue-System ein
- Laden Sie memtester herunter. Nutzen Sie dafür folgenden Befehl:
wget http://mirror.euserv.net/misc/memtester.tar.gz
- Entpacken Sie das Archiv. Nutzen Sie dafür folgenden Befehl:
tar xfz memtester.tar.gz
- Wechseln Sie in das entpackte Verzeichnis. Nutzen Sie dafür folgenden Befehl:
cd memtester
- Kompilieren Sie das Programm. Nutzen Sie dafür folgenden Befehl:
make
Nun können Sie das Programm nach folgendem Muster aufrufen:
./memtester <Menge Arbeitsspeicher> <Durchläufe>
Die Menge des Arbeitsspeichers können Sie mit dem Befehl free -m ermitteln. Der entsprechende Wert befindet sich unter der Spalte Total.
Beispiel:
total used free shared buffers cached Mem: 3821 3444 376 3 1 2717 -/+ buffers/cache: 724 3096 Swap: 1953 5 1947
Um den Arbeitsspeicher nun zweimal zu prüfen, nutzen Sie folgenden Befehl:
./memtester 3821 2