Aus EUserv Wiki

(Unterschied zwischen Versionen)

Wechseln zu: Navigation, Suche

Aktuelle Version vom 07:14, 15. Jan. 2020

Languages:

Deutsch • English

Benutzung des Linux Rescue-Systems

Inhaltsverzeichnis

1 Aktivierung des Linux Rescue-Systems
2 Verbinden mit dem Linux Rescue-System
3 Zurücksetzen des root-Passwortes
- 3.1 Vorbereitung
- 3.2 Durchführung
4 Deaktivieren der Firewall
- 4.1 Vorbereitung
- 4.2 Durchführung
5 Wiederherstellen eines fehlerhaften Software-RAID
6 Prüfen/Wiederherstellen eines fehlerhaften Filesystems
7 Konvertieren eines Filesystems
- 7.1 Konvertieren von ext3 auf ext4
8 Überprüfen der Festplatten
9 Hardware-RAID
10 Überprüfen des Arbeitsspeichers

Benutzung des Linux Rescue-Systems

Aktivierung des Linux Rescue-Systems

Um das Linux Rescue-System nutzen zu können, müssen Sie dieses erst über das Kundencenter aktivieren. Wie die Aktivierung erfolgt, können Sie der folgenden Wiki-Anleitung entnehmen:

Rescue-System aktivieren

Verbinden mit dem Linux Rescue-System

Nach der Aktivierung des Linux Rescue-systems, können Sie sich mit diesem verbinden. Hier finden Sie eine Wiki-Anleitung dazu:

Verbinden mit dem Rescue-System

Zurücksetzen des root-Passwortes

Vorbereitung

Um das root-Passwort zu ändern, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.

Durchführung

Gehen Sie wie folgt vor um das root-Passwort zu ändern:

Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):

mount /dev/sdaX /mnt/custom          //(Root-Partition)
mount /dev/sdaX /mnt/custom/boot     //(Boot-Partition)

cd /mnt/custom

mount --bind /dev dev
mount --bind /sys sys
mount --bind /proc proc

chroot . /bin/bash

Geben Sie folgenden Befehl als root-Benutzer ein:

 passwd

Geben Sie das neue Passwort ein.
Geben Sie wiederholt das neue Passwort ein.
Verlassen Sie nun die chroot-Umgebung und unmounten Sie die Partitionen:

exit
umount dev sys proc boot
cd ..
umount custom

Deaktivieren Sie über das Kundencenter das Rescue-System.
Führen Sie über das Kundencenter einen Webreset aus.

Sie haben nun erfolgreich das root-Passwort geändert. Sie können sich nun unter dem neu vergebenen Passwort mit Ihrem System verbinden.

Deaktivieren der Firewall

Vorbereitung

Um die Firewall zu deaktivieren, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.

Durchführung

Gehen Sie wie folgt vor um die Firewall zu deaktivieren:

Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):

mount /dev/sdaX /mnt/custom          //(Root-Partition)
mount /dev/sdaX /mnt/custom/boot     //(Boot-Partition)

cd /mnt/custom

mount --bind /dev dev
mount --bind /sys sys
mount --bind /proc proc

chroot . /bin/bash

CentOS/Red Hat/Fedora

Geben Sie den folgenden Befehl als root-User ein:

chkconfig --level 2345 iptables off

Debian/Ubuntu

Geben Sie den folgenden Befehl als root-User ein:

update-rc.d -f iptables remove

Wiederherstellen eines fehlerhaften Software-RAID

Prüfung auf MBR-/GPT-Partitionierung

Um zu prüfen, welches Format der Partitionstabellen bei Ihren Festplatten vorliegt, gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.
Prüfen Sie das Format der Partitionstabelle Ihrer Festplatte mit folgendem Befehl (Ersetzen Sie X durch die zu prüfende Festplatte):

parted -s /dev/sdX print

Folgende Ausgabe weist darauf hin, dass die Partitionstabelle das Format MBR hat:

Partition Table: mbr

Folgende Ausgabe weist darauf hin, dass die Partitionstabelle das Format GPT hat:

Partition Table: gpt

RAID1 mit MBR-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.
Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:

cat /proc/mdstat

Eine RAID1-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0] sdb4[1]
      1847608639 blocks super 1.2 [2/2] [UU]
 
md2 : active raid1 sda3[0] sdb3[1]
      1073740664 blocks super 1.2 [2/2] [UU]
 
md1 : active raid1 sda2[0] sdb2[1]
      524276 blocks super 1.2 [2/2] [UU]
 
md0 : active raid1 sda1[0] sdb1[1]
      8387572 blocks super 1.2 [2/2] [UU]
 
unused devices: <none>

Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0]
      1843414335 blocks super 1.2 [2/1] [U_]

md2 : active raid1 sda3[0]
      1073740664 blocks super 1.2 [2/1] [U_]

md1 : active raid1 sda2[0]
      524276 blocks super 1.2 [2/1] [U_]

md0 : active raid1 sda1[0]
      12581816 blocks super 1.2 [2/1] [U_]

unused devices: <none>

In diesem Bespiel werden die Partitionen auf der zweiten Festplatte sdb nicht angezeigt. Es ist von einem Festplattendefekt auszugehen.

Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):

sfdisk -d /dev/sda | sfdisk /dev/sdb

Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:

sfdisk -R /dev/sdb

Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:

cat /proc/partitions

Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:

mdadm /dev/md0 -a /dev/sdb1
mdadm /dev/md1 -a /dev/sdb2
mdadm /dev/md2 -a /dev/sdb3
mdadm /dev/md3 -a /dev/sdb4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

RAID1 mit GPT-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.
Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
Prüfen Sie den Zustand des Software-Raids mit folgendem Befehl:

cat /proc/mdstat

Eine RAID1-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0] sdb4[1]
      1847608639 blocks super 1.2 [2/2] [UU]
 
md2 : active raid1 sda3[0] sdb3[1]
      1073740664 blocks super 1.2 [2/2] [UU]
 
md1 : active raid1 sda2[0] sdb2[1]
      524276 blocks super 1.2 [2/2] [UU]
 
md0 : active raid1 sda1[0] sdb1[1]
      8387572 blocks super 1.2 [2/2] [UU]
 
unused devices: <none>

Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0]
      1843414335 blocks super 1.2 [2/1] [U_]

md2 : active raid1 sda3[0]
      1073740664 blocks super 1.2 [2/1] [U_]

md1 : active raid1 sda2[0]
      524276 blocks super 1.2 [2/1] [U_]

md0 : active raid1 sda1[0]
      12581816 blocks super 1.2 [2/1] [U_]

unused devices: <none>

In diesem Bespiel werden die Partitionen auf der zweiten Festplatte sdb nicht angezeigt. Es ist von einem Festplattendefekt auszugehen.

Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

Geben Sie folgenden Befehl ein, um die Partitionstabelle von sda auf die neue Festplatte sdb zu kopieren:

sgdisk -R /dev/sdb /dev/sda

Vergeben Sie der Festplatte eine neue zufällig UUID:

sgdisk -G /dev/sdb

Nun kann die Festplatte wieder in das RAID zurück eingebunden werden:

mdadm /dev/md0 -a /dev/sdb1
mdadm /dev/md1 -a /dev/sdb2
mdadm /dev/md2 -a /dev/sdb3
mdadm /dev/md3 -a /dev/sdb4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

RAID5/6 mit MBR-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.
Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:

cat /proc/mdstat

Eine RAID5-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

Eine RAID5-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [UUU_]

In diesem Bespiel fehlt die vierte Platte im RAID5-Verbund.

Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):

sfdisk -d /dev/sda | sfdisk /dev/sdd

Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:

sfdisk -R /dev/sdd

Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:

cat /proc/partitions

Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:

mdadm /dev/md0 -a /dev/sdd1
mdadm /dev/md1 -a /dev/sdd2
mdadm /dev/md2 -a /dev/sdd3
mdadm /dev/md3 -a /dev/sdd4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

RAID5/6 mit GPT-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.
Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:

cat /proc/mdstat

Eine RAID5-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

Eine RAID5-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [UUU_]

In diesem Beispiel fehlt die vierte Platte im RAID5-Verbund.

Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

Geben Sie folgenden Befehl ein, um die Partitionstabelle von sda auf die neue Festplatte sdd zu kopieren:

sgdisk -R /dev/sdd /dev/sda

Vergeben Sie der Festplatte eine neue zufällig UUID:

sgdisk -G /dev/sdd

Nun kann die Festplatte wieder in das RAID zurück eingebunden werden:

mdadm /dev/md0 -a /dev/sdd1
mdadm /dev/md1 -a /dev/sdd2
mdadm /dev/md2 -a /dev/sdd3
mdadm /dev/md3 -a /dev/sdd4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

Prüfen/Wiederherstellen eines fehlerhaften Filesystems

Prüfen/Wiederherstellen des Filesystems einer physischen HDD auf Fehler

Um das Filesystem einer physischen HDD auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.

Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):

fsck /dev/sdX

fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.

Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!

Prüfen auf benutzten Filesystem-Typ

Geben Sie folgenden Befehl ein, um zu prüfen welcher Filesystem-Typ benutzt wird (Ersetzen Sie X durch die entsprechende Partition):

parted -s /dev/sdX print

ext2/3/4

Um nun das fehlerhafte Filesystem vom Typ ext2/3/4 wiederherzustellen, geben Sie folgenden Befehl ein (Ersetzen Sie X für die entsprechende Partition):

fsck.ext3 /dev/sdX
fsck.ext2 /dev/sdX
...

xfs

Um nun das fehlerhafte Filesystem vom Typ xfs wiederherzustellen, geben Sie die folgenden Befehle ein (Ersetzen Sie X durch die entsprechende Partition):

xfs_check /dev/sdX

xfs_repair /dev/sdX

Prüfen des Filesystems eines Software-RAIDs auf Fehler

Um das Filesystem eines Software-RAIDs auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.

Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):

fsck /dev/mdX

fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.

Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!

Prüfen des Filesystems eines Hardware-RAIDs auf Fehler

Konvertieren eines Filesystems

Konvertieren von ext3 auf ext4

Vorbereitung

Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, darf das Dateisystem nicht eingehängt sein. Sollte das Root-Dateisystem konvertiert werden, so muss dies im Rescue-System durchgeführt werden. Alle anderen Partitionen, welche zur Konvertierung ausgehangen werden können, benötigen diesen Schritt nicht zwingend. Für die Konvertierung werden dem ext3-Dateisystem, die spezifischen ext4 Erweiterungen/Eigenschaften hinzugefügt und danach ein zwingend nötiger Dateisystemcheck durchgeführt.

Gehen Sie zur Vorbereitung wie folgt vor:

Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie hier.
Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch.
Ermitteln Sie die genaue Bezeichnung der zu konvertierenden Partition mittels folgender Befehle:

fdisk -l
blkid

Mit dem ersten Befehl erhalten Sie eine Ausgabe aller Festplatten und deren Partitionen. Der Befehl blkid gibt die einzigartigen IDs aller Partitionen aus.

Hinweis: Die zu ändernde Partition darf bei dem Dateisystemcheck nicht eingehängt sein!

Durchführung

Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, gehen Sie wie folgt vor:

Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu:

tune2fs -O extents,uninit_bg,dir_index /dev/<Gerätedatei>

Für <Gerätedatei> setzen Sie die gerade ermittelte Bezeichnung ein.

Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch (Hinweis: Die Partition darf nicht eingehängt sein!):

fsck -fCVD /dev/<Gerätedatei>

Mit folgendem Befehl mounten Sie nun die Partition:

mount /dev/<Gerätedatei> /mnt

Für <Gerätedatei> setzen Sie hier die Bezeichnung der (Root-) Partiton ein.

Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano.
Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4":

/dev/<Gerätedatei>    /   ext4 relatime   0   1

Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal".

Nun wird ab sofort das ext4-Dateisystem genutzt.

Beispiel

Im folgenden Beispiel, führen wir die Konvertierung der Root-Partition basierend auf der EUserv Standardpartitionierung durch. Die Standardpartitionierung nutzt für die Root-Partition /dev/sda3 bei Standard Partitionierung bzw. /dev/sda4 bei GPT Partitionierung. In diesem Beispiel nehmen wir die Standard-Partitionierung an. Dabei gehen Sie wie folgt vor:

Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie hier.
Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch.
Prüfen Sie, ob die Partionierung mit der o.g. Standardpartitionierung übereinstimt, bevor Sie weitere Schritte durchführen, geben Sie die folgenden Befehle ein:

fdisk -l
blkid

Befehl "fdisk -l" Beispielausgabe für Standard Partitionierung:

Gerät     boot.     Anfang        Ende     Blöcke   Id  System
/dev/sda1   *           1          62      488281+  83  Linux
/dev/sda2              62         311     2000976+  83  Linux
/dev/sda3             311         933     5000977   83  Linux

Befehl "blkid" Beispielausgabe für Standard Partitionierung:

/dev/sda1: UUID="aa326a61-4c8c-4613-82d4-8c5a1d30d8ce" TYPE="ext2" 
/dev/sda2: UUID="bbde6249-1b62-4fbf-b250-9075377417bd" TYPE="swap" 
/dev/sda3: UUID="cc3b1ecf-0bb1-459d-bbcf-d80d6dba9077" TYPE="ext3"

Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu:

tune2fs -O extents,uninit_bg,dir_index /dev/sda3

Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch (Hinweis: Die Partition darf nicht eingehängt sein!):

fsck -fCVD /dev/sda3

Mit folgendem Befehl mounten Sie nun die Partition:

mount /dev/sda3 /mnt

Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano.
Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4":

/dev/sda3    /   ext4 relatime   0   1

Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal".

Überprüfen der Festplatten

Um die Festplatten auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.

HDD-Check mit smartctl / smartmontools

HDD-Check mit smartctl / smartmontools für normale Festplatten

Um mittels smartmontools ein Festplatten-Check durchzuführen, gehen Sie wie folgt vor:

Starten Sie mittels folgenden Befehls einen kurzen Festplatten-Check (Ersetzen Sie X durch die entsprechende Festplatte):

smartctl -t short /dev/sdX

Starten Sie mit dem folgenden Befehl einen langen Festplatten-Check (dieser dauert abhängig von der Kapazität der Festplatte 1 bis 6 Stunden):

smartctl -t long /dev/sdX

HDD-Check mit smartctl / smartmontools für Festplatten an HW-Controllern

Um mittels smartmontools eine Überprüfung für Festplatten an 3Ware HW-RAID-Controllern durchzuführen, gehen Sie wie folgt vor:

Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):

smartctl -d 3ware,X -t short /dev/twa0

Geben Sie folgenden Befehl ein, um einen langen Festplatten-Check zu starten:

smartctl -d 3ware,X -t long /dev/twa0

Auswertung der Ergebnisse

Geben Sie folgenden Befehl ein, um sich das Ergebnis des Festplatten-Tests anzeigen zu lassen:

smartctl -l selftest /dev/sdX

Das folgende Ausgabebeispiel zeigt, dass der Festplatten-Check erfolgreich war:

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      4970         
# 2  Long offline        Completed without error       00%      4972

Dieses Ausgabebeispiel zeigt, dass der Festplatten-Check nicht erfolgreich war:

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       20%       717         555027747

Melden von Fehlern beim Support

Melden von Fehlern beim Support bei normalen Festplatten

Um den Fehler der Festplatte beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -a /dev/sdX

Melden von Fehlern beim Support bei Festplatten an HW-RAID-Controllern

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an (Ersetzen Sie dabei X für den entsprechenden Controller-Port, an welchem die Festplatte angeschlossen ist):

smartctl -d 3ware,X -a /dev/twa0

Hardware-RAID

Grundlagen / Allgemeine Informationen

Überprüfen des Status des Controllers

3ware-RAID-Controller

Um den Status des 3ware-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.
Geben Sie den folgenden Befehl ein, um zunächst die ID des Controllers festzustellen (diese ist in der Regel 0) :

dmesg | grep 3ware

Es erscheint folgende Beispielausgabe (die Zahl hinter scsi ist die Controller-ID):

[    5.487015] scsi4 : 3ware 9000 Storage Controller

Geben Sie folgenden Befehl ein, um die Informationen des HW-Controllers auszulesen (Ersetzen Sie X durch die entsprechende Controller-ID):

tw_cli /cX show

Es können folgende Beispielausgaben erscheinen:

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-1    OK             -       -       -       149.001   RiW    ON     

VPort Status         Unit Size      Type  Phy Encl-Slot    Model
------------------------------------------------------------------------------
p0    OK             u0   149.05 GB SATA  0   -            SAMSUNG HD160JJ     
p1    OK             u0   149.05 GB SATA  1   -            SAMSUNG HD160JJ

In diesem Fall ist das RAID in einwandfreiem Zustand, erkennbar durch den Status OK.

Unit     UnitType  Status         %RCmpl  %V/I/M  Port  Stripe  Size(GB)
------------------------------------------------------------------------
u0       RAID-1    REBUILDING     23%     -       -     -       149.001   
u0-0     DISK      DEGRADED       -       -       p0    -       149.001   
u0-1     DISK      OK             -       -       p1    -       149.001   
u0/v0    Volume    -              -       -       -     -       149.001

In diesem Fall führt das Hardware-RAID ein Rebuild durch, erkennbar durch den Status REBUILDING. Die problematische Festplatte ist in diesem Fall die am Port 0 angeschlossene Festplatte (Status DEGRADED).

LSI-RAID-Controller

Um den Status des LSI-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

Aktivieren Sie das Rescue-System über das Kundencenter.
Verbinden Sie sich über SSH mit dem Rescue-System.
Geben Sie den folgenden Befehl ein:

megacli -AdpAllInfo -aAll

Es erscheint nun eine Ausgabe an Informationen zum LSI-Controller.

Überprüfen des Status der Festplatten

3ware-RAID-Controller

Um mittels smartmontools eine Überprüfung des Status der Festplatten an 3ware-HW-Controllern durchzuführen, gehen Sie wie folgt vor:

Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):

smartctl -d 3ware,X -a /dev/twa0

LSI-Controller

Um mittels smartmontools eine Überprüfung des Status der Festplatten an LSI-HW-Controllern durchzuführen, gehen Sie wie folgt vor:

Geben Sie folgenden Befehl ein, um die Device ID der Festplatte am RAID-Controller herauszufinden (Diese kann über die StorCLI angezeigt werden (Spalte DID).:

storcli /c0 /eall /sall show

Mittels folgenden Befehls können Sie auf die Festplatten per smartctl zugreifen (Ersetzen Sie <X> durch die entsprechende Festplatte und <N> durch die Device ID):

smartctl -a -d megaraid,N  /dev/sdX

Melden von Fehlern beim Support

3ware-RAID-Controller

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -d 3ware,X -a /dev/twa0

LSI-Controller

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -a -d megaraid,N  /dev/sdX

Überprüfen des Arbeitsspeichers

Um einen Check des im Server verbauten Arbeitsspeichers durchzuführen, kann das Tool memtester verwendet werden. Das Tool steht auf dem EUserv Mirror zur Verfügung und kann unter folgendem Link bezogen werden:

http://mirror.euserv.net/misc/memtester.tar.gz

Um innerhalb des Rescue-Systems eine Überprüfung des Arbeitsspeichers vorzunehmen, gehen Sie bitte wie folgt vor:

Loggen Sie sich ins Rescue-System ein

Laden Sie memtester herunter. Nutzen Sie dafür folgenden Befehl:

wget http://mirror.euserv.net/misc/memtester.tar.gz

Entpacken Sie das Archiv. Nutzen Sie dafür folgenden Befehl:

tar xfz memtester.tar.gz

Wechseln Sie in das entpackte Verzeichnis. Nutzen Sie dafür folgenden Befehl:

cd memtester

Kompilieren Sie das Programm. Nutzen Sie dafür folgenden Befehl:

make

Nun können Sie das Programm nach folgendem Muster aufrufen:

./memtester <Menge Arbeitsspeicher> <Durchläufe>

Die Menge des Arbeitsspeichers können Sie mit dem Befehl free -m ermitteln. Der entsprechende Wert befindet sich unter der Spalte Total.

Beispiel:

total       used       free     shared    buffers     cached
Mem:          3821       3444        376          3          1       2717
-/+ buffers/cache:        724       3096
Swap:         1953          5       1947

Um den Arbeitsspeicher nun zweimal zu prüfen, nutzen Sie folgenden Befehl:

./memtester 3821 2

Version vom 10:07, 26. Nov. 2015 (Quelltext anzeigen) Svtr1 (Diskussion \| Beiträge) ← Zum vorherigen Versionsunterschied		Aktuelle Version vom 07:14, 15. Jan. 2020 (Quelltext anzeigen) Seki1 (Diskussion \| Beiträge) (→Überprüfen des Arbeitsspeichers)
Zeile 875:		Zeile 875:
	Nun können Sie das Programm nach folgendem Muster aufrufen:		Nun können Sie das Programm nach folgendem Muster aufrufen:

-	<pre>./~~make~~ <Menge Arbeitsspeicher> <Durchläufe></pre>	+	<pre>./memtester <Menge Arbeitsspeicher> <Durchläufe></pre>

Ansichten

Persönliche Werkzeuge

Navigation

Werkzeuge

Manual Linux Rescue System

Aus EUserv Wiki

Aktuelle Version vom 07:14, 15. Jan. 2020

Inhaltsverzeichnis

Aktivierung des Linux Rescue-Systems

Verbinden mit dem Linux Rescue-System

Zurücksetzen des root-Passwortes

Vorbereitung

Durchführung

Deaktivieren der Firewall

Vorbereitung

Durchführung

Wiederherstellen eines fehlerhaften Software-RAID

Prüfung auf MBR-/GPT-Partitionierung

RAID1 mit MBR-Partitionierung

Vorbereitung

Durchführung

RAID1 mit GPT-Partitionierung

Vorbereitung

Durchführung

RAID5/6 mit MBR-Partitionierung

Vorbereitung

Durchführung

RAID5/6 mit GPT-Partitionierung

Vorbereitung

Durchführung

Prüfen/Wiederherstellen eines fehlerhaften Filesystems

Prüfen/Wiederherstellen des Filesystems einer physischen HDD auf Fehler

Prüfen auf benutzten Filesystem-Typ

ext2/3/4

xfs

Prüfen des Filesystems eines Software-RAIDs auf Fehler

Prüfen des Filesystems eines Hardware-RAIDs auf Fehler

Konvertieren eines Filesystems

Konvertieren von ext3 auf ext4

Vorbereitung

Durchführung

Beispiel

Überprüfen der Festplatten

HDD-Check mit smartctl / smartmontools

HDD-Check mit smartctl / smartmontools für normale Festplatten

HDD-Check mit smartctl / smartmontools für Festplatten an HW-Controllern

Auswertung der Ergebnisse

Melden von Fehlern beim Support

Melden von Fehlern beim Support bei normalen Festplatten

Melden von Fehlern beim Support bei Festplatten an HW-RAID-Controllern

Hardware-RAID

Grundlagen / Allgemeine Informationen

Überprüfen des Status des Controllers

3ware-RAID-Controller

LSI-RAID-Controller

Überprüfen des Status der Festplatten

3ware-RAID-Controller

LSI-Controller

Melden von Fehlern beim Support

3ware-RAID-Controller

LSI-Controller

Überprüfen des Arbeitsspeichers