Manual Linux Rescue System

Aus EUserv Wiki

(Unterschied zwischen Versionen)
Wechseln zu: Navigation, Suche
(Überprüfen des Arbeitsspeichers)
 
Zeile 875: Zeile 875:
Nun können Sie das Programm nach folgendem Muster aufrufen:
Nun können Sie das Programm nach folgendem Muster aufrufen:
-
<pre>./make <Menge Arbeitsspeicher> <Durchläufe></pre>
+
<pre>./memtester <Menge Arbeitsspeicher> <Durchläufe></pre>

Aktuelle Version vom 07:14, 15. Jan. 2020

Benutzung des Linux Rescue-Systems

Inhaltsverzeichnis

Benutzung des Linux Rescue-Systems

Aktivierung des Linux Rescue-Systems

Um das Linux Rescue-System nutzen zu können, müssen Sie dieses erst über das Kundencenter aktivieren. Wie die Aktivierung erfolgt, können Sie der folgenden Wiki-Anleitung entnehmen:

Rescue-System aktivieren


Verbinden mit dem Linux Rescue-System

Nach der Aktivierung des Linux Rescue-systems, können Sie sich mit diesem verbinden. Hier finden Sie eine Wiki-Anleitung dazu:

Verbinden mit dem Rescue-System


Zurücksetzen des root-Passwortes

Vorbereitung

Um das root-Passwort zu ändern, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.


Durchführung

Gehen Sie wie folgt vor um das root-Passwort zu ändern:

  • Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):
mount /dev/sdaX /mnt/custom          //(Root-Partition)
mount /dev/sdaX /mnt/custom/boot     //(Boot-Partition)

cd /mnt/custom

mount --bind /dev dev
mount --bind /sys sys
mount --bind /proc proc

chroot . /bin/bash
  • Geben Sie folgenden Befehl als root-Benutzer ein:
 passwd 
  • Geben Sie das neue Passwort ein.
  • Geben Sie wiederholt das neue Passwort ein.
  • Verlassen Sie nun die chroot-Umgebung und unmounten Sie die Partitionen:
exit
umount dev sys proc boot
cd ..
umount custom
  • Deaktivieren Sie über das Kundencenter das Rescue-System.
  • Führen Sie über das Kundencenter einen Webreset aus.

Sie haben nun erfolgreich das root-Passwort geändert. Sie können sich nun unter dem neu vergebenen Passwort mit Ihrem System verbinden.


Deaktivieren der Firewall

Vorbereitung

Um die Firewall zu deaktivieren, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.


Durchführung

Gehen Sie wie folgt vor um die Firewall zu deaktivieren:

  • Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):
mount /dev/sdaX /mnt/custom          //(Root-Partition)
mount /dev/sdaX /mnt/custom/boot     //(Boot-Partition)

cd /mnt/custom

mount --bind /dev dev
mount --bind /sys sys
mount --bind /proc proc

chroot . /bin/bash

CentOS/Red Hat/Fedora

Geben Sie den folgenden Befehl als root-User ein:

chkconfig --level 2345 iptables off

Debian/Ubuntu

Geben Sie den folgenden Befehl als root-User ein:

update-rc.d -f iptables remove


Wiederherstellen eines fehlerhaften Software-RAID

Prüfung auf MBR-/GPT-Partitionierung

Um zu prüfen, welches Format der Partitionstabellen bei Ihren Festplatten vorliegt, gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Prüfen Sie das Format der Partitionstabelle Ihrer Festplatte mit folgendem Befehl (Ersetzen Sie X durch die zu prüfende Festplatte):
parted -s /dev/sdX print

Folgende Ausgabe weist darauf hin, dass die Partitionstabelle das Format MBR hat:

Partition Table: mbr

Folgende Ausgabe weist darauf hin, dass die Partitionstabelle das Format GPT hat:

Partition Table: gpt

RAID1 mit MBR-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
  • Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat
Eine RAID1-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind. 

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0] sdb4[1]
      1847608639 blocks super 1.2 [2/2] [UU]
 
md2 : active raid1 sda3[0] sdb3[1]
      1073740664 blocks super 1.2 [2/2] [UU]
 
md1 : active raid1 sda2[0] sdb2[1]
      524276 blocks super 1.2 [2/2] [UU]
 
md0 : active raid1 sda1[0] sdb1[1]
      8387572 blocks super 1.2 [2/2] [UU]
 
unused devices: <none>
Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist. 

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0]
      1843414335 blocks super 1.2 [2/1] [U_]

md2 : active raid1 sda3[0]
      1073740664 blocks super 1.2 [2/1] [U_]

md1 : active raid1 sda2[0]
      524276 blocks super 1.2 [2/1] [U_]

md0 : active raid1 sda1[0]
      12581816 blocks super 1.2 [2/1] [U_]

unused devices: <none>
In diesem Bespiel werden die Partitionen auf der zweiten Festplatte sdb nicht angezeigt. Es ist von einem Festplattendefekt auszugehen.


Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):
sfdisk -d /dev/sda | sfdisk /dev/sdb
  • Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:
sfdisk -R /dev/sdb
  • Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:
cat /proc/partitions
  • Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdb1
mdadm /dev/md1 -a /dev/sdb2
mdadm /dev/md2 -a /dev/sdb3
mdadm /dev/md3 -a /dev/sdb4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

RAID1 mit GPT-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
  • Prüfen Sie den Zustand des Software-Raids mit folgendem Befehl:
cat /proc/mdstat
Eine RAID1-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind. 

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0] sdb4[1]
      1847608639 blocks super 1.2 [2/2] [UU]
 
md2 : active raid1 sda3[0] sdb3[1]
      1073740664 blocks super 1.2 [2/2] [UU]
 
md1 : active raid1 sda2[0] sdb2[1]
      524276 blocks super 1.2 [2/2] [UU]
 
md0 : active raid1 sda1[0] sdb1[1]
      8387572 blocks super 1.2 [2/2] [UU]
 
unused devices: <none>
Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist. 

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0]
      1843414335 blocks super 1.2 [2/1] [U_]

md2 : active raid1 sda3[0]
      1073740664 blocks super 1.2 [2/1] [U_]

md1 : active raid1 sda2[0]
      524276 blocks super 1.2 [2/1] [U_]

md0 : active raid1 sda1[0]
      12581816 blocks super 1.2 [2/1] [U_]

unused devices: <none>
In diesem Bespiel werden die Partitionen auf der zweiten Festplatte sdb nicht angezeigt. Es ist von einem Festplattendefekt auszugehen.

Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um die Partitionstabelle von sda auf die neue Festplatte sdb zu kopieren:
sgdisk -R /dev/sdb /dev/sda
  • Vergeben Sie der Festplatte eine neue zufällig UUID:
sgdisk -G /dev/sdb
  • Nun kann die Festplatte wieder in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdb1
mdadm /dev/md1 -a /dev/sdb2
mdadm /dev/md2 -a /dev/sdb3
mdadm /dev/md3 -a /dev/sdb4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

RAID5/6 mit MBR-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
  • Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat

Eine RAID5-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

Eine RAID5-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [UUU_]

In diesem Bespiel fehlt die vierte Platte im RAID5-Verbund.


Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):
sfdisk -d /dev/sda | sfdisk /dev/sdd
  • Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:
sfdisk -R /dev/sdd
  • Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:
cat /proc/partitions
  • Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdd1
mdadm /dev/md1 -a /dev/sdd2
mdadm /dev/md2 -a /dev/sdd3
mdadm /dev/md3 -a /dev/sdd4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

RAID5/6 mit GPT-Partitionierung

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Prüfen Sie das Format der Partitionstabelle: Prüfung auf MBR-/GPT-Partitionierung
  • Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat

Eine RAID5-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

Eine RAID5-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [UUU_]

In diesem Beispiel fehlt die vierte Platte im RAID5-Verbund.

Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um die Partitionstabelle von sda auf die neue Festplatte sdd zu kopieren:
sgdisk -R /dev/sdd /dev/sda
  • Vergeben Sie der Festplatte eine neue zufällig UUID:
sgdisk -G /dev/sdd
  • Nun kann die Festplatte wieder in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdd1
mdadm /dev/md1 -a /dev/sdd2
mdadm /dev/md2 -a /dev/sdd3
mdadm /dev/md3 -a /dev/sdd4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat

Prüfen/Wiederherstellen eines fehlerhaften Filesystems

Prüfen/Wiederherstellen des Filesystems einer physischen HDD auf Fehler

Um das Filesystem einer physischen HDD auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.

Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):

fsck /dev/sdX

fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.

Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!

Prüfen auf benutzten Filesystem-Typ

Geben Sie folgenden Befehl ein, um zu prüfen welcher Filesystem-Typ benutzt wird (Ersetzen Sie X durch die entsprechende Partition):

parted -s /dev/sdX print


ext2/3/4

Um nun das fehlerhafte Filesystem vom Typ ext2/3/4 wiederherzustellen, geben Sie folgenden Befehl ein (Ersetzen Sie X für die entsprechende Partition):

fsck.ext3 /dev/sdX
fsck.ext2 /dev/sdX
...


xfs

Um nun das fehlerhafte Filesystem vom Typ xfs wiederherzustellen, geben Sie die folgenden Befehle ein (Ersetzen Sie X durch die entsprechende Partition):

xfs_check /dev/sdX
xfs_repair /dev/sdX


Prüfen des Filesystems eines Software-RAIDs auf Fehler

Um das Filesystem eines Software-RAIDs auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.

Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):

fsck /dev/mdX

fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.

Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!


Prüfen des Filesystems eines Hardware-RAIDs auf Fehler

Konvertieren eines Filesystems

Konvertieren von ext3 auf ext4

Vorbereitung

Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, darf das Dateisystem nicht eingehängt sein. Sollte das Root-Dateisystem konvertiert werden, so muss dies im Rescue-System durchgeführt werden. Alle anderen Partitionen, welche zur Konvertierung ausgehangen werden können, benötigen diesen Schritt nicht zwingend. Für die Konvertierung werden dem ext3-Dateisystem, die spezifischen ext4 Erweiterungen/Eigenschaften hinzugefügt und danach ein zwingend nötiger Dateisystemcheck durchgeführt.

Gehen Sie zur Vorbereitung wie folgt vor:

  • Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie hier.
  • Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch.
  • Ermitteln Sie die genaue Bezeichnung der zu konvertierenden Partition mittels folgender Befehle:
fdisk -l
blkid 

Mit dem ersten Befehl erhalten Sie eine Ausgabe aller Festplatten und deren Partitionen. Der Befehl blkid gibt die einzigartigen IDs aller Partitionen aus.

Hinweis: Die zu ändernde Partition darf bei dem Dateisystemcheck nicht eingehängt sein!

Durchführung

Um ein bestehendes ext3- in ein ext4-Dateisystem zu konvertieren, gehen Sie wie folgt vor:

  • Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu:
tune2fs -O extents,uninit_bg,dir_index /dev/<Gerätedatei> 

Für <Gerätedatei> setzen Sie die gerade ermittelte Bezeichnung ein.

  • Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch (Hinweis: Die Partition darf nicht eingehängt sein!):
fsck -fCVD /dev/<Gerätedatei>
  • Mit folgendem Befehl mounten Sie nun die Partition:
mount /dev/<Gerätedatei> /mnt 

Für <Gerätedatei> setzen Sie hier die Bezeichnung der (Root-) Partiton ein.

  • Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano.
  • Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4":
/dev/<Gerätedatei>    /   ext4 relatime   0   1
  • Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal".

Nun wird ab sofort das ext4-Dateisystem genutzt.


Beispiel

Im folgenden Beispiel, führen wir die Konvertierung der Root-Partition basierend auf der EUserv Standardpartitionierung durch. Die Standardpartitionierung nutzt für die Root-Partition /dev/sda3 bei Standard Partitionierung bzw. /dev/sda4 bei GPT Partitionierung. In diesem Beispiel nehmen wir die Standard-Partitionierung an. Dabei gehen Sie wie folgt vor:

  • Starten Sie Ihren Server im Rescue-System. Wie Sie dabei vorgehen, finden Sie hier.
  • Führen Sie eine Datensicherung aller wichtigen Daten und Konfigurationen durch.
  • Prüfen Sie, ob die Partionierung mit der o.g. Standardpartitionierung übereinstimt, bevor Sie weitere Schritte durchführen, geben Sie die folgenden Befehle ein:
fdisk -l
blkid 

Befehl "fdisk -l" Beispielausgabe für Standard Partitionierung:

Gerät     boot.     Anfang        Ende     Blöcke   Id  System
/dev/sda1   *           1          62      488281+  83  Linux
/dev/sda2              62         311     2000976+  83  Linux
/dev/sda3             311         933     5000977   83  Linux

Befehl "blkid" Beispielausgabe für Standard Partitionierung:

/dev/sda1: UUID="aa326a61-4c8c-4613-82d4-8c5a1d30d8ce" TYPE="ext2" 
/dev/sda2: UUID="bbde6249-1b62-4fbf-b250-9075377417bd" TYPE="swap" 
/dev/sda3: UUID="cc3b1ecf-0bb1-459d-bbcf-d80d6dba9077" TYPE="ext3" 
  • Fügen Sie die ext4-spezifischen Optionen mittels folgendem Befehl mit Hilfe von tune2fs hinzu:
tune2fs -O extents,uninit_bg,dir_index /dev/sda3
  • Führen Sie einen Dateisystemcheck mittels folgendem Befehl durch (Hinweis: Die Partition darf nicht eingehängt sein!):
fsck -fCVD /dev/sda3
  • Mit folgendem Befehl mounten Sie nun die Partition:
mount /dev/sda3 /mnt 
  • Öffnen Sie nun die Datei /mnt/etc/fstab mit einem Editor, z.B. nano.
  • Ersetzen Sie nun bei der entsprechenden Partition den Eintrag "ext3" mit "ext4":
/dev/sda3    /   ext4 relatime   0   1
  • Speichern Sie die Datei, Deaktivieren Sie das Rescue-System und starten Sie das System "normal".

Überprüfen der Festplatten

Um die Festplatten auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.


HDD-Check mit smartctl / smartmontools

HDD-Check mit smartctl / smartmontools für normale Festplatten

Um mittels smartmontools ein Festplatten-Check durchzuführen, gehen Sie wie folgt vor:

  • Starten Sie mittels folgenden Befehls einen kurzen Festplatten-Check (Ersetzen Sie X durch die entsprechende Festplatte):
smartctl -t short /dev/sdX
  • Starten Sie mit dem folgenden Befehl einen langen Festplatten-Check (dieser dauert abhängig von der Kapazität der Festplatte 1 bis 6 Stunden):
smartctl -t long /dev/sdX


HDD-Check mit smartctl / smartmontools für Festplatten an HW-Controllern

Um mittels smartmontools eine Überprüfung für Festplatten an 3Ware HW-RAID-Controllern durchzuführen, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):
smartctl -d 3ware,X -t short /dev/twa0
  • Geben Sie folgenden Befehl ein, um einen langen Festplatten-Check zu starten:
smartctl -d 3ware,X -t long /dev/twa0


Auswertung der Ergebnisse

Geben Sie folgenden Befehl ein, um sich das Ergebnis des Festplatten-Tests anzeigen zu lassen:

smartctl -l selftest /dev/sdX

Das folgende Ausgabebeispiel zeigt, dass der Festplatten-Check erfolgreich war:

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      4970         
# 2  Long offline        Completed without error       00%      4972

Dieses Ausgabebeispiel zeigt, dass der Festplatten-Check nicht erfolgreich war:

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       20%       717         555027747


Melden von Fehlern beim Support

Melden von Fehlern beim Support bei normalen Festplatten

Um den Fehler der Festplatte beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -a /dev/sdX


Melden von Fehlern beim Support bei Festplatten an HW-RAID-Controllern

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an (Ersetzen Sie dabei X für den entsprechenden Controller-Port, an welchem die Festplatte angeschlossen ist):

smartctl -d 3ware,X -a /dev/twa0


Hardware-RAID

Grundlagen / Allgemeine Informationen

Überprüfen des Status des Controllers

3ware-RAID-Controller

Um den Status des 3ware-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Geben Sie den folgenden Befehl ein, um zunächst die ID des Controllers festzustellen (diese ist in der Regel 0) :
dmesg | grep 3ware

Es erscheint folgende Beispielausgabe (die Zahl hinter scsi ist die Controller-ID):

[    5.487015] scsi4 : 3ware 9000 Storage Controller
  • Geben Sie folgenden Befehl ein, um die Informationen des HW-Controllers auszulesen (Ersetzen Sie X durch die entsprechende Controller-ID):
tw_cli /cX show

Es können folgende Beispielausgaben erscheinen:

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-1    OK             -       -       -       149.001   RiW    ON     

VPort Status         Unit Size      Type  Phy Encl-Slot    Model
------------------------------------------------------------------------------
p0    OK             u0   149.05 GB SATA  0   -            SAMSUNG HD160JJ     
p1    OK             u0   149.05 GB SATA  1   -            SAMSUNG HD160JJ    

In diesem Fall ist das RAID in einwandfreiem Zustand, erkennbar durch den Status OK.

Unit     UnitType  Status         %RCmpl  %V/I/M  Port  Stripe  Size(GB)
------------------------------------------------------------------------
u0       RAID-1    REBUILDING     23%     -       -     -       149.001   
u0-0     DISK      DEGRADED       -       -       p0    -       149.001   
u0-1     DISK      OK             -       -       p1    -       149.001   
u0/v0    Volume    -              -       -       -     -       149.001   

In diesem Fall führt das Hardware-RAID ein Rebuild durch, erkennbar durch den Status REBUILDING. Die problematische Festplatte ist in diesem Fall die am Port 0 angeschlossene Festplatte (Status DEGRADED).

LSI-RAID-Controller

Um den Status des LSI-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Geben Sie den folgenden Befehl ein:
megacli -AdpAllInfo -aAll

Es erscheint nun eine Ausgabe an Informationen zum LSI-Controller.


Überprüfen des Status der Festplatten

3ware-RAID-Controller

Um mittels smartmontools eine Überprüfung des Status der Festplatten an 3ware-HW-Controllern durchzuführen, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):
smartctl -d 3ware,X -a /dev/twa0

LSI-Controller

Um mittels smartmontools eine Überprüfung des Status der Festplatten an LSI-HW-Controllern durchzuführen, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um die Device ID der Festplatte am RAID-Controller herauszufinden (Diese kann über die StorCLI angezeigt werden (Spalte DID).:
storcli /c0 /eall /sall show
  • Mittels folgenden Befehls können Sie auf die Festplatten per smartctl zugreifen (Ersetzen Sie <X> durch die entsprechende Festplatte und <N> durch die Device ID):
smartctl -a -d megaraid,N  /dev/sdX


Melden von Fehlern beim Support

3ware-RAID-Controller

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -d 3ware,X -a /dev/twa0

LSI-Controller

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -a -d megaraid,N  /dev/sdX


Überprüfen des Arbeitsspeichers

Um einen Check des im Server verbauten Arbeitsspeichers durchzuführen, kann das Tool memtester verwendet werden. Das Tool steht auf dem EUserv Mirror zur Verfügung und kann unter folgendem Link bezogen werden:

http://mirror.euserv.net/misc/memtester.tar.gz


Um innerhalb des Rescue-Systems eine Überprüfung des Arbeitsspeichers vorzunehmen, gehen Sie bitte wie folgt vor:

  • Loggen Sie sich ins Rescue-System ein
  • Laden Sie memtester herunter. Nutzen Sie dafür folgenden Befehl:
wget http://mirror.euserv.net/misc/memtester.tar.gz
  • Entpacken Sie das Archiv. Nutzen Sie dafür folgenden Befehl:
tar xfz memtester.tar.gz
  • Wechseln Sie in das entpackte Verzeichnis. Nutzen Sie dafür folgenden Befehl:
cd memtester
  • Kompilieren Sie das Programm. Nutzen Sie dafür folgenden Befehl:
make

Nun können Sie das Programm nach folgendem Muster aufrufen:

./memtester <Menge Arbeitsspeicher> <Durchläufe>


Die Menge des Arbeitsspeichers können Sie mit dem Befehl free -m ermitteln. Der entsprechende Wert befindet sich unter der Spalte Total.

Beispiel:

total       used       free     shared    buffers     cached
Mem:          3821       3444        376          3          1       2717
-/+ buffers/cache:        724       3096
Swap:         1953          5       1947

Um den Arbeitsspeicher nun zweimal zu prüfen, nutzen Sie folgenden Befehl:

./memtester 3821 2