Manual Linux Rescue System

Aus EUserv Wiki

(Unterschied zwischen Versionen)
Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „{{Languages|Manual Linux Rescue-System}} Kategorie:Server '''''Benutzung des Linux Rescue-Systems''''' __TOC__ <div style= "font-size: 1.571em;"> '''Benutzun…“)
Zeile 1: Zeile 1:
-
{{Languages|Manual Linux Rescue-System}}
+
{{Languages|Manual Linux Rescue System}}
[[Kategorie:Server]]
[[Kategorie:Server]]

Version vom 13:13, 19. Feb. 2014

Benutzung des Linux Rescue-Systems

Inhaltsverzeichnis

Benutzung des Linux Rescue-Systems

Aktivierung des Linux Rescue-Systems

Um das Linux Rescue-System nutzen zu können, müssen Sie dieses erst über das Kundencenter aktivieren. Wie die Aktivierung erfolgt, können Sie der folgenden Wiki-Anleitung entnehmen:

Rescue-System aktivieren


Verbinden mit dem Linux Rescue-System

Nach der Aktivierung des Linux Rescue-systems, können Sie sich mit diesem verbinden. Hier finden Sie eine Wiki-Anleitung dazu:

Verbinden mit dem Rescue-System


Zurücksetzen des root-Passwortes

Vorbereitung

Um das root-Passwort zu ändern, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.


Durchführung

Gehen Sie wie folgt vor um das root-Passwort zu ändern:

  • Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):
mount /dev/sdaX /mnt/custom          //(Root-Partition)
mount /dev/sdaX /mnt/custom/boot     //(Boot-Partition)

cd /mnt/custom

mount --bind /dev dev
mount --bind /sys sys
mount --bind /proc proc

chroot . /bin/bash
  • Geben Sie folgenden Befehl als root-Benutzer ein:
 passwd 
  • Geben Sie das neue Passwort ein.
  • Geben Sie wiederholt das neue Passwort ein.
  • Verlassen Sie nun die chroot-Umgebung und unmounten Sie die Partitionen:
exit
umount dev sys proc boot
cd ..
umount custom
  • Deaktivieren Sie über das Kundencenter das Rescue-System.
  • Führen Sie über das Kundencenter einen Webreset aus.

Sie haben nun erfolgreich das root-Passwort geändert. Sie können sich nun unter dem neu vergebenen Passwort mit Ihrem System verbinden.


Deaktivieren der Firewall

Vorbereitung

Um die Firewall zu deaktivieren, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.


Durchführung

Gehen Sie wie folgt vor um die Firewall zu deaktivieren:

  • Betreten Sie Ihr installiertes System in einer chroot-Umgebung (Ersetzen Sie X durch die entsprechende Partitionsnummer):
mount /dev/sdaX /mnt/custom          //(Root-Partition)
mount /dev/sdaX /mnt/custom/boot     //(Boot-Partition)

cd /mnt/custom

mount --bind /dev dev
mount --bind /sys sys
mount --bind /proc proc

chroot . /bin/bash

CentOS/Red Hat/Fedora

Geben Sie den folgenden Befehl als root-User ein:

chkconfig --level 2345 iptables off

Debian/Ubuntu

Geben Sie den folgenden Befehl als root-User ein:

update-rc.d -f iptables remove


Wiederherstellen eines fehlerhaften Software-RAID

RAID1

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat
Eine RAID1-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind. 

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0] sdb4[1]
      1847608639 blocks super 1.2 [2/2] [UU]
 
md2 : active raid1 sda3[0] sdb3[1]
      1073740664 blocks super 1.2 [2/2] [UU]
 
md1 : active raid1 sda2[0] sdb2[1]
      524276 blocks super 1.2 [2/2] [UU]
 
md0 : active raid1 sda1[0] sdb1[1]
      8387572 blocks super 1.2 [2/2] [UU]
 
unused devices: <none>
Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist. 

Eine Beispielausgabe:

Personalities : [raid1]
md3 : active raid1 sda4[0]
      1843414335 blocks super 1.2 [2/1] [U_]

md2 : active raid1 sda3[0]
      1073740664 blocks super 1.2 [2/1] [U_]

md1 : active raid1 sda2[0]
      524276 blocks super 1.2 [2/1] [U_]

md0 : active raid1 sda1[0]
      12581816 blocks super 1.2 [2/1] [U_]

unused devices: <none>
In diesem Bespiel werden die Partitionen auf der zweiten Festplatte sdb nicht angezeigt. Es ist von einem Festplattendefekt auszugehen.


Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):
sfdisk -d /dev/sda | sfdisk /dev/sdb
  • Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:
sfdisk -R /dev/sdb
  • Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:
cat /proc/partitions
  • Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdb1
mdadm /dev/md1 -a /dev/sdb2
mdadm /dev/md2 -a /dev/sdb3
mdadm /dev/md3 -a /dev/sdb4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat


RAID5/6

Vorbereitung

Um ein fehlerhaftes Software-RAID wiederherzustellen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Prüfen Sie den Zustand des Software-Raids mittels folgenden Befehls:
cat /proc/mdstat

Eine RAID5-Partition, welche intakt ist, erkennen Sie am Status 'U'. Dies bedeutet, dass alle beteiligten Partitionen in Ordnung sind.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/4] [UUUU]

Eine RAID1-Partition, welche defekt ist, erkennen Sie am Status '_'. Dies deutet darauf hin, dass eine Festplatte im RAID fehlt bzw. defekt ist.

Eine Beispielausgabe:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid5 sda7[0] sdc7[2] sdb7[1]
5842954752 blocks super 1.2 level 5, 512k chunk, algorithm 2 [4/3] [UUU_]

In diesem Bespiel fehlt die vierte Platte im RAID5-Verbund.


Durchführung

Um die Wiederherstellung des RAIDs durchführen zu können, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein (Bitte beachten Sie unbedingt die Reihenfolge! (sfdisk -d Quellsystem | sfdisk Zielsystem):
sfdisk -d /dev/sda | sfdisk /dev/sdd
  • Geben Sie den folgenden Befehl ein um die Partitionstabelle neu einzulesen:
sfdisk -R /dev/sdd
  • Prüfen Sie mittels folgenden Befehls, ob die beiden Festplatten sda und sdb die gleichen Partitionsgrößen anzeigen:
cat /proc/partitions
  • Wenn alle Partitionen vorhanden sind, können diese in das RAID zurück eingebunden werden:
mdadm /dev/md0 -a /dev/sdd1
mdadm /dev/md1 -a /dev/sdd2
mdadm /dev/md2 -a /dev/sdd3
mdadm /dev/md3 -a /dev/sdd4

Die Partitionen werden nun nach der Reihe wiederhergestellt. Dieser Vorgang kann je nach verwendeten Daten einige Zeit in Anspruch nehmen. Der Status kann mittels folgenden Befehls abgefragt werden:

cat /proc/mdstat


Prüfen/Wiederherstellen eines fehlerhaften Filesystems

Prüfen/Wiederherstellen des Filesystems einer physischen HDD auf Fehler

Um das Filesystem einer physischen HDD auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.

Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):

fsck /dev/sdX

fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.

Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!

Prüfen auf benutzten Filesystem-Typ

Geben Sie folgenden Befehl ein, um zu prüfen welcher Filesystem-Typ benutzt wird (Ersetzen Sie X durch die entsprechende Partition):

parted -s /dev/sdX print


ext2/3/4

Um nun das fehlerhafte Filesystem vom Typ ext2/3/4 wiederherzustellen, geben Sie folgenden Befehl ein (Ersetzen Sie X für die entsprechende Partition):

fsck.ext3 /dev/sdX
fsck.ext2 /dev/sdX
...


xfs

Um nun das fehlerhafte Filesystem vom Typ xfs wiederherzustellen, geben Sie die folgenden Befehle ein (Ersetzen Sie X durch die entsprechende Partition):

xfs_check /dev/sdX
xfs_repair /dev/sdX


Prüfen des Filesystems eines Software-RAIDs auf Fehler

Um das Filesystem eines Software-RAIDs auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.

Geben Sie den folgenden Befehl ein um die Überprüfung des Filesystems zu starten (Ersetzen Sie X durch die zu prüfende Partition):

fsck /dev/mdX

fsck dient der Überprüfung und ggf. Reparatur eines Linux-Dateisystems.

Wichtig: Führen Sie fsck unter keinen Umständen auf einem gemountetem Filsystem aus!


Prüfen des Filesystems eines Hardware-RAIDs auf Fehler

Überprüfen der Festplatten

Um die Festplatten auf Fehler zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.


HDD-Check mit smartctl / smartmontools

HDD-Check mit smartctl / smartmontools für normale Festplatten

Um mittels smartmontools ein Festplatten-Check durchzuführen, gehen Sie wie folgt vor:

  • Starten Sie mittels folgenden Befehls einen kurzen Festplatten-Check (Ersetzen Sie X durch die entsprechende Festplatte):
smartctl -t short /dev/sdX
  • Starten Sie mit dem folgenden Befehl einen langen Festplatten-Check (dieser dauert abhängig von der Kapazität der Festplatte 1 bis 6 Stunden):
smartctl -t long /dev/sdX


HDD-Check mit smartctl / smartmontools für Festplatten an HW-Controllern

Um mittels smartmontools eine Überprüfung für Festplatten an 3Ware HW-RAID-Controllern durchzuführen, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):
smartctl -d 3ware,X -t short /dev/twa0
  • Geben Sie folgenden Befehl ein, um einen langen Festplatten-Check zu starten:
smartctl -d 3ware,X -t long /dev/twa0


Auswertung der Ergebnisse

Geben Sie folgenden Befehl ein, um sich das Ergebnis des Festplatten-Tests anzeigen zu lassen:

smartctl -l selftest /dev/sdX

Das folgende Ausgabebeispiel zeigt, dass der Festplatten-Check erfolgreich war:

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      4970         
# 2  Long offline        Completed without error       00%      4972

Dieses Ausgabebeispiel zeigt, dass der Festplatten-Check nicht erfolgreich war:

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       20%       717         555027747


Melden von Fehlern beim Support

Melden von Fehlern beim Support bei normalen Festplatten

Um den Fehler der Festplatte beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -a /dev/sdX


Melden von Fehlern beim Support bei Festplatten an HW-RAID-Controllern

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an (Ersetzen Sie dabei X für den entsprechenden Controller-Port, an welchem die Festplatte angeschlossen ist):

smartctl -d 3ware,X -a /dev/twa0


Hardware-RAID

Grundlagen / Allgemeine Informationen

Überprüfen des Status des Controllers

3ware-RAID-Controller

Um den Status des 3ware-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Geben Sie den folgenden Befehl ein, um zunächst die ID des Controllers festzustellen (diese ist in der Regel 0) :
dmesg | grep 3ware

Es erscheint folgende Beispielausgabe (die Zahl hinter scsi ist die Controller-ID):

[    5.487015] scsi4 : 3ware 9000 Storage Controller
  • Geben Sie folgenden Befehl ein, um die Informationen des HW-Controllers auszulesen (Ersetzen Sie X durch die entsprechende Controller-ID):
tw_cli /cX show

Es können folgende Beispielausgaben erscheinen:

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-1    OK             -       -       -       149.001   RiW    ON     

VPort Status         Unit Size      Type  Phy Encl-Slot    Model
------------------------------------------------------------------------------
p0    OK             u0   149.05 GB SATA  0   -            SAMSUNG HD160JJ     
p1    OK             u0   149.05 GB SATA  1   -            SAMSUNG HD160JJ    

In diesem Fall ist das RAID in einwandfreiem Zustand, erkennbar durch den Status OK.

Unit     UnitType  Status         %RCmpl  %V/I/M  Port  Stripe  Size(GB)
------------------------------------------------------------------------
u0       RAID-1    REBUILDING     23%     -       -     -       149.001   
u0-0     DISK      DEGRADED       -       -       p0    -       149.001   
u0-1     DISK      OK             -       -       p1    -       149.001   
u0/v0    Volume    -              -       -       -     -       149.001   

In diesem Fall führt das Hardware-RAID ein Rebuild durch, erkennbar durch den Status REBUILDING. Die problematische Festplatte ist in diesem Fall die am Port 0 angeschlossene Festplatte (Status DEGRADED).

LSI-RAID-Controller

Um den Status des LSI-HW-RAID-Controllers zu überprüfen, müssen Sie mit dem Linux Rescue-System verbunden sein. Dazu gehen Sie nach den folgenden Schritten vor:

  • Aktivieren Sie das Rescue-System über das Kundencenter.
  • Verbinden Sie sich über SSH mit dem Rescue-System.
  • Geben Sie den folgenden Befehl ein:
megacli -AdpAllInfo -aAll

Es erscheint nun eine Ausgabe an Informationen zum LSI-Controller.


Überprüfen des Status der Festplatten

3ware-RAID-Controller

Um mittels smartmontools eine Überprüfung des Status der Festplatten an 3ware-HW-Controllern durchzuführen, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um einen kurzen Festplatten-Check zu starten (Ersetzen Sie X durch die Nummer des entsprechenden Controller-Ports, an welchem die Festplatte konnektiert ist. Beachten Sie bitte, dass die erste Festplatte an Port 0 hängt.):
smartctl -d 3ware,X -a /dev/twa0

LSI-Controller

Um mittels smartmontools eine Überprüfung des Status der Festplatten an LSI-HW-Controllern durchzuführen, gehen Sie wie folgt vor:

  • Geben Sie folgenden Befehl ein, um die Device ID der Festplatte am RAID-Controller herauszufinden (Diese kann über die StorCLI angezeigt werden (Spalte DID).:
storcli /c0 /eall /sall show
  • Mittels folgenden Befehls können Sie auf die Festplatten per smartctl zugreifen (Ersetzen Sie <X> durch die entsprechende Festplatte und <N> durch die Device ID):
smartctl -a -d megaraid,N  /dev/sdX


Melden von Fehlern beim Support

3ware-RAID-Controller

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -d 3ware,X -a /dev/twa0

LSI-Controller

Um den Fehler der Festplatte an 3ware-HW-RAID-Controllern beim Support zu melden, geben Sie die Ausgabe des folgenden Befehls an:

smartctl -a -d megaraid,N  /dev/sdX