Conséquences d’une panne de disque dur, Tolérance de panne compromise – HP Contrôleur HP Smart Array P700m Manuel d'utilisation
Page 20

Remplacement, déplacement ou ajout de disques durs 20
•
Le service Event Notification consigne un événement dans le journal des événements système
Microsoft® Windows® et dans le journal IML.
•
L’utilitaire ADU répertorie tous les disques défectueux.
Pour plus d’informations sur le diagnostic des problèmes de disque dur, reportez-vous au
manuel HP ProLiant Servers Troubleshooting Guide (Manuel de résolution des problèmes des
serveurs HP ProLiant).
ATTENTION :
il est possible qu’un disque considéré comme défectueux par le contrôleur
semble opérationnel une fois que le système est redémarré ou après avoir été retiré et réinséré
(dans le cas des disques hot-plug). Toutefois, une utilisation continue de tels disques marginaux
risque de provoquer des pertes de données. Remplacez le disque au plus vite.
Conséquences d’une panne de disque dur
En cas de panne du disque dur, toutes les unités logiques du même module RAID sont affectées. Chaque
unité logique du module peut utiliser une méthode de tolérance de pannes différente. Par conséquent,
chaque unité logique peut être affectée différemment.
•
Les configurations en RAID 0 ne tolèrent pas de panne de disque. Si un disque physique du module
RAID est défectueux, l’état de toutes les unités logiques sans tolérance de panne du même module
RAID sera également défectueux.
•
Les configurations en RAID 1+0 peuvent tolérer plusieurs pannes de disques tant qu’aucun disque
défectueux ne se trouve en mode miroir par rapport à un autre disque défectueux.
•
Les configurations en RAID 5 tolèrent la défaillance d’un disque.
•
Les configurations RAID 6 (ADG) peuvent tolérer la panne simultanée de deux disques.
Tolérance de panne compromise
En cas de défaillance d’un nombre de disques durs supérieur à la limite autorisée par la méthode de
tolérance de panne, cette tolérance se trouve compromise et l’unité logique tombe en panne. Dans ce
cas, toutes les demandes du système d’exploitation sont rejetées et renvoient des erreurs irréversibles.
Vous risquez fort de perdre des données, même si celles-ci peuvent parfois être récupérées (voir la
section «
Récupération de données à la suite d’une tolérance de panne compromise
Une tolérance de panne compromise peut par exemple se produire lorsqu’un disque d’un module RAID
tombe en panne pendant la reconstruction d’un autre disque du module. Si le module RAID ne dispose
pas de disque de secours en ligne, toutes les unités logiques de ce module qui sont configurées avec la
tolérance de panne RAID 5 seront défectueuses.
La tolérance de panne peut également être compromise par des problèmes non liés au disque, comme un
câble défectueux ou la coupure provisoire de l’alimentation d’un système de stockage. Dans de tels cas,
il n’est pas nécessaire de remplacer les disques physiques. Vous risquez toutefois de perdre des données,
en particulier si le système était occupé lors de l’incident.