Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 30/10/2016, à 11:15

piouk03

[Résolu] Problème RAID5 mdadm

Bonjour à tous,

Je suis nouveau sur ce forum, car j'ai besoin d'aide et je ne sais pas à qui m'adresser. J'ai monté un serveur Ubuntu avec un RAID5 géré par mdadm. La configuration est la suivante :
4 disques de 3To en RAID5.

Tout fonctionnait bien jusqu'à quelques jours. Il m'indique maintenant que 2 disque sur 4 sont HS : Donc normalement on ne peut rien faire.

Mais si je branche les disque un par un, il me dit alors qu'ils sont bons (bien sûr qu'il manque les 3 autres). Par 2, certaines paires fonctionnent pas d'autres...

J'ai donc pensé à un problème de câbles SATA... Je les ai tous changés : ça ne change rien.
Ensuite à un problème d'alimentation, je l'ai changé : ça ne change rien
Idem pour la carte mère, la RAM et le processeur.

Donc je ne comprend plus rien ! On dirait que les disque sont "désynchronisés"... Que mdadm croit qu'ils n'appartiennent pas au même raid.

Y a t-il un moyen (sûr) de resynchroniser tout ça ?

... Peut-être avez-vous une autre idée sur le diagnostique ?

D'avance un grand merci pour votre aide.

Dernière modification par piouk03 (Le 08/12/2020, à 20:17)

Hors ligne

#2 Le 30/10/2016, à 11:42

Bougron

Re : [Résolu] Problème RAID5 mdadm

Bonjour
Il serait bon que tu regardes l'état physique de chacun de tes 4 disques
1) Tu installes l'application gsmartcontrol
2)  Tu postes le résultat de la commande suivante

sudo     smartctl     -s    on   -a    /dev/sdX

avec X à remplacer par la lettre du disque
Opération à faire 4 fois
Tu fais un copier/coller de la sortie dans cette discussion et tu resélectionnes le collage et tu cliques sur le 11eme icône <> de cette grille de saisie afin d'avoir une meilleure mise en forme.

Dernière modification par Bougron (Le 30/10/2016, à 11:43)

Hors ligne

#3 Le 30/10/2016, à 12:37

piouk03

Re : [Résolu] Problème RAID5 mdadm

Merci pour ta réponse ULTRA rapide. Comme mon RAID ne se monte pas je n'ai pas accès aux commandes habituelles même si je demande un démarrage en mode dégradé : j'arrive sur un écran avec :

(initramfs)

Or d'ici si je lui demande d'installer quoi que se soit il me dit : "la commande que je lui ai rentrée" : no found.

Comment dois-je faire ?

Hors ligne

#4 Le 30/10/2016, à 13:00

Bougron

Re : [Résolu] Problème RAID5 mdadm

Utilises un support d'installation de ubuntu puis prends l'option 'essayer avant d'installer'
puis

setxkbmap fr         ##  =====> qu'il faut souvent frapper  setxkb,qp  fr         afin d'avoir un clavier français.
cat /etc/lsb-release 
sudo apt-get install --no-install-recommends smartmontools 

et enfin les commandes

Hors ligne

#5 Le 30/10/2016, à 17:02

piouk03

Re : [Résolu] Problème RAID5 mdadm

ubuntu@ubuntu:~$ sudo smartctl -s on -a /dev/sda
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-31-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00D8PB0
Serial Number:    WD-WCC4N1077118
LU WWN Device Id: 5 0014ee 20a25d9cb
Firmware Version: 80.00A80
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Oct 30 14:56:09 2016 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)    Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (28680) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 289) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x7035)    SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   183   173   021    Pre-fail  Always       -       5850
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       409
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       764
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       408
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       123
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       11041
194 Temperature_Celsius     0x0022   121   113   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


ubuntu@ubuntu:~$ sudo smartctl -s on -a /dev/sdb
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-31-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00D8PB0
Serial Number:    WD-WCC4N1174214
LU WWN Device Id: 5 0014ee 20a2352f9
Firmware Version: 80.00A80
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Oct 30 14:57:46 2016 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)    Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (25140) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 254) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x7035)    SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   197   197   051    Pre-fail  Always       -       7601
  3 Spin_Up_Time            0x0027   183   175   021    Pre-fail  Always       -       5833
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       402
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       759
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       401
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       118
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10157
194 Temperature_Celsius     0x0022   122   114   000    Old_age   Always       -       28
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       85
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       22
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   196   196   000    Old_age   Offline      -       1311

SMART Error Log Version: 1
ATA Error Count: 9 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 9 occurred at disk power-on lifetime: 108 hours (4 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 45 00 00 00 a0  Device Fault; Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ef 03 45 00 00 00 a0 0a      00:54:09.032  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:54:09.008  IDENTIFY DEVICE
  ec 00 00 00 00 00 a0 0a      00:54:03.928  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 0a      00:54:03.921  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:54:03.857  IDENTIFY DEVICE

Error 8 occurred at disk power-on lifetime: 108 hours (4 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 45 00 00 00 a0  Device Fault; Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ef 03 45 00 00 00 a0 0a      00:54:03.921  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:54:03.857  IDENTIFY DEVICE
  ec 00 00 00 00 00 a0 0a      00:53:58.753  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 0a      00:53:58.746  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:53:58.705  IDENTIFY DEVICE

Error 7 occurred at disk power-on lifetime: 108 hours (4 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 45 00 00 00 a0  Device Fault; Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ef 03 45 00 00 00 a0 0a      00:53:58.746  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:53:58.705  IDENTIFY DEVICE
  ec 00 00 00 00 00 a0 0a      00:53:29.465  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 0a      00:53:29.457  SET FEATURES [Set transfer mode]

Error 6 occurred at disk power-on lifetime: 108 hours (4 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0  Device Fault; Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ef 03 46 00 00 00 a0 0a      00:53:29.457  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:53:29.444  IDENTIFY DEVICE
  ec 00 00 00 00 00 a0 0a      00:53:29.433  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 0a      00:53:29.425  SET FEATURES [Set transfer mode]

Error 5 occurred at disk power-on lifetime: 108 hours (4 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0  Device Fault; Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ef 03 46 00 00 00 a0 0a      00:53:29.425  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:53:29.409  IDENTIFY DEVICE
  ec 00 00 00 00 00 a0 0a      00:53:29.401  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 0a      00:53:29.393  SET FEATURES [Set transfer mode]

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

ubuntu@ubuntu:~$ sudo smartctl -s on -a /dev/sdc
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-31-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00D8PB0
Serial Number:    WD-WCC4M2859957
LU WWN Device Id: 5 0014ee 25f7b3e08
Firmware Version: 80.00A80
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Oct 30 14:59:24 2016 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)    Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (26880) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 271) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x7035)    SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   174   170   021    Pre-fail  Always       -       4258
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       404
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       764
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       403
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       121
193 Load_Cycle_Count        0x0032   199   199   000    Old_age   Always       -       4895
194 Temperature_Celsius     0x0022   119   111   000    Old_age   Always       -       28
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

ubuntu@ubuntu:~$ sudo smartctl -s on -a /dev/sdd
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-31-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00D8PB0
Serial Number:    WD-WCC4M2859922
LU WWN Device Id: 5 0014ee 25f7b9dcd
Firmware Version: 80.00A80
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Oct 30 14:59:53 2016 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)    Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (26760) seconds.
Offline data collection
capabilities:              (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 270) minutes.
Conveyance self-test routine
recommended polling time:      (   5) minutes.
SCT capabilities:            (0x7035)    SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   174   170   021    Pre-fail  Always       -       4283
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       402
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       764
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       401
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       118
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10987
194 Temperature_Celsius     0x0022   118   112   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Hors ligne

#6 Le 30/10/2016, à 17:05

piouk03

Re : [Résolu] Problème RAID5 mdadm

J'ai essayé d'analyser les résultats...mais je me rends compte que je suis TRÈS loin de maîtriser les bases du langage linux, car je ne comprends rien ! Tu peux en tirer quelque chose ?

Hors ligne

#7 Le 30/10/2016, à 18:02

Bougron

Re : [Résolu] Problème RAID5 mdadm

Ce n'est pas un language linux, Si tu avais utilisé windows, tu aurais eu les même chiffres mais en couleurs.
Tu as parlé de disques de 3 To.
Il va falloir que tu vérifies ta facture d'achat car les disques que tu as analysé font 2 To

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00D8PB0
Serial Number:    WD-WCC4N1077118
LU WWN Device Id: 5 0014ee 20a25d9cb
Firmware Version: 80.00A80
User Capacity:    2,000,398,934,016 bytes [2.00 TB]

Ce premier disque est en très bon état. Il est assez jeune.
9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       764

Le second disque SDB fait aussi 2 To et a 759 heures de fonctionnement mais il a 85 pistes fichues.

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       85

Le troisième disque SDC fait aussi 2To et a aussi 764 heures de fonctionnement et est aussi en très bon état.

Le quatrième disque SDC fait aussi 2To et a aussi 764 heures de fonctionnement et est aussi en très bon état.

Voila pour la qualité des disques.
Mon idée est que le disque SDB a été éliminé du RAID5 au démarrage à cause de son mauvais état. Il élimine aussi son 'partenaire" même s'il est en excellente santé car du RAID5  c'est aussi du RAID0 et en RAID0 si un disque est HS l'autre devient  inutilisable.
Il faudrait donc que tu identifies le partenaire de SDB et qu'en commandes 'RAID" tu déactives cette branche pour procéder à la réparation de SDB.
Je n'ai pas la compétence pour savoir comment MDADM se comporte en RAID5 lorsqu'il détecte qu'un disque ne fonctionne plus.  Je vais donc passer la main.

Dernière modification par Bougron (Le 31/10/2016, à 15:19)

Hors ligne

#8 Le 30/10/2016, à 18:11

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bonjour,
Effectivement c'est sdb qui est la cause probable du problème :
85 secteurs illisibles. Et qui restent en attente de remplacement par des secteurs de réserve.
(ce qui arrivera si a un moment donné ils peuvent être lu correctement)

Maintenant pourquoi le raid ne s'en dépatouille pas mieux que ça. Je l'ignore. Pour aller plus en avant, il faudrait installer le support raid sur le live :

sudo apt-get install mdadm

puis avoir un aperçu général avec

sudo lsblk -o SIZE,NAME,FSTYPE,LABEL,MOUNTPOINT

L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#9 Le 30/10/2016, à 18:16

Bougron

Re : [Résolu] Problème RAID5 mdadm

Bonjour Jamesbad000. 
Je te laisse la main.

(ce qui arrivera si a un moment donné ils peuvent être lu correctement)
Ou  recevoir un ordre d'écriture sans lecture?

Dernière modification par Bougron (Le 30/10/2016, à 18:23)

Hors ligne

#10 Le 30/10/2016, à 18:21

piouk03

Re : [Résolu] Problème RAID5 mdadm

Un grand merci pour ton analyse et ta rapidité dans les réponses. En effet je me suis rappelé que c'était des 2To quand j'ai vu le résultat des tests. Au départ il devait être équipé de 3To mais comme j'avais 2 disques de 2To qui traînaient j'ai tout monté en 2To de même marque.

Alors pour la suite je viens de faire ce que tu as noté "jamesbas000" voici le résultat (je vois qu'il n'y a pas de point de montage indiqué, mais là je suis toujours sur un Ubuntu live et non sur mon Ubuntu serveur avec le montage du raid réalisé, car je ne peux lancer aucune commande sur mon ubuntu serveur à cause du raid qui ne se monte pas)

SIZE NAME   FSTYPE            LABEL                    MOUNTPOINT
 1.8T sda                                               
 1.8T └─sda1 linux_raid_member server:0                 
 1.8T sdb                                               
 1.8T └─sdb1 linux_raid_member server:0                 
 1.8T sdc                                               
 1.8T └─sdc1 linux_raid_member server:0                 
 1.8T sdd                                               
 1.8T └─sdd1 linux_raid_member server:0                 
 7.2G sde    iso9660           Ubuntu 16.04.1 LTS amd64 /cdrom
 1.4G ├─sde1 iso9660           Ubuntu 16.04.1 LTS amd64 
 2.3M └─sde2 vfat              Ubuntu 16.04.1 LTS amd64 
 1.4G loop0  squashfs                                   /rofs

Hors ligne

#11 Le 30/10/2016, à 18:25

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bonjour Bougron. On va voir si j'ai la main verte avec le raid 5:)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#12 Le 30/10/2016, à 19:09

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

piouk03 a écrit :

Je suis toujours sur un Ubuntu live et non sur mon Ubuntu serveur avec le montage du raid réalisé, car je ne peux lancer aucune commande sur mon ubuntu serveur à cause du raid qui ne se monte pas)

J'avais bien compris. c'est pourquoi j'avais demandé d'installer mdadm...

maintenant que donne

sudo mdadm --misc  -E /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1
sudo mdadm -A  /dev/md0 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1
sudo mdadm --misc -D /dev/md0

L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#13 Le 30/10/2016, à 19:20

piouk03

Re : [Résolu] Problème RAID5 mdadm

sudo mdadm --misc  -E /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : a87de0bb:5524fffe:76f1ed34:4433e772
           Name : server:0
  Creation Time : Mon Sep 22 12:19:12 2014
     Raid Level : raid5
   Raid Devices : 4

 Avail Dev Size : 3906764800 (1862.89 GiB 2000.26 GB)
     Array Size : 5860146792 (5588.67 GiB 6000.79 GB)
  Used Dev Size : 3906764528 (1862.89 GiB 2000.26 GB)
    Data Offset : 262144 sectors
   Super Offset : 8 sectors
   Unused Space : before=262064 sectors, after=272 sectors
          State : clean
    Device UUID : cb078d17:63bc21c6:0ed803c7:3dd3e05b

    Update Time : Tue May 17 14:32:59 2016
       Checksum : 2ffc9eca - correct
         Events : 785

         Layout : left-symmetric
     Chunk Size : 4K

   Device Role : Active device 3
   Array State : ..AA ('A' == active, '.' == missing, 'R' == replacing)
/dev/sdb1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : a87de0bb:5524fffe:76f1ed34:4433e772
           Name : server:0
  Creation Time : Mon Sep 22 12:19:12 2014
     Raid Level : raid5
   Raid Devices : 4

 Avail Dev Size : 3906764800 (1862.89 GiB 2000.26 GB)
     Array Size : 5860146792 (5588.67 GiB 6000.79 GB)
  Used Dev Size : 3906764528 (1862.89 GiB 2000.26 GB)
    Data Offset : 262144 sectors
   Super Offset : 8 sectors
   Unused Space : before=262064 sectors, after=272 sectors
          State : active
    Device UUID : 6310c891:e9e64324:16523d32:3344207e

    Update Time : Tue May 17 13:12:43 2016
       Checksum : 95d4aa23 - correct
         Events : 753

         Layout : left-symmetric
     Chunk Size : 4K

   Device Role : Active device 0
   Array State : AAAA ('A' == active, '.' == missing, 'R' == replacing)
/dev/sdc1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : a87de0bb:5524fffe:76f1ed34:4433e772
           Name : server:0
  Creation Time : Mon Sep 22 12:19:12 2014
     Raid Level : raid5
   Raid Devices : 4

 Avail Dev Size : 3906764800 (1862.89 GiB 2000.26 GB)
     Array Size : 5860146792 (5588.67 GiB 6000.79 GB)
  Used Dev Size : 3906764528 (1862.89 GiB 2000.26 GB)
    Data Offset : 262144 sectors
   Super Offset : 8 sectors
   Unused Space : before=262064 sectors, after=272 sectors
          State : active
    Device UUID : 1c03f97f:6b167c10:faa29695:f7fa1903

    Update Time : Tue May 17 13:12:43 2016
       Checksum : 5890d3d7 - correct
         Events : 753

         Layout : left-symmetric
     Chunk Size : 4K

   Device Role : Active device 1
   Array State : AAAA ('A' == active, '.' == missing, 'R' == replacing)
/dev/sdd1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : a87de0bb:5524fffe:76f1ed34:4433e772
           Name : server:0
  Creation Time : Mon Sep 22 12:19:12 2014
     Raid Level : raid5
   Raid Devices : 4

 Avail Dev Size : 3906764800 (1862.89 GiB 2000.26 GB)
     Array Size : 5860146792 (5588.67 GiB 6000.79 GB)
  Used Dev Size : 3906764528 (1862.89 GiB 2000.26 GB)
    Data Offset : 262144 sectors
   Super Offset : 8 sectors
   Unused Space : before=262064 sectors, after=272 sectors
          State : clean
    Device UUID : 5d00c613:7c9d4240:6c90e589:d90c4d4e

    Update Time : Tue May 17 14:32:59 2016
       Checksum : 5ba46a6d - correct
         Events : 785

         Layout : left-symmetric
     Chunk Size : 4K

   Device Role : Active device 2
   Array State : ..AA ('A' == active, '.' == missing, 'R' == replacing)

Hors ligne

#14 Le 30/10/2016, à 19:22

piouk03

Re : [Résolu] Problème RAID5 mdadm

sudo mdadm -A  /dev/md0 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1

mdadm: /dev/md0 assembled from 2 drives - not enough to start the array.

et

sudo mdadm --misc -D /dev/md0

/dev/md0:
        Version : 
     Raid Level : raid0
  Total Devices : 0

          State : inactive

    Number   Major   Minor   RaidDevice

A quoi servent ces commandes ?

Hors ligne

#15 Le 30/10/2016, à 19:31

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

- La première commande examine individuellement les métadonnées raid de chaque partition.
- la seconde tente d'assembler les 4 partitions sur /dev/md0 (Ca n'a pas fonctionné)
- la troisième permet de voir l'état de l'assemblage (rien n’apparaît à cause de l'échec de la commande précédente)

Maintenant je tente de comprendre la situation d'après les données de la première commande


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#16 Le 30/10/2016, à 19:39

Bougron

Re : [Résolu] Problème RAID5 mdadm

Une piste ?
   Device Role : Active device 3
   Array State : ..AA ('A' == active, '.' == missing, 'R' == replacing)

donc sdb1 et ?

Dernière modification par Bougron (Le 30/10/2016, à 20:02)

Hors ligne

#17 Le 30/10/2016, à 19:49

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

2 des partitions on le status "Active" au lieu de "clean" et un compteur d'évènement inférieur. Ce qui est sans aucun doute en rapport avec le problème.
On ne va pas se précipiter pour tenter de réparer à la va vite, car avec 2 disques en rideau, la situation n'est absolument pas clair
Je vais tenter de reconstituer la même situation.

Cependant. Est-ce qu'il y a des données non sauvegardée la dedans. Parce que si ce n'est pas le cas, on va prendre moins de précautions ?

Dernière modification par jamesbad000 (Le 30/10/2016, à 19:50)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#18 Le 30/10/2016, à 20:07

piouk03

Re : [Résolu] Problème RAID5 mdadm

Oui il y a toutes mes photos à l’intérieur qui ne sont pas sauvegardés et justement je suis embêté de les perdre... Sinon j'aurais tout effacé et tout recommencé.

Et tout cas encore merci pour ton aide c'est super sympa wink

Hors ligne

#19 Le 30/10/2016, à 20:21

Bougron

Re : [Résolu] Problème RAID5 mdadm

Peux-tu refaire cette commande s'il te plait ?

sudo mdadm --misc  -E  /dev/sda1

Raison: Il n'est pas dans la sortie de la liste

Hors ligne

#20 Le 31/10/2016, à 02:03

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bon, ce que je comprends de la situation, c'est qu'il y a 2 disques qui ont du "décrocher" en même temps, et alors qu'il y avait des écritures en instance.

Il est fort possible que cela n'ait pas grand chose à voir avec les secteurs défectueux. En effet, dans le log les événement d'erreurs qui apparaissent sont assez ancien (à 108H de fonctionnement)

J'aimerais bien voir si on peut avoir des explication sur le rejet des 2 disques avec l'option -vv (avec un arrêt préalable...) :

sudo mdadm -S /dev/md0
sudo mdadm -A  -vv /dev/md0 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1
Bougron a écrit :

Raison: Il n'est pas dans la sortie de la liste

Si il est là. Même s'il manque l'indication du dev (perdu dans le copier collé je suppose) Car il y a des "active device" de 0 à 3.

Bougron a écrit :

(ce qui arrivera si a un moment donné ils peuvent être lu correctement)
Ou  recevoir un ordre d'écriture sans lecture?

Effectivement. Mais ce n'est pas quelque chose qui se fait naturellement. Pour une raison qui m'échappe encore, toute écriture (même avec dd) est précédée d'un lecture.
Il y a cependant une commande (dont le nom m'échappe à cet instant) qui permet de le faire...

Dernière modification par jamesbad000 (Le 31/10/2016, à 02:05)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#21 Le 31/10/2016, à 02:50

piouk03

Re : [Résolu] Problème RAID5 mdadm

Alors pour commencer Bougron je refais quand même la commande :

ubuntu@ubuntu:~$ sudo mdadm --misc  -E  /dev/sda1
/dev/sda1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x0
     Array UUID : a87de0bb:5524fffe:76f1ed34:4433e772
           Name : server:0
  Creation Time : Mon Sep 22 12:19:12 2014
     Raid Level : raid5
   Raid Devices : 4

 Avail Dev Size : 3906764800 (1862.89 GiB 2000.26 GB)
     Array Size : 5860146792 (5588.67 GiB 6000.79 GB)
  Used Dev Size : 3906764528 (1862.89 GiB 2000.26 GB)
    Data Offset : 262144 sectors
   Super Offset : 8 sectors
   Unused Space : before=262064 sectors, after=272 sectors
          State : clean
    Device UUID : cb078d17:63bc21c6:0ed803c7:3dd3e05b

    Update Time : Tue May 17 14:32:59 2016
       Checksum : 2ffc9eca - correct
         Events : 785

         Layout : left-symmetric
     Chunk Size : 4K

   Device Role : Active device 3
   Array State : ..AA ('A' == active, '.' == missing, 'R' == replacing)

Ensuite jamesbad000 voici ce qui sort de tes 2 lignes de commandes :

ubuntu@ubuntu:~$ sudo mdadm -S /dev/md0
mdadm: stopped /dev/md0
ubuntu@ubuntu:~$ sudo mdadm -A  -vv /dev/md0 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1
mdadm: looking for devices for /dev/md0
mdadm: /dev/sda1 is identified as a member of /dev/md0, slot 3.
mdadm: /dev/sdb1 is identified as a member of /dev/md0, slot 0.
mdadm: /dev/sdc1 is identified as a member of /dev/md0, slot 1.
mdadm: /dev/sdd1 is identified as a member of /dev/md0, slot 2.
mdadm: added /dev/sdb1 to /dev/md0 as 0 (possibly out of date)
mdadm: added /dev/sdc1 to /dev/md0 as 1 (possibly out of date)
mdadm: added /dev/sda1 to /dev/md0 as 3
mdadm: added /dev/sdd1 to /dev/md0 as 2
mdadm: /dev/md0 assembled from 2 drives - not enough to start the array.

Hors ligne

#22 Le 31/10/2016, à 11:13

Bougron

Re : [Résolu] Problème RAID5 mdadm

Bonjour
Pour visualiser le problème,  voici des extraits de la première demande

/dev/sda1        State : clean
    Update Time : Tue May 17 14:32:59 2016
         Events : 785
   Device Role : Active device 3

/dev/sdb1        State : active
    Update Time : Tue May 17 13:12:43 2016
         Events : 753
   Device Role : Active device 0
  
/dev/sdc1:      State : active 
    Update Time : Tue May 17 13:12:43 2016
         Events : 753
   Device Role : Active device 1
  
/dev/sdd1       State : clean
    Update Time : Tue May 17 14:32:59 2016
         Events : 785
   Device Role : Active device 2

Hors ligne

#23 Le 31/10/2016, à 13:00

piouk03

Re : [Résolu] Problème RAID5 mdadm

Comment ça Bougron ? Je ne comprends pas ton dernier message...

Hors ligne

#24 Le 31/10/2016, à 14:57

Bougron

Re : [Résolu] Problème RAID5 mdadm

Bonjour
Ces informations permettent de comprendre la  réponse au fait que deux disques ne se montent pas dans le RAIDS.
mdadm: added /dev/sdb1 to /dev/md0 as 0 (possibly out of date)    ====> Update Time : Tue May 17 13:12:43 2016
mdadm: added /dev/sdc1 to /dev/md0 as 1 (possibly out of date)   ====>  Update Time : Tue May 17 13:12:43 2016

Alors    que la bonne valeur                                                                             Update Time : Tue May 17 14:32:59 2016

Donc deux disques ont     1 heure 20 minutes et 16 secondes de retard d'écriture sur les deux autres.
Mais ce qui pourrait être surprenant c'est qu'il n'y aurait pas eu  d'écriture sur les disques depuis le  Mardi 17 Mai.
Je pense que tu ne sais plus ce qui c'est passé en ce fameux début d'après midi.
et pourquoi il  faut 6 mois pour que le problème soit mis en évidence.

Je n'ai absolument pas la connaissance pour aller dans les log de MDADM,   Attendons donc que  jamesbad000 ressorte une commande  spécifique.

En fait, j'ai fais ce tableau car j'étais curieux  de connaître   la différence en évitant de te demander de frapper la commande

sudo mdadm --examine /dev/sd[abcd]1 | egrep 'dev|Update|Role|State'

==> J'ai retrouvé cette discussion https://forum.ubuntu-fr.org/viewtopic.php?id=1884411   Mais il n'y avait qu'un seul missing!

J'ai aussi vu une commande qui ne résoud rien

[~] # mdadm --assemble --force --verbose /dev/md1 /dev/sda3 /dev/sdb3 /dev/sdc3 /dev/sdd3
mdadm: looking for devices for /dev/md1
mdadm: failed to get exclusive lock on mapfile - continue anyway...
mdadm: /dev/sda3 is identified as a member of /dev/md1, slot 0.
mdadm: /dev/sdb3 is identified as a member of /dev/md1, slot 1.
mdadm: /dev/sdc3 is identified as a member of /dev/md1, slot 2.
mdadm: /dev/sdd3 is identified as a member of /dev/md1, slot 3.
mdadm: added /dev/sdb3 to /dev/md1 as 1
mdadm: added /dev/sdc3 to /dev/md1 as 2 (possibly out of date)
mdadm: added /dev/sdd3 to /dev/md1 as 3 (possibly out of date)
mdadm: added /dev/sda3 to /dev/md1 as 0
mdadm: /dev/md1 assembled from 2 drives - not enough to start the array.

et un contournement
Using mdadm --assemble --scan --force did not work (not enough disks, it complained) when using a Debian rescue ISO. I later tried a Debian Live image (latest build) and the same command was able to recover the array.



au fait une question me vient en voyant ce commentaire:
>> Recently I lost 2 disks, out of 5, in my raid 5 array from a bad SATA power
>> cable. It was a Y splitter and it shorted... it was cheap. I was wondering
>> if there was any chance in getting my data back.

Dernière modification par Bougron (Le 31/10/2016, à 16:28)

Hors ligne

#25 Le 31/10/2016, à 17:33

piouk03

Re : [Résolu] Problème RAID5 mdadm

Alors pour la date du 17 mai j'ai résumé dans mon explication de départ en disant que "Tout fonctionnait bien jusqu'à quelques jours", pour dire que tout fonctionnait correctement à la base et que la panne est arrivé subitement.

Mais il est possible qu'il soit en panne depuis le 17 mai je n'ai pas la date exacte... Comme je l'ai expliqué précédemment, comme chaque disque fonctionnait séparément et qu'avec de nouveaux câbles cela ne changeait rien, pour moi c'était forcement la carte mère qui déconnait ou l'alim... Or je n'avait pas les finances de tout changer... Il est donc resté dans un coin à prendre la poussière jusqu'à il y a quelques jours, où j'ai enfin tout changé : carte mère, alim, etc.

Voilà je me suis dis qu'il n'était pas nécessaire d'expliquer tout cela dans mon introduction, et que "Tout fonctionnait bien jusqu'à quelques jours" revenait au même...

Ensuite pour le dernier commentaire que tu as listé, j'avais effectivement monté ce serveur "au moins cher" avec une alimentation de récupération : et donc des dédoubleurs pas cher pour les alimentations de disques dur... Bon maintenant ce n'est plus le cas, mais il est possible que se soit cela qui est créé les problèmes de non écritures sur 2 disques.

Il y a une autre chose à laquelle je pense, c'est le faite que j'ai monté ce serveur avec des disques "Green" donc économiques...Qui doivent se mettre tout seul en veille et pas toujours redémarrer quand cela est nécessaire. J'ai monté à peu près le même serveur pour mon père avec les mêmes disques, or les 2 serveurs ont (enfin avaient pour celui ci qui ne fonctionne plus...) le même problème : la première écriture sur le serveur échoue souvent (si tu allume le serveur et que tu copie un fichier dessus, le débit descend rapidement jusqu'à 0, puis repars une à 2 min après... Et le fichier transféré est parfois corrompu.) par contre une fois cette première écriture réalisée, tu peux copier autant de fichiers que tu veux sur le serveur, il n'y a plus aucune baisse de débit et les fichiers ne sont plus corrompus. C'est une habitude quand tu le sais, tu envois un premier fichier bidon sur le serveur et après tu envois ceux que tu as à sauvegarder, mais je me dis que cela à peut-être un lien avec mon problème actuel ?

Pour information le deuxième serveur que j'ai monté fonctionne depuis environ 3 ans sans aucun soucis (mise à par le premier chargement)

Hors ligne