Contenu | Rechercher | Menus

Annonce

DVD, clés USB et t-shirts Ubuntu-fr disponibles sur la boutique En Vente Libre

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#76 Le 19/02/2021, à 22:06

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Ok je viens de passer les partitions en Linux RAID avec gdisk
il faudra que je reboot pour que les opérations de changements soit prises en comptes,
comme me la suggérer gdisk ?

List avec fdisk -l avant redémarrage.

sudo fdisk -l
Disque /dev/sda : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : 7DD97423-76D4-48B4-A7A8-ED7992C9290F

Périphérique Début        Fin   Secteurs Taille Type
/dev/sda1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sdb : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : EF597E99-2271-4D1A-AEEB-493268CE5243

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdb1     2048 5860533134 5860531087   2,7T RAID Linux




Disque /dev/sdd : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : 00E55F67-3BAD-466A-9A29-5D6384B905A8

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdd1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sde : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : E2950BFE-7DBE-4D9B-A8B5-2F6F7A8D68F3

Périphérique Début        Fin   Secteurs Taille Type
/dev/sde1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sdf : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : F26B85CC-4FAB-490D-A431-D7F7C945E447

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdf1     2048 5860532223 5860530176   2,7T RAID Linux


Disque /dev/md127 : 13,66 TiB, 15002286161920 octets, 29301340160 secteurs
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 524288 octets / 2621440 octets


Disque /dev/sdg : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: ST3000DM001-1ER1
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : 30B0320F-DFD1-4DED-8C14-01EEA2B78BED

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdg1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sdh : 465,78 GiB, 500107862016 octets, 976773168 secteurs
Disk model: SAMSUNG HD501LJ 
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 512 octets
taille d'E/S (minimale / optimale) : 512 octets / 512 octets
Type d'étiquette de disque : dos
Identifiant de disque : 0x3ed43ed3

Périphérique Amorçage     Début       Fin Secteurs Taille Id Type
/dev/sdh1    *               63  97659134 97659072  46,6G 83 Linux
/dev/sdh2              97659135 144536804 46877670  22,4G  5 Étendue
/dev/sdh5              97659198 105466724  7807527   3,7G 82 partition d'échange Linux / Solaris
/dev/sdh6             105466788 144536804 39070017  18,6G 83 Linux

Hors ligne

#77 Le 19/02/2021, à 22:51

MicP

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Ça ne changera pas le système RAID,
mais au moins, quand tu auras un paquet de disques à trier,
tu sauras vite en lisant le retour de gdisk ou fdisk
que c'est un disque contenant une partition utilisée dans un RAID.

=======
Pour le disque qui remplacera /dev/sdc
Il faudra y créer une partition du même type : RAID Linux auto (fd00)
et c'est le nom de fichier de périphérique qui se termine par le chiffre 1 (première partition) qu'il faudra intégrer au RAID,
pas celui qui se termine par une lettre alphabétique et qui est associé au disque entier.

=======
Autre truc pour identifier un disque, c'est son numéro de série qui est inscrit sur l'étiquette collée au boîtier du disque.

C'est le même numéro de série qui est affiché dans du retour de la ligne de commande  :

udisksctl status

et qu'on retrouve aussi dans une partie du nom du lien qui est dans le répertoire /dev/disk/by-id/

Ce numéro de série permet d'identifier physiquement un disque
dans un paquet de disques qui seraient de la même marque, du même modèle et du même type.

Hors ligne

#78 Le 19/02/2021, à 22:52

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

J'ai redémarré le système du coup j'ai sdc1 qui a été réintégrer à la grappe raid mais qui a la table de partition GPT endommagé,
comme le suggérai geole je vais remplacer sdc par un disque neuf de 3To que j'ai sous le coude...

sudo fdisk -l
[sudo] Mot de passe de jeff : 
Disque /dev/sda : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : EF597E99-2271-4D1A-AEEB-493268CE5243

Périphérique Début        Fin   Secteurs Taille Type
/dev/sda1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sdd : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : 00E55F67-3BAD-466A-9A29-5D6384B905A8

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdd1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sde : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : E2950BFE-7DBE-4D9B-A8B5-2F6F7A8D68F3

Périphérique Début        Fin   Secteurs Taille Type
/dev/sde1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sdb : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : 7DD97423-76D4-48B4-A7A8-ED7992C9290F

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdb1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sdg : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: ST3000DM001-1ER1
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : 30B0320F-DFD1-4DED-8C14-01EEA2B78BED

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdg1     2048 5860533134 5860531087   2,7T RAID Linux


Disque /dev/sdh : 465,78 GiB, 500107862016 octets, 976773168 secteurs
Disk model: SAMSUNG HD501LJ 
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 512 octets
taille d'E/S (minimale / optimale) : 512 octets / 512 octets
Type d'étiquette de disque : dos
Identifiant de disque : 0x3ed43ed3

Périphérique Amorçage     Début       Fin Secteurs Taille Id Type
/dev/sdh1    *               63  97659134 97659072  46,6G 83 Linux
/dev/sdh2              97659135 144536804 46877670  22,4G  5 Étendue
/dev/sdh5              97659198 105466724  7807527   3,7G 82 partition d'échange Linux / Solaris
/dev/sdh6             105466788 144536804 39070017  18,6G 83 Linux


Disque /dev/sdf : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : F26B85CC-4FAB-490D-A431-D7F7C945E447

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdf1     2048 5860532223 5860530176   2,7T RAID Linux


La table de partitions GPT primaire est corrompue, mais la sauvegarde semble fonctionnelle, elle sera donc utilisée.
Disque /dev/sdc : 2,75 TiB, 3000592982016 octets, 5860533168 secteurs
Disk model: WDC WD30EZRX-00D
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : E164A1CB-8653-49BE-97B3-FEE25D8C9CE9

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdc1     2048 5860533134 5860531087   2,7T Système de fichiers Linux


Disque /dev/md127 : 13,66 TiB, 15002286161920 octets, 29301340160 secteurs
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 524288 octets / 2621440 octets
sudo gdisk /dev/sdc
GPT fdisk (gdisk) version 1.0.5

Caution! After loading partitions, the CRC doesn't check out!
Warning! Main partition table CRC mismatch! Loaded backup partition table
instead of main partition table!

Warning! One or more CRCs don't match. You should repair the disk!
Main header: OK
Backup header: OK
Main partition table: ERROR
Backup partition table: OK

Partition table scan:
  MBR: protective
  BSD: not present
  APM: not present
  GPT: damaged

****************************************************************************
Caution: Found protective or hybrid MBR and corrupt GPT. Using GPT, but disk
verification and recovery are STRONGLY recommended.
****************************************************************************

Command (? for help): q

Dernière modification par webangel (Le 20/02/2021, à 11:26)

Hors ligne

#79 Le 19/02/2021, à 23:02

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Ok notre post c'est croisé, je vais identifier le disk sdc avec son numéro de série et le passé faulty et removed.
Ensuite je le débranche, le remplace par le nouveau ensuite avec gdisk je cré une table de partition primaire GPT puis une partition Linux RAID,
puis j'ajoute la partition sdc1 au volume RAID et je surveille la reconstruction avec mdsat.
C'est partie... wink smile

Hors ligne

#80 Le 19/02/2021, à 23:26

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Ok tout c'est bien dérouler j'ai plus qu'à patienter jusqu'a la fin de la reconstruction du volume RAID.

sudo cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10] 
md127 : active raid6 sdc1[10] sda1[7] sdf1[9] sdd1[3] sdb1[6] sde1[4] sdg1[8]
      14650670080 blocks super 1.2 level 6, 512k chunk, algorithm 2 [7/6] [UU_UUUU]
      [>....................]  recovery =  0.0% (11004/2930134016) finish=93163.4min speed=524K/sec
sudo cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10] 
md127 : active raid6 sdc1[10] sda1[7] sdf1[9] sdd1[3] sdb1[6] sde1[4] sdg1[8]
      14650670080 blocks super 1.2 level 6, 512k chunk, algorithm 2 [7/6] [UU_UUUU]
      [>....................]  recovery =  0.1% (5356056/2930134016) finish=591.5min speed=82407K/sec

Dernière modification par webangel (Le 19/02/2021, à 23:28)

Hors ligne

#81 Le 20/02/2021, à 11:37

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonjour geole, MicP bonjour à tous,

La reconstruction viens de se terminer en 7h00 environs avec succès, voici les résultats

mdstat

sudo cat /proc/mdstat
[sudo] Mot de passe de jeff : 
Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10] 
md127 : active raid6 sdc1[10] sda1[7] sdf1[9] sdd1[3] sdb1[6] sde1[4] sdg1[8]
      14650670080 blocks super 1.2 level 6, 512k chunk, algorithm 2 [7/7] [UUUUUUU]
      
unused devices: <none>

et mdadm

sudo mdadm --detail /dev/md127
/dev/md127:
           Version : 1.2
     Creation Time : Fri Mar 22 14:27:12 2013
        Raid Level : raid6
        Array Size : 14650670080 (13971.97 GiB 15002.29 GB)
     Used Dev Size : 2930134016 (2794.39 GiB 3000.46 GB)
      Raid Devices : 7
     Total Devices : 7
       Persistence : Superblock is persistent

       Update Time : Sat Feb 20 07:20:39 2021
             State : clean 
    Active Devices : 7
   Working Devices : 7
    Failed Devices : 0
     Spare Devices : 0

            Layout : left-symmetric
        Chunk Size : 512K

Consistency Policy : resync

              Name : SRVNAS3T:0  (local to host SRVNAS3T)
              UUID : 0e2234e3:8853b712:5eb5db08:2afa36ea
            Events : 13334

    Number   Major   Minor   RaidDevice State
       6       8       17        0      active sync   /dev/sdb1
       7       8        1        1      active sync   /dev/sda1
      10       8       33        2      active sync   /dev/sdc1
       3       8       49        3      active sync   /dev/sdd1
       4       8       65        4      active sync   /dev/sde1
       9       8       81        5      active sync   /dev/sdf1
       8       8       97        6      active sync   /dev/sdg1

smartctl de sdc

sudo smartctl -a /dev/sdc
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate IronWolf
Device Model:     ST3000VN007-2AH16M
Serial Number:    ZDH9B181
LU WWN Device Id: 5 000c50 0c7eb7e35
Firmware Version: SC60
User Capacity:    3000592982016 bytes [3,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5980 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sat Feb 20 10:33:18 2021 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  581) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 484) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x50bd)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   071   070   044    Pre-fail  Always       -       11836843
  3 Spin_Up_Time            0x0003   100   100   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       1
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   063   060   045    Pre-fail  Always       -       2054963
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       12 (237 118 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       1
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   072   069   040    Old_age   Always       -       28 (Min/Max 23/31)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       1
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       1
194 Temperature_Celsius     0x0022   028   040   000    Old_age   Always       -       28 (0 23 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       12 (39 173 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       5860268224
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       14506

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Hors ligne

#82 Le 20/02/2021, à 11:53

geole

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonjour
Merci du retour
Donc, cette fois-ci une reconstruction (recovery)  faite dans un temps raisonnable.
A mon avis, si la précédente a duré une semaine, le mauvais état de l'ancien disque SDC devait en être la cause.
Le dernier rapport smartctl de ce disque était anormal, alors que le premier ne montrait rien de très grave.
Pourtant, il avait déjà été éjecté du raid....
Panne aléatoire du firmware?. Alors j'ai repris l'état du premier rapport en disant qu'il y avait quelque-chose qui m'avait échappé. Bingo
  7 Seek_Error_Rate         0x002e   118   001   000    Old_age   Always       -       23761
Si, au moment du passage, la qualité des recherches est de 118 pour 200, a un moment donné, la qualité fut de 1 pour 200 donc très proche de l'échec total.

Dernière modification par geole (Le 20/02/2021, à 14:38)

En ligne

#83 Le 20/02/2021, à 14:35

MicP

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Impec ! smile

Et merci pour le retour.

… si la précédente a duré une semaine, le mauvais état de l'ancien disque SDC devait en être la cause.

Oui, c'était clairement le mauvais état du disque /dev/sdc qui en était la cause :
il écrit, vérifie => pas bon, alors il essaye de corriger, puis vérifie => pas bon alors il marque la place comme HS, puis va recommencer ailleurs ……
…… et ça peut durer longtemps, puisqu'à mesure, l'état du disque se dégrade de plus en plus (sans compter l'état nerveux de l'administrateur).

Et puis là, un grand merci à smartctl, parce que sans ça, (par exemple à l'époque épique …),
ça aurait pris beaucoup plus de temps et de manipulations à faire pour pouvoir identifier le malade.

Dernière modification par MicP (Le 20/02/2021, à 14:42)

Hors ligne

#84 Le 20/02/2021, à 15:13

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Merci pour le retour geole et MicP

Je comprends mieux maintenant les mauvais résultats de "défunt" sdc lol wink
merci beaucoup à tous les deux. Je suis en train de m'occuper de mon autre NAS qui lui est monté avec 7 disques de 2 To.
et sdf a  Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       15
Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       15

sudo smartctl -a /dev/sdf
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00DC0B0
Serial Number:    WD-WMC300267035
LU WWN Device Id: 5 0014ee 65833c778
Firmware Version: 80.00A80
User Capacity:    2000398934016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sat Feb 20 00:26:31 2021 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(27900) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 282) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x70b5)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       129
  3 Spin_Up_Time            0x0027   176   175   021    Pre-fail  Always       -       4200
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       180
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   005   005   000    Old_age   Always       -       70061
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       180
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       107
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10929
194 Temperature_Celsius     0x0022   115   076   000    Old_age   Always       -       32
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       15
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       15
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       18

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

wink smile

Hors ligne

#85 Le 20/02/2021, à 16:24

geole

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Probablement l'enlever, le formater de façon lente avec gnome disk utility, vérifier que les secteurs pending sont bien disparus puis le ré-injecter.
Si les pending sont encore présents on tentera de les trouver  avec smartmontools et de forcer leur écriture

En ligne

#86 Le 20/02/2021, à 20:11

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Ok geole merci pour ton retour,
désolé pour le retard, j'ai mon fils qui est venu nous rendre une petite visite, cela faisait plusieurs mois que je ne l'avais pas vue.
Après cet aparté familial wink, je viens de lancer le formatage de sdf1 avec effacement des données à partir de disques gnome cela va prendre plusieurs heures environs 10h40.
À toute pour la suite des opérations. smile

Hors ligne

#87 Le 21/02/2021, à 12:59

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonjour,
Le formatage est terminé voici le smartctl il n' y a plus de pending sector

sudo smartctl -A /dev/sdf
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       129
  3 Spin_Up_Time            0x0027   176   175   021    Pre-fail  Always       -       4200
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       180
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   004   004   000    Old_age   Always       -       70097
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       180
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       107
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10932
194 Temperature_Celsius     0x0022   114   076   000    Old_age   Always       -       33
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       15
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       18

J'ai donc réintégré la partition sdf1 au volume raid

sudo mdadm --manage /dev/md0 --add /dev/sdf1
mdadm: added /dev/sdf1

Reconstruction en cours...

sudo cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdi1[1] sdh1[0]
      976759936 blocks [2/2] [UU]
      
md0 : active raid6 sdf1[8] sdc1[2] sde1[7] sda1[0] sdb1[1] sdd1[6]
      7813527552 blocks super 1.2 level 6, 512k chunk, algorithm 2 [6/5] [UUUUU_]
      [>....................]  recovery =  2.3% (46487672/1953381888) finish=276.4min speed=114963K/sec

Hors ligne

#88 Le 21/02/2021, à 18:46

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

J'aimerai si tu veux bien, avoir ton avis sur l'état de ces disques dans mon autre NAS sous Ubuntu 20.04 Desktop

sudo smartctl -A /dev/sda
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   198   198   051    Pre-fail  Always       -       13792
  3 Spin_Up_Time            0x0027   166   164   021    Pre-fail  Always       -       6691
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       237
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   001   001   000    Old_age   Always       -       85713
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       236
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       105
193 Load_Cycle_Count        0x0032   169   169   000    Old_age   Always       -       93246
194 Temperature_Celsius     0x0022   117   090   000    Old_age   Always       -       33
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   198   192   000    Old_age   Offline      -       795

Il faut probablement que je fasse comme tu me la montré un formatage avec effacement des données, avant de le réintégrer de nouveau sa partition sda1 dans le volume.
Pour réinitialiser les 4 pending sector ? smile

sudo smartctl -A /dev/sdb
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   253   253   021    Pre-fail  Always       -       1100
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       258
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   001   001   000    Old_age   Always       -       85676
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       256
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       127
193 Load_Cycle_Count        0x0032   151   151   000    Old_age   Always       -       148869
194 Temperature_Celsius     0x0022   115   087   000    Old_age   Always       -       35
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

La ça a l'air bon ?

sudo smartctl -A /dev/sdc
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       90
  3 Spin_Up_Time            0x0027   180   180   021    Pre-fail  Always       -       5975
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       161
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   006   006   000    Old_age   Always       -       69078
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       161
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       91
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10467
194 Temperature_Celsius     0x0022   115   087   000    Old_age   Always       -       35
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   197   000    Old_age   Offline      -       1

Un Current Pending Sector est-ce que j'applique la même méthode utiliser pour sdf ?

sudo smartctl -A /dev/sdd
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   101   099   006    Pre-fail  Always       -       3257744
  3 Spin_Up_Time            0x0003   096   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       65
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   063   060   030    Pre-fail  Always       -       2198243
  9 Power_On_Hours          0x0032   043   043   000    Old_age   Always       -       50433
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       65
183 Runtime_Bad_Block       0x0032   094   094   000    Old_age   Always       -       6
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   076   000    Old_age   Always       -       1 1 25
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   066   035   045    Old_age   Always   In_the_past 34 (69 216 36 27 0)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       25
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       216
194 Temperature_Celsius     0x0022   034   065   000    Old_age   Always       -       34 (0 21 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   079   000    Old_age   Always       -       267
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       50430h+58m+39.481s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       9588363702
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       271380610508

Il y a des UDMA_CRC_Error_Count    0x003e   200   079   000    Old_age   Always       -       267
Est-ce grave et que puis-je faire?

sudo smartctl -A /dev/sde
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   174   174   021    Pre-fail  Always       -       6283
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       88
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   009   009   000    Old_age   Always       -       66836
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       88
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       42
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       9932
194 Temperature_Celsius     0x0022   114   080   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

sde à l'air en forme ?

sudo smartctl -A /dev/sdf
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       129
  3 Spin_Up_Time            0x0027   176   175   021    Pre-fail  Always       -       4200
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       180
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   004   004   000    Old_age   Always       -       70102
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       180
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       107
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10932
194 Temperature_Celsius     0x0022   110   076   000    Old_age   Always       -       37
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       15
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       18

sdf on la vue plus haut Current Pending Sector 0 c'est Ok ?

sudo smartctl -A /dev/sdg
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   056   044   006    Pre-fail  Always       -       21132936
  3 Spin_Up_Time            0x0003   100   100   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       578
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x000f   083   060   030    Pre-fail  Always       -       211109376
  9 Power_On_Hours          0x0032   010   010   000    Old_age   Always       -       79319
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   020    Old_age   Always       -       1152
194 Temperature_Celsius     0x0022   039   070   000    Old_age   Always       -       39
195 Hardware_ECC_Recovered  0x001a   056   044   000    Old_age   Always       -       21132936
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0

sdg disque systéme à l'air Ok ?

Et maintenant les disques de 1 To en mirroir (RAID1)

sudo smartctl -A /dev/sdh
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       253
  2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
  3 Spin_Up_Time            0x0023   073   043   025    Pre-fail  Always       -       8207
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       428
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       92954
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       7
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       242
191 G-Sense_Error_Rate      0x0022   252   252   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   063   022   000    Old_age   Always       -       37 (Min/Max 18/78)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   252   252   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       0
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       7
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       479

Et le deuxieme sdi en mirroir.

sudo smartctl -A /dev/sdi
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       1
  2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
  3 Spin_Up_Time            0x0023   074   070   025    Pre-fail  Always       -       8136
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       404
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       89608
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       139
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       243
191 G-Sense_Error_Rate      0x0022   252   252   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   025   000    Old_age   Always       -       35 (Min/Max -3/75)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   252   252   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       6
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       139
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       720

Merci pour ton expertise? wink smile

Edit: La reconstruction est terminée avec succés:

sudo cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdi1[1] sdh1[0]
      976759936 blocks [2/2] [UU]
      
md0 : active raid6 sdf1[8] sdc1[2] sde1[7] sda1[0] sdb1[1] sdd1[6]
      7813527552 blocks super 1.2 level 6, 512k chunk, algorithm 2 [6/6] [UUUUUU]
      
unused devices: <none>
sudo smartctl -A /dev/sdf
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       129
  3 Spin_Up_Time            0x0027   176   175   021    Pre-fail  Always       -       4200
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       180
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   004   004   000    Old_age   Always       -       70103
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       180
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       107
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10932
194 Temperature_Celsius     0x0022   110   076   000    Old_age   Always       -       37
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       15
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       18
sudo mdadm --detail /dev/md0
/dev/md0:
           Version : 1.2
     Creation Time : Mon Apr  1 14:04:35 2013
        Raid Level : raid6
        Array Size : 7813527552 (7451.56 GiB 8001.05 GB)
     Used Dev Size : 1953381888 (1862.89 GiB 2000.26 GB)
      Raid Devices : 6
     Total Devices : 6
       Persistence : Superblock is persistent

       Update Time : Sun Feb 21 17:52:43 2021
             State : clean 
    Active Devices : 6
   Working Devices : 6
    Failed Devices : 0
     Spare Devices : 0

            Layout : left-symmetric
        Chunk Size : 512K

Consistency Policy : resync

              Name : SRVNAS2T:0  (local to host SRVNAS2T)
              UUID : 33258b5d:afb0679d:b12f595e:a49af14c
            Events : 5871

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1
       2       8       33        2      active sync   /dev/sdc1
       6       8       49        3      active sync   /dev/sdd1
       7       8       65        4      active sync   /dev/sde1
       8       8       81        5      active sync   /dev/sdf1

A toute geole smile

Dernière modification par webangel (Le 21/02/2021, à 18:58)

Hors ligne

#89 Le 21/02/2021, à 20:08

geole

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonsoir
Pour cette ligne
199 UDMA_CRC_Error_Count    0x003e  200   079   000    Old_age   Always       -       267
C'est un problème de connectique "The count of errors in data transfer via the interface cable as determined by ICRC (Interface Cyclic Redundancy Check). " ( https://en.wikipedia.org/wiki/S.M.A.R.T. )
Mais actuellement, il n'a plus lieu ( 200 )

Pour les secteurs défectueux des deux disques SDA et SDC
Je te propose d'utiliser smartmontools https://doc.ubuntu-fr.org/smartmontools
je pense que cela devrait te permettre de faire les commandes en même temps et de ne pas trop solliciter tes autres disques car tout ce matériel me semble assez vieux.
La commande pour initialiser  (remplacer X par la bonne lettre)

sudo smartctl -t long  /dev/sdX

La commande pour récupérer

sudo smartctl -q errorsonly -H -l selftest /dev/sdX

Dernière modification par geole (Le 21/02/2021, à 20:11)

En ligne

#90 Le 21/02/2021, à 21:19

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Oui en effet le matériel est vieux c'est un AMD Athlon II X2 255 de l'année 2010 avec 2 Go de RAM

sudo inxi -F
System:    Kernel: 5.4.0-65-generic x86_64 bits: 64 Console: tty 0 Distro: Ubuntu 20.04.2 LTS (Focal Fossa) 
Machine:   Type: Desktop Mobo: Gigabyte model: GA-880GA-UD3H v: x.x serial: N/A BIOS: Award v: F7 date: 11/24/2010 
CPU:       Topology: Dual Core model: AMD Athlon II X2 255 bits: 64 type: MCP L2 cache: 2048 KiB 
           Speed: 1900 MHz min/max: 800/3100 MHz Core speeds (MHz): 1: 1900 2: 800 
Graphics:  Device-1: Advanced Micro Devices [AMD/ATI] RS880 [Radeon HD 4250] driver: radeon v: kernel 
           Display: server: X.org 1.20.9 driver: ati,fbdev unloaded: modesetting,radeon,vesa tty: 147x55 
           Message: Advanced graphics data unavailable in console for root. 
Audio:     Device-1: Advanced Micro Devices [AMD/ATI] SBx00 Azalia driver: snd_hda_intel 
           Device-2: Advanced Micro Devices [AMD/ATI] RS880 HDMI Audio [Radeon HD 4200 Series] driver: snd_hda_intel 
           Sound Server: ALSA v: k5.4.0-65-generic 
Network:   Device-1: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet driver: r8169 
           IF: eth0 state: up speed: 1000 Mbps duplex:  
Drives:    Local Storage: total: 12.84 TiB used: 6.71 TiB (52.2%) 
           ID-1: /dev/sda vendor: Western Digital model: WD20EARS-00MVWB0 size: 1.82 TiB 
           ID-2: /dev/sdb vendor: Western Digital model: WD20EARS-00MVWB0 size: 1.82 TiB 
           ID-3: /dev/sdc vendor: Western Digital model: WD20EZRX-00DC0B0 size: 1.82 TiB 
           ID-4: /dev/sdd vendor: Seagate model: ST2000DM001-1ER164 size: 1.82 TiB 
           ID-5: /dev/sde vendor: Western Digital model: WD20EZRX-00DC0B0 size: 1.82 TiB 
           ID-6: /dev/sdf vendor: Western Digital model: WD20EZRX-00DC0B0 size: 1.82 TiB 
           ID-7: /dev/sdg vendor: Seagate model: ST3120023A size: 111.79 GiB 
           ID-8: /dev/sdh vendor: Samsung model: HD103SJ size: 931.51 GiB 
           ID-9: /dev/sdi vendor: Samsung model: HD103SJ size: 931.51 GiB 
RAID:      Device-1: md1 type: mdraid status: active raid: mirror report: 2/2 UU Components: online: sdi1~c1 sdh1~c0 
           Device-2: md0 type: mdraid status: active raid: raid-6 report: 6/6 UUUUUU Components: 
           online: sdf1~c8 sdc1~c2 sde1~c7 sda1~c0 sdb1~c1 sdd1~c6 
Partition: ID-1: / size: 45.71 GiB used: 11.09 GiB (24.3%) fs: ext4 dev: /dev/sdg1 
           ID-2: /home size: 18.21 GiB used: 149.1 MiB (0.8%) fs: ext4 dev: /dev/sdg6 
           ID-3: swap-1 size: 3.72 GiB used: 630.8 MiB (16.5%) fs: swap dev: /dev/sdg5 
Sensors:   System Temperatures: cpu: 28.1 C mobo: N/A 
           Fan Speeds (RPM): N/A 
Info:      Processes: 291 Uptime: 1d 21h 13m Memory: 1.69 GiB used: 996.1 MiB (57.5%) Init: systemd runlevel: 5 Shell: bash 
           inxi: 3.0.38 

Je viens de lancer l'outil smartmontools

sudo smartctl -t long  /dev/sda
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 340 minutes for test to complete.
Test will complete after Mon Feb 22 01:45:15 2021 CET
Use smartctl -X to abort test.

Je patiente 340 Minutes environs et ensuite je lance
sudo smartctl -q errorsonly -H -l selftest /dev/sdX

Merci a toute geole... smile

Hors ligne

#91 Le 21/02/2021, à 22:18

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Ok je l'ai lancé en parallèle pour sdc également, bonne soirée à demain. wink

Hors ligne

#92 Le 22/02/2021, à 12:46

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonjour, je reviens vers toi geole après que les commandes smartools soient terminées,
j'ai lancé les commandes de récupération des erreurs:

sudo smartctl -q errorsonly -H -l selftest /dev/sda
sudo smartctl -q errorsonly -H -l selftest /dev/sdc

Apparemment pas de retour d'erreur car rien ne s'affiche?

Hors ligne

#93 Le 22/02/2021, à 13:04

geole

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonjour
Du coup peux-tu donner les gros détails

sudo smartctl -a  /dev/sda
sudo smartctl -a  /dev/sdc

En ligne

#94 Le 22/02/2021, à 13:11

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Voici les details

sudo smartctl -a  /dev/sda
[sudo] Mot de passe de jeff : 
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Green (AF)
Device Model:     WDC WD20EARS-00MVWB0
Serial Number:    WD-WMAZA0977359
LU WWN Device Id: 5 0014ee 655c82efc
Firmware Version: 51.0AB51
User Capacity:    2000398934016 bytes [2,00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Mon Feb 22 12:07:38 2021 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(35160) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 340) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x3035)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   198   198   051    Pre-fail  Always       -       13792
  3 Spin_Up_Time            0x0027   166   164   021    Pre-fail  Always       -       6691
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       237
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   001   001   000    Old_age   Always       -       85732
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       236
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       105
193 Load_Cycle_Count        0x0032   169   169   000    Old_age   Always       -       93268
194 Temperature_Celsius     0x0022   120   090   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   198   192   000    Old_age   Offline      -       795

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     20185         -
# 2  Extended offline    Aborted by host               90%     20180         -
# 3  Short offline       Completed without error       00%     18560         -
# 4  Extended offline    Completed without error       00%       634         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
sudo smartctl -a  /dev/sdc
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00DC0B0
Serial Number:    WD-WMC1T2854437
LU WWN Device Id: 5 0014ee 058dd2ba6
Firmware Version: 80.00A80
User Capacity:    2000398934016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon Feb 22 12:10:01 2021 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(26760) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 270) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x70b5)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       90
  3 Spin_Up_Time            0x0027   180   180   021    Pre-fail  Always       -       5975
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       161
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   006   006   000    Old_age   Always       -       69097
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       161
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       91
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10471
194 Temperature_Celsius     0x0022   120   087   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   197   000    Old_age   Offline      -       1

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      3551         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

À toute.

Hors ligne

#95 Le 22/02/2021, à 14:18

geole

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Surprenant, les passages ne semblent pas enregistrés. J'ai l'impression que c'est pareil dans mon environnement.
Cela n'enregistre peut-être qu'en cas d'erreur.
On va faire autrement en demandant la lecture de tout le disque. Cela devrait se planter au premier secteur illisible.

sudo dd if=/dev/sda  of=/dev/null   bs=1M status=progress
sudo dd if=/dev/sdc  of=/dev/null   bs=1M status=progress

A lancer simultanément dans deux sessions utilisateurs

Dernière modification par geole (Le 22/02/2021, à 14:19)

En ligne

#96 Le 22/02/2021, à 14:41

geole

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Peux-tu donner ces retours

journalctl -b | grep "self-test in progress"
journalctl -b -1 | grep "self-test in progress"
journalctl -b -2 | grep "self-test in progress"

En ligne

#97 Le 22/02/2021, à 14:56

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Voici les retours :

journalctl -b | grep "self-test in progress"
févr. 21 19:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 90% remaining
févr. 21 20:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 80% remaining
févr. 21 21:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 70% remaining
févr. 21 21:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 90% remaining
févr. 21 21:57:22 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 60% remaining
févr. 21 21:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 80% remaining
févr. 21 22:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 50% remaining
févr. 21 22:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 70% remaining
févr. 21 22:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 40% remaining
févr. 21 22:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 60% remaining
févr. 21 23:27:21 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 50% remaining
févr. 21 23:57:22 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 30% remaining
févr. 21 23:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 40% remaining
févr. 22 00:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 20% remaining
févr. 22 00:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 20% remaining
févr. 22 00:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 10% remaining
févr. 22 00:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 10% remaining
journalctl -b -1 | grep "self-test in progress"

Rien en retour sur cette dernière commande

journalctl -b -2 | grep "self-test in progress"

Rien en retour sur cette dernière commande également.


Edit: Je viens de relancer la première commande:

journalctl -b | grep "self-test in progress"
févr. 21 19:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 90% remaining
févr. 21 20:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 80% remaining
févr. 21 21:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 70% remaining
févr. 21 21:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 90% remaining
févr. 21 21:57:22 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 60% remaining
févr. 21 21:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 80% remaining
févr. 21 22:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 50% remaining
févr. 21 22:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 70% remaining
févr. 21 22:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 40% remaining
févr. 21 22:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 60% remaining
févr. 21 23:27:21 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 50% remaining
févr. 21 23:57:22 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 30% remaining
févr. 21 23:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 40% remaining
févr. 22 00:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 20% remaining
févr. 22 00:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 20% remaining
févr. 22 00:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 10% remaining
févr. 22 00:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 10% remaining

Je pense que le self-test est bloqué à 10% du temps restant depuis hier 22:00 environs.
Qu'en penses-tu geole ?

Dernière modification par webangel (Le 22/02/2021, à 20:59)

Hors ligne

#98 Le 23/02/2021, à 11:40

geole

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonjour
Je pense tout simplement que le selt-test oublie de dire dans la trace qu'il est terminé.
Fais ce que je t'ai proposé https://forum.ubuntu-fr.org/viewtopic.p … #p22420032

En ligne

#99 Le 23/02/2021, à 13:52

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Bonjour,
Merci je viens de lancer les tests de lecture en parallèle, c'est en cours. smile

sudo dd if=/dev/sda  of=/dev/null   bs=1M status=progress
sudo dd if=/dev/sdc  of=/dev/null   bs=1M status=progress

Edit: j'ai le résultat pour le moment du test de sdc:

sudo dd if=/dev/sdc  of=/dev/null   bs=1M status=progress
2000395698176 octets (2,0 TB, 1,8 TiB) copiés, 17165 s, 117 MB/s
1907729+1 enregistrements lus
1907729+1 enregistrements écrits
2000398934016 octets (2,0 TB, 1,8 TiB) copiés, 17165 s, 117 MB/s

Il y a autant d'enregistrements lus que d'écrits cela doit peut-être un bon signe? smile

sudo smartctl  -a /dev/sdc
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Green
Device Model:     WDC WD20EZRX-00DC0B0
Serial Number:    WD-WMC1T2854437
LU WWN Device Id: 5 0014ee 058dd2ba6
Firmware Version: 80.00A80
User Capacity:    2000398934016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Feb 23 17:35:56 2021 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(26760) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 270) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x70b5)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       90
  3 Spin_Up_Time            0x0027   180   180   021    Pre-fail  Always       -       5975
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       161
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   006   006   000    Old_age   Always       -       69126
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       161
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       91
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10473
194 Temperature_Celsius     0x0022   118   087   000    Old_age   Always       -       32
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   197   000    Old_age   Offline      -       1

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      3551         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Pour sda:

sudo dd if=/dev/sda  of=/dev/null   bs=1M status=progress
2000396746752 octets (2,0 TB, 1,8 TiB) copiés, 20829 s, 96,0 MB/s
1907729+1 enregistrements lus
1907729+1 enregistrements écrits
2000398934016 octets (2,0 TB, 1,8 TiB) copiés, 20829,1 s, 96,0 MB/s
sudo smartctl -a /dev/sda
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-65-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Green (AF)
Device Model:     WDC WD20EARS-00MVWB0
Serial Number:    WD-WMAZA0977359
LU WWN Device Id: 5 0014ee 655c82efc
Firmware Version: 51.0AB51
User Capacity:    2000398934016 bytes [2,00 TB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Tue Feb 23 18:22:14 2021 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(35160) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 340) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x3035)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   197   197   051    Pre-fail  Always       -       14430
  3 Spin_Up_Time            0x0027   166   164   021    Pre-fail  Always       -       6691
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       237
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   001   001   000    Old_age   Always       -       85762
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       236
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       105
193 Load_Cycle_Count        0x0032   169   169   000    Old_age   Always       -       93337
194 Temperature_Celsius     0x0022   119   090   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   197   192   000    Old_age   Offline      -       824

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     20185         -
# 2  Extended offline    Aborted by host               90%     20180         -
# 3  Short offline       Completed without error       00%     18560         -
# 4  Extended offline    Completed without error       00%       634         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Qu'en penses tu?

Dernière modification par webangel (Le 23/02/2021, à 19:26)

Hors ligne

#100 Le 23/02/2021, à 23:11

webangel

Re : [Résolu] Raid6 state clean,degraded md127 depuis mise à niveau 20.04

Comme tu l'as demandé ici https://forum.ubuntu-fr.org/viewtopic.p … #p22420032
je te joins le résultat de la commande après test.

journalctl -b | grep "self-test in progress"
févr. 21 19:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 90% remaining
févr. 21 20:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 80% remaining
févr. 21 21:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 70% remaining
févr. 21 21:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 90% remaining
févr. 21 21:57:22 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 60% remaining
févr. 21 21:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 80% remaining
févr. 21 22:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 50% remaining
févr. 21 22:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 70% remaining
févr. 21 22:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 40% remaining
févr. 21 22:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 60% remaining
févr. 21 23:27:21 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 50% remaining
févr. 21 23:57:22 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 30% remaining
févr. 21 23:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 40% remaining
févr. 22 00:27:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 20% remaining
févr. 22 00:27:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 20% remaining
févr. 22 00:57:21 SRVNAS2T smartd[1597]: Device: /dev/sda [SAT], self-test in progress, 10% remaining
févr. 22 00:57:22 SRVNAS2T smartd[1597]: Device: /dev/sdc [SAT], self-test in progress, 10% remaining

Même résultat que dans le post un peu plus haut

Hors ligne