Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#76 Le 13/11/2016, à 21:02

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bon dernière cartouche, c'est qu'il y ait eu maldonne sur le cat (donne le retour avec la ligne de commande incluse dans le copié/collé + la ligne suivante, et c'est une règle à suivre systématiquement pour éviter tout doute. )

sudo cat ~/sdb2.badblocks

ps tu te souviens pourquoi tu aurais eu besoin de faire 3 fois la commande avec l'option -w ??

edit j'ai ajouté sudo au début de la commande

edit 2 : ce qui m'interpelle aussi c'est que le cat ~/sdb2.badblocks n'apparait pas dans l'historique

Dernière modification par jamesbad000 (Le 13/11/2016, à 21:15)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#77 Le 13/11/2016, à 21:24

piouk03

Re : [Résolu] Problème RAID5 mdadm

Oui je me souviens pourquoi : j'ai essayé de lancer la commande du serveur la première fois, ensuite j'ai pensé qu'il serait mieux de le faire de putty de mon PC pour pouvoir vous copier des infos si nécessaire, et au final de putty je n'avais aucun retour, donc j'ai relancé du serveur....

Après pour la commande qui n’apparaît pas dans l'historique, c'est que j'ai dû la lancer du live.

@server:~$ sudo cat ~/sdb2.badblocks
[sudo] password for :
130763003
131262785
484366121
484373738
484887687
484898118
484899195
485072450
485073080
485077573
485081774
485083995
485084844
485088633
485090223
485249530
485259002
485259386
485264444
485439949
485440115
485448289
485451365
485452839
485607592
485607901
485609037
485609052
485609148
485609367
485617471
485617989
485619800
485619975
485629020
485629685
485635791
485637223
485638071
485638271
485640443
485640744
485641218
485642087
485642235
484898222
484904649
484908734
485067172
485085466
485093441
485270704
485438996
485451050
485455094
485461147
485461843
485611557
485614562
485619001
485630604
485633763
129192892
484162711
484904527
485075989
485076470
485266555
485269452
485270499
485280851
485430725
485430850
485433282
485439703
485441939
485608464
485612047
485612668
485613177
485615644
485617011
485619530
485621675
485621690
485621826
485626686
485627114
485627804
485628508
485628624
485629172
485635924
485635943
485636622
485638035
484177286
484901405
485068152
485250391
485253365
485254408
485254530
485256937
485261306
485269471
485426876
485429330
485434529
485450439
485450811
485451064
485451844
485609651
485619926
485620254
485620670
485627896
485629079
485631396

Hors ligne

#78 Le 13/11/2016, à 22:14

Bougron

Re : [Résolu] Problème RAID5 mdadm

Question: Et si c'était l'action de reformater qui ferait le transfert des mauvais blocs?
Que risque-t-on à créer une table de partition, une partition sur le disque et à refaire un smartctl?

Hors ligne

#79 Le 13/11/2016, à 22:57

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bon maintenant on à 120 secteurs (incluant la liste précédente) ce qui fait qu'on en a trop.
Il semble donc que la commande badblocks a détectée plus d'erreurs qu'il n'y en a réellement. Sans que je puisse y apporter une explication certaine. En revanche ça peut expliquer pourquoi les secteurs que l'on a vérifiés sont lisibles

On va faire un scan de la liste complète des secteurs pour voir si on peut retrouver une certaine cohérence dans tout ça.

sudo -s
for block in $(cat ~/sdb2.badblocks); do hdparm --read-sector $(($block*8)) /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214 | grep 'reading sector'; done;
Bougron a écrit :

Question: Et si c'était l'action de reformater qui ferait le transfert des mauvais blocs?
Que risque-t-on à créer une table de partition, une partition sur le disque et à refaire un smartctl?

le formatage ne fait qu'écrire les structures du système de fichier en certains emplacement du disque (sauf à lui introduire une option de vérification qui utilise la commande badblocks)
De toute façon je maintiens que seul un outil qui contourne la gestion des E/S normales de l'OS, tel que hdparm, peut forcer la réécriture à coup sur (je reviendrais plus en détail la dessus et sur ton test plus haut ultérieurement...)

Dernière modification par jamesbad000 (Le 13/11/2016, à 22:59)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#80 Le 14/11/2016, à 19:49

piouk03

Re : [Résolu] Problème RAID5 mdadm

root@server:~# for block in $(cat ~/sdb2.badblocks); do hdparm --read-sector $(($block*8)) /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214 | grep 'reading sector'; done
reading sector 1046104024: succeeded
reading sector 1050102280: succeeded
reading sector 3874928968: succeeded
reading sector 3874989904: succeeded
reading sector 3879101496: succeeded
reading sector 3879184944: succeeded
reading sector 3879193560: succeeded
reading sector 3880579600: succeeded
reading sector 3880584640: succeeded
reading sector 3880620584: succeeded
reading sector 3880654192: succeeded
reading sector 3880671960: succeeded
reading sector 3880678752: succeeded
reading sector 3880709064: succeeded
reading sector 3880721784: succeeded
reading sector 3881996240: succeeded
reading sector 3882072016: succeeded
reading sector 3882075088: succeeded
reading sector 3882115552: succeeded
reading sector 3883519592: succeeded
reading sector 3883520920: succeeded
reading sector 3883586312: succeeded
FAILED: Input/output error
reading sector 3883610920:
reading sector 3883622712: succeeded
reading sector 3884860736: succeeded
reading sector 3884863208: succeeded
reading sector 3884872296: succeeded
reading sector 3884872416: succeeded
reading sector 3884873184: succeeded
reading sector 3884874936: succeeded
reading sector 3884939768: succeeded
reading sector 3884943912: succeeded
reading sector 3884958400: succeeded
reading sector 3884959800: succeeded
reading sector 3885032160: succeeded
reading sector 3885037480: succeeded
reading sector 3885086328: succeeded
reading sector 3885097784: succeeded
reading sector 3885104568: succeeded
reading sector 3885106168: succeeded
reading sector 3885123544: succeeded
reading sector 3885125952: succeeded
reading sector 3885129744: succeeded
reading sector 3885136696: succeeded
reading sector 3885137880: succeeded
reading sector 3879185776: succeeded
reading sector 3879237192: succeeded
reading sector 3879269872: succeeded
reading sector 3880537376: succeeded
reading sector 3880683728: succeeded
reading sector 3880747528: succeeded
reading sector 3882165632: succeeded
reading sector 3883511968: succeeded
reading sector 3883608400: succeeded
reading sector 3883640752: succeeded
reading sector 3883689176: succeeded
reading sector 3883694744: succeeded
reading sector 3884892456: succeeded
FAILED: Input/output error
reading sector 3884916496:
reading sector 3884952008: succeeded
reading sector 3885044832: succeeded
reading sector 3885070104: succeeded
reading sector 1033543136: succeeded
reading sector 3873301688: succeeded
reading sector 3879236216: succeeded
reading sector 3880607912: succeeded
reading sector 3880611760: succeeded
reading sector 3882132440: succeeded
reading sector 3882155616: succeeded
reading sector 3882163992: succeeded
reading sector 3882246808: succeeded
reading sector 3883445800: succeeded
reading sector 3883446800: succeeded
reading sector 3883466256: succeeded
reading sector 3883517624: succeeded
reading sector 3883535512: succeeded
reading sector 3884867712: succeeded
reading sector 3884896376: succeeded
reading sector 3884901344: succeeded
reading sector 3884905416: succeeded
reading sector 3884925152: succeeded
reading sector 3884936088: succeeded
reading sector 3884956240: succeeded
reading sector 3884973400: succeeded
reading sector 3884973520: succeeded
reading sector 3884974608: succeeded
reading sector 3885013488: succeeded
reading sector 3885016912: succeeded
reading sector 3885022432: succeeded
reading sector 3885028064: succeeded
reading sector 3885028992: succeeded
reading sector 3885033376: succeeded
reading sector 3885087392: succeeded
reading sector 3885087544: succeeded
reading sector 3885092976: succeeded
reading sector 3885104280: succeeded
reading sector 3873418288: succeeded
reading sector 3879211240: succeeded
reading sector 3880545216: succeeded
reading sector 3882003128: succeeded
reading sector 3882026920: succeeded
reading sector 3882035264: succeeded
FAILED: Input/output error
reading sector 3882036240:
reading sector 3882055496: succeeded
FAILED: Input/output error
reading sector 3882090448:
FAILED: Input/output error
reading sector 3882155768:
reading sector 3883415008: succeeded
reading sector 3883434640: succeeded
reading sector 3883476232: succeeded
reading sector 3883603512: succeeded
FAILED: Input/output error
reading sector 3883606488:
FAILED: Input/output error
reading sector 3883608512:
reading sector 3883614752: succeeded
reading sector 3884877208: succeeded
reading sector 3884959408: succeeded
reading sector 3884962032: succeeded
FAILED: Input/output error
reading sector 3884965360:
FAILED: Input/output error
reading sector 3885023168:
reading sector 3885032632: succeeded
FAILED: Input/output error
reading sector 3885051168:

Hors ligne

#81 Le 14/11/2016, à 22:56

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bien on en a trouvé 10. Ce qui n'a rien de cohérent mais bon...

Essayons de forcer l'écriture d'un secteur pour voir :

sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3883610920 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214

Ensuite on install smartmontools (version ligne de commande seule, parce que sur un serveur...)

sudo apt-get install  smartmontools
sudo smartctl -A /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214

L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#82 Le 15/11/2016, à 08:44

piouk03

Re : [Résolu] Problème RAID5 mdadm

La première commande c'est bon :

@server:~$ sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3883610920 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
[sudo] password for:

/dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214:
re-writing sector 3883610920: succeeded

Par contre je suis sous 12.04 LTS et impossible d'installer smartmontools et impossible de mettre à jour mon système :

@server:~$ sudo apt-get install  smartmontools
Lecture des listes de paquets... Fait
Construction de l'arbre des dépendances
Lecture des informations d'état... Fait
Paquets suggérés :
  gsmartcontrol smart-notifier
Les NOUVEAUX paquets suivants seront installés :
  smartmontools
0 mis à jour, 1 nouvellement installés, 0 à enlever et 1 non mis à jour.
Il est nécessaire de prendre 458 ko dans les archives.
Après cette opération, 1 364 ko d'espace disque supplémentaires seront utilisés.
Err http://fr.archive.ubuntu.com/ubuntu/ precise/main smartmontools amd64 5.41+svn3365-1
Erreur temporaire de résolution de « fr.archive.ubuntu.com »
Impossible de récupérer http://fr.archive.ubuntu.com/ubuntu/pool/main/s/smartmontools/smartmontools_5.41+svn3365-1_amd64.deb  Erreur temporaire de résolution de « fr.archive.ubuntu.com »
E: Impossible de récupérer quelques archives, peut-être devrez-vous lancer apt-get update ou essayer avec --fix-missing ?

et

@server:~# sudo apt-get update && sudo apt-get upgrade -y
Err http://security.ubuntu.com precise-security Release.gpg
  Erreur temporaire de résolution de « security.ubuntu.com »
Err http://fr.archive.ubuntu.com precise Release.gpg
  Erreur temporaire de résolution de « fr.archive.ubuntu.com »
Err http://fr.archive.ubuntu.com precise-updates Release.gpg
  Erreur temporaire de résolution de « fr.archive.ubuntu.com »
Err http://fr.archive.ubuntu.com precise-backports Release.gpg
  Erreur temporaire de résolution de « fr.archive.ubuntu.com »
Lecture des listes de paquets... Fait
W: Impossible de récupérer http://fr.archive.ubuntu.com/ubuntu/dists/precise/Release.gpg  Erreur temporaire de résolution de « fr.archive.ubuntu.com »

W: Impossible de récupérer http://fr.archive.ubuntu.com/ubuntu/dists/precise-updates/Release.gpg  Erreur temporaire de résolution de « fr.archive.ubuntu.com »

W: Impossible de récupérer http://fr.archive.ubuntu.com/ubuntu/dists/precise-backports/Release.gpg  Erreur temporaire de résolution de « fr.archive.ubuntu.com »

W: Impossible de récupérer http://security.ubuntu.com/ubuntu/dists/precise-security/Release.gpg  Erreur temporaire de résolution de « security.ubuntu.com »

W: Le téléchargement de quelques fichiers d'index a échoué, ils ont été ignorés, ou les anciens ont été utilisés à la place.
Lecture des listes de paquets... Fait
Construction de l'arbre des dépendances
Lecture des informations d'état... Fait
Les paquets suivants seront mis à jour :
  ifupdown
1 mis à jour, 0 nouvellement installés, 0 à enlever et 0 non mis à jour.
Il est nécessaire de prendre 48,3 ko dans les archives.
Après cette opération, 0 o d'espace disque supplémentaires seront utilisés.
Err http://fr.archive.ubuntu.com/ubuntu/ precise-updates/main ifupdown amd64 0.7~beta2ubuntu11.1
  Erreur temporaire de résolution de « fr.archive.ubuntu.com »
Impossible de récupérer http://fr.archive.ubuntu.com/ubuntu/pool/main/i/ifupdown/ifupdown_0.7~beta2ubuntu11.1_amd64.deb  Erreur temporaire de résolution de « fr.archive.ubuntu.com »
E: Impossible de récupérer quelques archives, peut-être devrez-vous lancer apt-get update ou essayer avec --fix-missing ?

Donc je crois que je vais essayer de tout réinstaller en 16.04 ce soir...

Hors ligne

#83 Le 15/11/2016, à 08:47

piouk03

Re : [Résolu] Problème RAID5 mdadm

Par contre maintenant : avec for block in $(cat ~/sdb2.badblocks); do hdparm --read-sector $(($block*8)) /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214 | grep 'reading sector'; done;

reading sector 3883610920: succeeded

Hors ligne

#84 Le 15/11/2016, à 08:53

piouk03

Re : [Résolu] Problème RAID5 mdadm

En espérant ne pas avoir grillé d'étapes j'ai fais ça :

sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3884916496 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3882036240 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3882090448 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3882155768 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3883606488 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3883608512 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3884965360 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3885023168 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
sudo hdparm --yes-i-know-what-i-am-doing --write-sector 3885051168 /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214

Ce qui donne :

reading sector 1046104024: succeeded
reading sector 1050102280: succeeded
reading sector 3874928968: succeeded
reading sector 3874989904: succeeded
reading sector 3879101496: succeeded
reading sector 3879184944: succeeded
reading sector 3879193560: succeeded
reading sector 3880579600: succeeded
reading sector 3880584640: succeeded
reading sector 3880620584: succeeded
reading sector 3880654192: succeeded
reading sector 3880671960: succeeded
reading sector 3880678752: succeeded
reading sector 3880709064: succeeded
reading sector 3880721784: succeeded
reading sector 3881996240: succeeded
reading sector 3882072016: succeeded
reading sector 3882075088: succeeded
reading sector 3882115552: succeeded
reading sector 3883519592: succeeded
reading sector 3883520920: succeeded
reading sector 3883586312: succeeded
reading sector 3883610920: succeeded
reading sector 3883622712: succeeded
reading sector 3884860736: succeeded
reading sector 3884863208: succeeded
reading sector 3884872296: succeeded
reading sector 3884872416: succeeded
reading sector 3884873184: succeeded
reading sector 3884874936: succeeded
reading sector 3884939768: succeeded
reading sector 3884943912: succeeded
reading sector 3884958400: succeeded
reading sector 3884959800: succeeded
reading sector 3885032160: succeeded
reading sector 3885037480: succeeded
reading sector 3885086328: succeeded
reading sector 3885097784: succeeded
reading sector 3885104568: succeeded
reading sector 3885106168: succeeded
reading sector 3885123544: succeeded
reading sector 3885125952: succeeded
reading sector 3885129744: succeeded
reading sector 3885136696: succeeded
reading sector 3885137880: succeeded
reading sector 3879185776: succeeded
reading sector 3879237192: succeeded
reading sector 3879269872: succeeded
reading sector 3880537376: succeeded
reading sector 3880683728: succeeded
reading sector 3880747528: succeeded
reading sector 3882165632: succeeded
reading sector 3883511968: succeeded
reading sector 3883608400: succeeded
reading sector 3883640752: succeeded
reading sector 3883689176: succeeded
reading sector 3883694744: succeeded
reading sector 3884892456: succeeded
reading sector 3884916496: succeeded
reading sector 3884952008: succeeded
reading sector 3885044832: succeeded
reading sector 3885070104: succeeded
reading sector 1033543136: succeeded
reading sector 3873301688: succeeded
reading sector 3879236216: succeeded
reading sector 3880607912: succeeded
reading sector 3880611760: succeeded
reading sector 3882132440: succeeded
reading sector 3882155616: succeeded
reading sector 3882163992: succeeded
reading sector 3882246808: succeeded
reading sector 3883445800: succeeded
reading sector 3883446800: succeeded
reading sector 3883466256: succeeded
reading sector 3883517624: succeeded
reading sector 3883535512: succeeded
reading sector 3884867712: succeeded
reading sector 3884896376: succeeded
reading sector 3884901344: succeeded
reading sector 3884905416: succeeded
reading sector 3884925152: succeeded
reading sector 3884936088: succeeded
reading sector 3884956240: succeeded
reading sector 3884973400: succeeded
reading sector 3884973520: succeeded
reading sector 3884974608: succeeded
reading sector 3885013488: succeeded
reading sector 3885016912: succeeded
reading sector 3885022432: succeeded
reading sector 3885028064: succeeded
reading sector 3885028992: succeeded
reading sector 3885033376: succeeded
reading sector 3885087392: succeeded
reading sector 3885087544: succeeded
reading sector 3885092976: succeeded
reading sector 3885104280: succeeded
reading sector 3873418288: succeeded
reading sector 3879211240: succeeded
reading sector 3880545216: succeeded
reading sector 3882003128: succeeded
reading sector 3882026920: succeeded
reading sector 3882035264: succeeded
reading sector 3882036240: succeeded
reading sector 3882055496: succeeded
reading sector 3882090448: succeeded
reading sector 3882155768: succeeded
reading sector 3883415008: succeeded
reading sector 3883434640: succeeded
reading sector 3883476232: succeeded
reading sector 3883603512: succeeded
reading sector 3883606488: succeeded
reading sector 3883608512: succeeded
reading sector 3883614752: succeeded
reading sector 3884877208: succeeded
reading sector 3884959408: succeeded
reading sector 3884962032: succeeded
reading sector 3884965360: succeeded
reading sector 3885023168: succeeded
reading sector 3885032632: succeeded
reading sector 3885051168: succeeded

Hors ligne

#85 Le 15/11/2016, à 10:16

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Ca a l'air pas mal.

par contre

@server:~# sudo apt-get update && sudo apt-get upgrade -y
Err http://security.ubuntu.com precise-security Release.gpg
  Erreur temporaire de résolution de « security.ubuntu.com »

A vu de nez ton pc n'a pas accès à internet. (si débranche mon cable j'ai la même chose)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#86 Le 15/11/2016, à 19:45

Bougron

Re : [Résolu] Problème RAID5 mdadm

Bonsoir
Ou tout simplement, le site est en maintenance et il va répondre maintenant
http://fr.archive.ubuntu.com/ubuntu/dis … elease.gpg

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.10 (GNU/Linux)

iEYEABECAAYFAk+Yf4YACgkQQJdur0N9BbVHsgCfR7AVn0dpd488Ge5cYlOCv5GA
g8wAmwaLRc0PwlYfNr3MbsgQ5T+RBbbd
=J4xr
-----END PGP SIGNATURE-----

Hors ligne

#87 Le 15/11/2016, à 20:03

Bougron

Re : [Résolu] Problème RAID5 mdadm

Bonsoir
Il y a quelques contradictions dans les listes des mauvais blocs
Je propose d'installer le logiciel DDRESCUE  https://doc.ubuntu-fr.org/ddrescue
et de lui demander à lui aussi sa liste
En faisant seulement en mode lecture, une douzaine d'heures devraient suffire

A) Un passage en mode rapide

echo SUIVI >ddsuiviSDB
sudo ddrescue -f -n -b4096 -c126 /dev/sdb  /dev/null    ddsuiviSDB

B) La récupération des oubliés

sudo ddrescue -d -f -r0 -b4096 -c1 /dev/sdb /dev/null   ddsuiviSDB

C) La liste et le comptage des illisibles

echo  Illisible  >ddBadBlocsSDB
sudo ddrescuelog -l- -b4096  ddsuiviSDB >ddBadBlocsSDB
cat ddBadBlocsSDB
wc ddBadBlocsSDB

Je propose aussi de formater ce disque
   => Nécessité de créer une table de partition     avec l'onglet Périphériques de GPARTED,  Mais je n'ai pas mémorisé si GPT ou MSDOS
et de faire

sudo smartctl  -A   /dev/sdb

Dernière modification par Bougron (Le 17/11/2016, à 20:41)

Hors ligne

#88 Le 15/11/2016, à 20:23

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bougron a écrit :

Il y a quelques contradictions dans les listes des mauvais blocs

Ca j'avais bien noté. Mais avant de brouiller les cartes dans les données SMART, j'aimerais bien voir ce qu'il en est !


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#89 Le 16/11/2016, à 12:43

piouk03

Re : [Résolu] Problème RAID5 mdadm

Alors pour le réseau tout fonctionne (en live pas de problème en tout cas). Donc j'ai regardé ma configuration réseau sur le serveur :

 This file describes the network interfaces available on your system
# and how to activate them. For more information, see interfaces(5).

# The loopback network interface
auto lo eth0

# The primary network interface
iface eth0 inet static
        address 192.168.1.100
        netmask 255.255.255.0
        gateway 192.168.1.1

Pour moi tout est bon. Et cela ne vient pas de maintenance sur internet car ce matin encore je ne peux pas le mettre à jour...Mistère !

Donc je vais réaliser toutes les commandes que vous m'avez listé à partir du live et je vous tiens au courant dès que c'est fait.

Dernière modification par piouk03 (Le 16/11/2016, à 12:43)

Hors ligne

#90 Le 16/11/2016, à 12:54

piouk03

Re : [Résolu] Problème RAID5 mdadm

ubuntu@ubuntu:~$ sudo smartctl -A /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-31-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, [url=http://www.smartmontools.org]www.smartmontools.org[/url]

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   195   195   051    Pre-fail  Always       -       21568
  3 Spin_Up_Time            0x0027   186   175   021    Pre-fail  Always       -       5700
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       431
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       994
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       430
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       137
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10332
194 Temperature_Celsius     0x0022   118   114   000    Old_age   Always       -       32
196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       73
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       25
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   196   196   000    Old_age   Offline      -       1360

Dernière modification par piouk03 (Le 16/11/2016, à 12:56)

Hors ligne

#91 Le 16/11/2016, à 12:59

piouk03

Re : [Résolu] Problème RAID5 mdadm

Par contre du coup je suis un peu perdu je fais ddrescue ou pas ?

Hors ligne

#92 Le 16/11/2016, à 18:47

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Alors là on a réabilité 10 secteurs ce qui est cohérant pour une fois. Par ailleurs, il n'y a pas eu de réallocation, ce qui me laisse pensif, tout en restant optimiste.

  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       1
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       73

.
Du coup j'envisage sérieusement la possibilité que les incohérences entre nombre attendu et nombre trouvé de secteurs incorrecte viennent d'un problème d'alignement avec les secteurs physique lors du scan avec badblock.

Si c'est le cas, on va pouvoir traiter le reste en faisant un hdparm sur les 8 secteurs successif correspondant à un block de 4k indiqué par badblock.
Je vais essayer d'envoyer dans la soirée un petit script pour ça, histoire de traiter en masse

En attendant je déconseille de lancer ddrescue qui va nous paralyser pour un long moment...

Dernière modification par jamesbad000 (Le 16/11/2016, à 19:06)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#93 Le 16/11/2016, à 21:50

piouk03

Re : [Résolu] Problème RAID5 mdadm

Ok je touche à rien et j'attends ton script...

Hors ligne

#94 Le 16/11/2016, à 22:15

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

for block in $(cat ~/sdb2.badblocks); do for ((i=1;i<8;i++)); do hdparm --read-sector $(($block*8+$i)) /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214  | grep 'reading sector' | grep -v succeeded ; done; done;

Voilà. Seul les éventuels mauvais secteurs seront listés. Et on saute le premier secteur de chaque block, puisque déjà traité.
Ensuite on pourra adapter facilement ce script pour réécrire s'il la liste est longue

ps si tu reste sur le live usb il faudra activer le raid, monter la partition et adapter le chemin d'accès de ~/sdb2.badblocks

Dernière modification par jamesbad000 (Le 16/11/2016, à 22:54)


L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne

#95 Le 17/11/2016, à 18:17

piouk03

Re : [Résolu] Problème RAID5 mdadm

Effectivement la liste est longue :

root@server:~# for block in $(cat ~/sdb2.badblocks); do for ((i=1;i<8;i++)); do hdparm --read-sector $(($block*8+$i)) /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214  | grep 'reading sector' | grep -v succeeded ; done; done;
FAILED: Input/output error
reading sector 3883610921:
FAILED: Input/output error
reading sector 3883610922:
FAILED: Input/output error
reading sector 3883610923:
FAILED: Input/output error
reading sector 3883610924:
FAILED: Input/output error
reading sector 3883610925:
FAILED: Input/output error
reading sector 3883610926:
FAILED: Input/output error
reading sector 3883610927:
FAILED: Input/output error
reading sector 3884916497:
FAILED: Input/output error
reading sector 3884916498:
FAILED: Input/output error
reading sector 3884916499:
FAILED: Input/output error
reading sector 3884916500:
FAILED: Input/output error
reading sector 3884916501:
FAILED: Input/output error
reading sector 3884916502:
FAILED: Input/output error
reading sector 3884916503:
FAILED: Input/output error
reading sector 3873418289:
FAILED: Input/output error
reading sector 3882026921:
FAILED: Input/output error
reading sector 3882035265:
FAILED: Input/output error
reading sector 3882035266:
FAILED: Input/output error
reading sector 3882035267:
FAILED: Input/output error
reading sector 3882036241:
FAILED: Input/output error
reading sector 3882036242:
FAILED: Input/output error
reading sector 3882036243:
FAILED: Input/output error
reading sector 3882036244:
FAILED: Input/output error
reading sector 3882036245:
FAILED: Input/output error
reading sector 3882036246:
FAILED: Input/output error
reading sector 3882036247:
FAILED: Input/output error
reading sector 3882090449:
FAILED: Input/output error
reading sector 3882090450:
FAILED: Input/output error
reading sector 3882090451:
FAILED: Input/output error
reading sector 3882090452:
FAILED: Input/output error
reading sector 3882090453:
FAILED: Input/output error
reading sector 3882090454:
FAILED: Input/output error
reading sector 3882090455:
FAILED: Input/output error
reading sector 3883608513:
FAILED: Input/output error
reading sector 3883608514:
FAILED: Input/output error
reading sector 3883608515:
FAILED: Input/output error
reading sector 3883608516:
FAILED: Input/output error
reading sector 3883608517:
FAILED: Input/output error
reading sector 3883608518:
FAILED: Input/output error
reading sector 3883608519:
FAILED: Input/output error
reading sector 3883614753:
FAILED: Input/output error
reading sector 3883614754:
FAILED: Input/output error
reading sector 3883614755:
FAILED: Input/output error
reading sector 3883614756:
FAILED: Input/output error
reading sector 3884877209:
FAILED: Input/output error
reading sector 3884962033:
FAILED: Input/output error
reading sector 3884965361:
FAILED: Input/output error
reading sector 3884965362:
FAILED: Input/output error
reading sector 3884965363:
FAILED: Input/output error
reading sector 3884965364:
FAILED: Input/output error
reading sector 3884965365:
FAILED: Input/output error
reading sector 3884965366:
FAILED: Input/output error
reading sector 3884965367:
FAILED: Input/output error
reading sector 3885023169:
FAILED: Input/output error
reading sector 3885023170:
FAILED: Input/output error
reading sector 3885023171:
FAILED: Input/output error
reading sector 3885023172:
FAILED: Input/output error
reading sector 3885023173:
FAILED: Input/output error
reading sector 3885023174:
FAILED: Input/output error
reading sector 3885023175:
FAILED: Input/output error
reading sector 3885051169:
FAILED: Input/output error
reading sector 3885051170:
FAILED: Input/output error
reading sector 3885051171:
FAILED: Input/output error
reading sector 3885051172:
FAILED: Input/output error
reading sector 3885051173:
FAILED: Input/output error
reading sector 3885051174:
FAILED: Input/output error
reading sector 3885051175:

Il faut forcer l'écriture sur tous ces blocks avec la même commande que l'autre fois ? (sudo hdparm --yes-i-know-what-i-am-doing --write-sector N° /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214)

Hors ligne

#96 Le 17/11/2016, à 18:33

piouk03

Re : [Résolu] Problème RAID5 mdadm

Bon étant motivé j'ai tout fait à la main... maintenant on a ça :

root@server:~# for block in $(cat ~/sdb2.badblocks); do for ((i=1;i<8;i++)); do hdparm --read-sector $(($block*8+$i)) /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214  | grep 'reading sector' | grep -v succeeded ; done; done;
root@server:~#

D'après lui plus d'erreur... Je vais repasser sur le live pour retester le disque

Hors ligne

#97 Le 17/11/2016, à 18:39

piouk03

Re : [Résolu] Problème RAID5 mdadm

Bon on arrive à ça :

ubuntu@ubuntu:~$ sudo smartctl -A /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-31-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   195   195   051    Pre-fail  Always       -       21710
  3 Spin_Up_Time            0x0027   184   175   021    Pre-fail  Always       -       5800
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       436
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       995
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       435
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       141
193 Load_Cycle_Count        0x0032   197   197   000    Old_age   Always       -       10371
194 Temperature_Celsius     0x0022   122   114   000    Old_age   Always       -       28
196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       66
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       25
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   196   196   000    Old_age   Offline      -       1360

Si j'ai tout compris c'est la ligne 197 qui nous intéresse... Donc c'est pas mieux ?

Hors ligne

#98 Le 17/11/2016, à 18:42

piouk03

Re : [Résolu] Problème RAID5 mdadm

Il n'y aurait pas une commande pour le forcer à réécrire TOUS les secteurs du disques ? (même s'il en a pour 3 jours c'est pas grave...)

Hors ligne

#99 Le 17/11/2016, à 20:23

Bougron

Re : [Résolu] Problème RAID5 mdadm

Bonsoir
Je suis toujours. Ta rèparation a bien fait diminuer le nombre de secteurs pending.
C'est triste que hdparm ne possède pas une option pour se caler sur la taille physique...
Sensément badbloc a tout réécrit.

J'ai proposé une autre façon d'identifier les blocs illisibles et d'en produire une liste.
On pourra comparer cette liste avec ce qu'on connait
Le contenu du fichier produit servira d'entrée pour réécrire avec la commande dd
Cela sera l'occasion de savoir si elle peut réécrire. Sinon, le script de lecture de hdparm pourra être modifié pour faire de l'écriture

Mais attends le feu vert de Jamesbad000 avant de lancer cette phase de lecture.

pour ta question patientes encore un peu avant de lancer

sudo dd if=/dev/zero of=/dev/sdb bs=1M

Le vrai problême n'est pas d'écrire mais de relire ce qui a été écrit

D'ailleurs, je pense que mes commandes de lectures, tu devrais les lancer aussi sur les trois autres disques en suffixant les fichiers de sortie.
Les 4 passages peuvent se faire en même temps

Dernière modification par Bougron (Le 17/11/2016, à 20:43)

Hors ligne

#100 Le 18/11/2016, à 02:22

jamesbad000

Re : [Résolu] Problème RAID5 mdadm

Bon, effectivement, on a encore récupéré quelques poignées de secteurs, toujours sans qu'il y ait eu de réallocation supplémentaire, et en toute incohérence avec des secteurs de 4k.

Je n'ai pas de certitudes absolue, mais tous ces éléments laissent à penser que ce disque a une araignée au plafond.

piouk03 a écrit :

Il n'y aurait pas une commande pour le forcer à réécrire TOUS les secteurs du disques ? (même s'il en a pour 3 jours c'est pas grave...)

Je pourrais facilement adapter le script que je t'ai donné pour réécrire tous les secteurs avec hdparm, mais il y a 4 milliards de secteurs à balayer. Si ça a prit ne serait-ce qu'une seconde pour lire les un peu moins de milles secteurs avec le dernier script, Ca nous donne 4 millions de second soit 1000 heures minimum.

Dans la mesure ou hdparm met en évidence que les erreurs ne sont pas en cohérence avec des secteurs de 4k, ça met logiquement hors de cause un dysfonctionnement de la commande badblocks.
En conséquence je considère que refaire un scan avec gddrescue est vain. Mais tu peux toujours suivre cette voie avec Bougron.

A ce stade, le dernier truc que je tenterais éventuellement c'est de lancer l'auto test "version longue" du disque avec smartctl. C'est l'option qui me parait avoir le plus de potentiel de faire ou découvrir quelque chose de nouveau. Mais en l'état ça va obliger à rester sur le live.
si tu veux tenter cette option :

sudo smartctl -t long /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214 

L'opération se passe en tache de fond, tu peux suivre l'avancement avec

sudo smartctl -c /dev/disk/by-id/ata-WDC_WD20EZRX-00D8PB0_WD-WCC4N1174214

et regarder ce paragraphe

Self-test execution status:      ( 247) Self-test routine in progress...
                                        70% of test remaining.

L'espace et le temps sont les modes par lesquels nous pensons, et non les conditions dans lesquelles nous vivons. (Signé Albert)

Hors ligne