Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 21/01/2015, à 22:22

sioban

Erreurs ATA

Hello,

j'ai un soucis avec un des disques de mon serveur, j'ai les messages suivants :

[   64.699374] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[   64.699421] ata3.00: BMDMA stat 0x64
[   64.699464] ata3.00: failed command: READ DMA
[   64.699513] ata3.00: cmd c8/00:00:0f:05:f0/00:00:00:00:00/e2 tag 0 dma 131072 in
[   64.699514]          res 51/40:00:1d:05:f0/00:00:00:00:00/e2 Emask 0x9 (media error)
[   64.699605] ata3.00: status: { DRDY ERR }
[   64.699643] ata3.00: error: { UNC }
[   64.720714] ata3.00: configured for UDMA/100
[   64.720787] ata3: EH complete
[   66.085254] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[   66.085300] ata3.00: BMDMA stat 0x64
[   66.085342] ata3.00: failed command: READ DMA
[   66.085390] ata3.00: cmd c8/00:00:0f:05:f0/00:00:00:00:00/e2 tag 0 dma 131072 in
[   66.085391]          res 51/40:00:1d:05:f0/00:00:00:00:00/e2 Emask 0x9 (media error)
[   66.085481] ata3.00: status: { DRDY ERR }
[   66.085519] ata3.00: error: { UNC }
[   66.108710] ata3.00: configured for UDMA/100
[   66.108759] ata3: EH complete
[   67.471081] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[   67.471126] ata3.00: BMDMA stat 0x64
[   67.471169] ata3.00: failed command: READ DMA
[   67.471217] ata3.00: cmd c8/00:00:0f:05:f0/00:00:00:00:00/e2 tag 0 dma 131072 in
[   67.471218]          res 51/40:00:1d:05:f0/00:00:00:00:00/e2 Emask 0x9 (media error)
[   67.471308] ata3.00: status: { DRDY ERR }
[   67.471347] ata3.00: error: { UNC }
[   67.492712] ata3.00: configured for UDMA/100
[   67.492761] ata3: EH complete
[   68.856976] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[   68.857021] ata3.00: BMDMA stat 0x64
[   68.857064] ata3.00: failed command: READ DMA
[   68.857112] ata3.00: cmd c8/00:00:0f:05:f0/00:00:00:00:00/e2 tag 0 dma 131072 in
[   68.857113]          res 51/40:00:1d:05:f0/00:00:00:00:00/e2 Emask 0x9 (media error)
[   68.857204] ata3.00: status: { DRDY ERR }
[   68.857242] ata3.00: error: { UNC }
[   68.880694] ata3.00: configured for UDMA/100
[   68.880741] ata3: EH complete
[   70.242806] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[   70.242851] ata3.00: BMDMA stat 0x64
[   70.242893] ata3.00: failed command: READ DMA
[   70.242943] ata3.00: cmd c8/00:00:0f:05:f0/00:00:00:00:00/e2 tag 0 dma 131072 in
[   70.242944]          res 51/40:00:1d:05:f0/00:00:00:00:00/e2 Emask 0x9 (media error)
[   70.243034] ata3.00: status: { DRDY ERR }
[   70.243073] ata3.00: error: { UNC }
[   70.264697] ata3.00: configured for UDMA/100
[   70.264743] ata3: EH complete
[   71.628705] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[   71.628750] ata3.00: BMDMA stat 0x64
[   71.628793] ata3.00: failed command: READ DMA
[   71.628841] ata3.00: cmd c8/00:00:0f:05:f0/00:00:00:00:00/e2 tag 0 dma 131072 in
[   71.628842]          res 51/40:00:1d:05:f0/00:00:00:00:00/e2 Emask 0x9 (media error)
[   71.628933] ata3.00: status: { DRDY ERR }
[   71.628971] ata3.00: error: { UNC }
[   71.652693] ata3.00: configured for UDMA/100
[   71.652761] sd 2:0:0:0: [sda] Unhandled sense code
[   71.652764] sd 2:0:0:0: [sda]  Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[   71.652769] sd 2:0:0:0: [sda]  Sense Key : Medium Error [current] [descriptor]
[   71.652774] Descriptor sense data with sense descriptors (in hex):
[   71.652777]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
[   71.652788]         02 f0 05 1d 
[   71.652793] sd 2:0:0:0: [sda]  Add. Sense: Unrecovered read error - auto reallocate failed
[   71.652799] sd 2:0:0:0: [sda] CDB: Read(10): 28 00 02 f0 05 0f 00 01 00 00
[   71.652810] end_request: I/O error, dev sda, sector 49284381
[   71.652854] Buffer I/O error on device sda1, logical block 24642159
[   71.652903] Buffer I/O error on device sda1, logical block 24642160
[   71.652945] Buffer I/O error on device sda1, logical block 24642161
[   71.652985] Buffer I/O error on device sda1, logical block 24642162
[   71.653025] Buffer I/O error on device sda1, logical block 24642163
[   71.653066] Buffer I/O error on device sda1, logical block 24642164
[   71.653106] Buffer I/O error on device sda1, logical block 24642165
[   71.653146] Buffer I/O error on device sda1, logical block 24642166
[   71.653186] Buffer I/O error on device sda1, logical block 24642167
[   71.653227] Buffer I/O error on device sda1, logical block 24642168
[   71.653310] ata3: EH complete
[   72.988415] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[   72.988460] ata3.00: BMDMA stat 0x64
[   72.988502] ata3.00: failed command: READ DMA
[   72.988550] ata3.00: cmd c8/00:02:1d:05:f0/00:00:00:00:00/e2 tag 0 dma 1024 in
[   72.988551]          res 51/40:00:1d:05:f0/00:00:00:00:00/e2 Emask 0x9 (media error)
[   72.988641] ata3.00: status: { DRDY ERR }
[   72.988680] ata3.00: error: { UNC }
[   73.012699] ata3.00: configured for UDMA/100
[   73.012709] ata3: EH complete

Bon j'ai eu d'autres soucis sur le serveur :
- carte video dead (une autre carte vidéo fonctionne mais je suis obligé de forcer grub en vga=normal sinon j'ai des artefacts et c'est illisible)
- carte réseau supplémentaire dead (la carte réseau de la carte mère fonctionne, je tourne dessus pour l'instant)
- fan branché sur la carte mère ne tourne plus.

Je suppute un soucis avec la carte mère mais je n'exclue pas l'alim.

En fait je voudrais savoir si vous pensez que le disque est aussi mort ou si ce soucis est a associer à la carte mère ou l'alim.

Merci

PS : petite précision, tous ces soucis surviennent après un reboot du serveur (je devais changer les batteries de l'onduleur) et je n'avais aucune alarme avant...

Dernière modification par sioban (Le 21/01/2015, à 22:23)

Hors ligne

#2 Le 22/01/2015, à 07:15

le cinglé_001

Re : Erreurs ATA

Bonjour.

Je ne pense pas que l'onduleur soit en cause. Même sur un onduleur Line-interactive en supposant que tu sois en bout de ligne, les batteries ne seraient utilisées que pour compenser ce qu'est capable de faire aussi une bonne alim.

À mon avis c'est alim qui est morte. Au démarrage il y a comme en électricité  industrielle une demande importante . En gros les disques dur sont comme des moteurs asynchrones.
Ils demandent pas mal de puissance pour démarrer et ça tire un max sur l'alim.

Comme tu dis que le reste des périph semble être mort je penche pour un problème d'alim qui n'est plus capable de fournir la puissance nécessaire.

Si la machine n'est pas sous garantie ouvre la et regarde sur la mobo si il n'y a pas de condensateurs gonflés. Si ce n'est pas le cas c'est que le problème vient de l'alim et je te conseille de la changer rapidement parce qu'elle pourrait en claquant embarquer la mobo.

Ps: Si tu as une pince ampèremétrique utilise la sur une des nappes d'alimentation d'un des disques et tu pourras voir la différence.

Dernière modification par the_boss_oo1 (Le 22/01/2015, à 07:19)

#3 Le 22/01/2015, à 14:58

sioban

Re : Erreurs ATA

Ok, je vais tester l'alim, je parlais de l'onduleur uniquement car j'ai du éteindre le serveur et que les problèmes ont commencé au reboot (mais bon avec un uptime de plus d'un an...)

De toutes façons, j'ai pris un lot Alim+CM+Video en occaz. Si ce n'est que l'alim, le reste servira de spare wink

Hors ligne

#4 Le 22/01/2015, à 17:28

le cinglé_001

Re : Erreurs ATA

Une alim en occaz pour un serveur. hmm

Dernière modification par the_boss_oo1 (Le 22/01/2015, à 17:28)

#5 Le 22/01/2015, à 17:47

sioban

Re : Erreurs ATA

oui ça me servira à définir que c'est ça le soucis, n'en ayant pas d'autre sous la main.
je verrais pour la changer par la suite.

Hors ligne

#6 Le 22/01/2015, à 17:55

le cinglé_001

Re : Erreurs ATA

Oui mais il faut faire attention quelle soit assez puissante pour ne pas griller la mobo.  wink

#7 Le 22/01/2015, à 18:03

sioban

Re : Erreurs ATA

500 W ça devrait aller.

Hors ligne

#8 Le 22/01/2015, à 18:06

sioban

Re : Erreurs ATA

tiens, je me disais bien que j'avais mis lm-sensors un jour.

Voici ce que j'ai comme info :

atk0110-acpi-0
Adapter: ACPI interface
Vcore Voltage:       +1.12 V  (min =  +0.85 V, max =  +1.60 V)
 +3.3 Voltage:       +3.31 V  (min =  +2.97 V, max =  +3.63 V)
 +5 Voltage:         +4.97 V  (min =  +4.50 V, max =  +5.50 V)
 +12 Voltage:       +12.14 V  (min = +10.20 V, max = +13.80 V)
CPU FAN Speed:      2376 RPM  (min =  600 RPM, max = 7200 RPM)
CHASSIS1 FAN Speed:    0 RPM  (min =  800 RPM, max = 7200 RPM)
CHASSIS2 FAN Speed:    0 RPM  (min =  800 RPM, max = 7200 RPM)
POWER FAN Speed:       0 RPM  (min =  800 RPM, max = 7200 RPM)
CPU Temperature:     +31.0°C  (high = +60.0°C, crit = +95.0°C)
MB Temperature:      +42.0°C  (high = +45.0°C, crit = +95.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Core 0:       +46.0°C  (high = +82.0°C, crit = +100.0°C)
Core 1:       +46.0°C  (high = +82.0°C, crit = +100.0°C)
Core 2:       +43.0°C  (high = +82.0°C, crit = +100.0°C)
Core 3:       +49.0°C  (high = +82.0°C, crit = +100.0°C)

du coup je me demande si c'est bien l'alim qui est en faute.

Hors ligne

#9 Le 22/01/2015, à 18:48

le cinglé_001

Re : Erreurs ATA

Perso j'ai une alim blue storm de 500 watts, six disques sans compter le rack, le port pci à bloc, six ventilos sans compter la carte graphique et le proco, et je lui tire sur la gueule au pc.

J'ai une serveur Lamp et j'encode souvent des vidéos tirées de VHS d'acquisition perso que je capture en même temps.

Tout cela pour te dire que les logs de températures que tes disques sont normaux.

Tu ne peux pas te fier au voltage indiqué par les logs puisque c'est seulement la puissance demandée.

Tu fais ce que tu veux, mais un conseil, change ton alim.

Si tu veux savoir, tire sur la gueule du serveur et si tu entends les ventilateurs ralentir, c'est pas bon.

Dernière modification par the_boss_oo1 (Le 22/01/2015, à 18:49)

#10 Le 22/01/2015, à 21:57

sioban

Re : Erreurs ATA

c'est bien prévu de changer l'alim.

je verrais si j'ai toujours les erreurs disques

Hors ligne

#11 Le 24/01/2015, à 14:09

sioban

Re : Erreurs ATA

Bon j'ai fait le tour.

J'ai testé l'alim avec un testeur et elle va très bien.
J'ai testé le disque sur un connecteur usb/ide et il est bien mort (on accède au disque mais il y a plein d'erreur lors de la copie des fichiers).

Je démonte donc la CM, et je note 2 condos suspects : 1 près du southbridge qui est très légérement bombé, un près de la carte vidéo qui lui présente un bombage net (bon c'est pas aussi flagrant que sur l'ancienne carte vidéo où les condos ont carrément commencé à fuir en haut...).

J'ai mis la remplaçante et rien à signaler pour l'instant wink

Bilan :
- une CM moitié HS (fonctionnelle mais j'ai pas confiance...)
- un disque mort (bon en même un temps un maxtor diamonmax plus 9, je suis pas plus surpris que ça...)
- une carte vidéo HS
- une carte réseau HS

mais l'alim va bien ^_^

voilà voilà, c'était juste pour apporter la conclusion...

Hors ligne