Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 21/01/2022, à 09:46

georgesgiralt

Smart erreur (popup)

Bonjour à tous et meilleurs vœux,
Je viens de recevoir un "pop-up" qui me dit :

Hard Disk Health Warning
The hard disk health status has changed. This could mean that hard disk drive failure is imminenet. It is always a good idea to have up to date backups.

Ma machine comporte deux "disques" un disque classique de 2To et une carte M.2 NVME de 256 Go.
J'emploie LVM avec divers volumes avec en gros le système sur le NVME et les données utilisateur sur le disque dur.
Dans les logs je trouve ceci :

Jan 21 08:26:39 smartd[1499]: Device: /dev/nvme0, number of Error Log entries increased from 809 to 810
Jan 21 08:26:39 smartd[1499]: Sending warning via /usr/share/smartmontools/smartd-runner to root ...
Jan 21 08:26:39 smartd[1499]: Warning via /usr/share/smartmontools/smartd-runner to root: successful

Le disque dur ne montre aucune erreur dans ses logs ni de secteurs réalloués.
Les infos smart que je récupère du nvme sont :

Error Information (NVMe Log 0x01, max 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0        810     0  0x7008  0x4004      -            0     0     -

J'aimerai savoir comment  avoir plus de détail sur ces erreurs et leur gravité (je suis perdu dans les commandes nvme)
D'avance merci beaucoup pour votre aide !

Hors ligne

#2 Le 21/01/2022, à 11:49

Vobul

Re : Smart erreur (popup)

Salut, j'ai la même chose avec mon disque nvme, à chaque reboot le errorcount augmente de 1. J'ai décidé d'ignorer ces erreurs.


Vobul
Utilisez le retour utilisable de commandes !!!
J'aime la langue française, mais je parle franglais, deal with it.
RTFM

Hors ligne

#3 Le 21/01/2022, à 14:14

georgesgiralt

Re : Smart erreur (popup)

Bonjour et merci pour ta réponse.
J'aimerai quand même ne pas jouer les autruches et lire ces logs au moins une fois. avec nvme, je récupère du binaire ... et je ne le lis pas bien ;-)
Alors, si vous avez des idées, je suis preneur !
D'ici là, bon week-end !
Édit : je me réponds à moi même ayant retrouvé des notes que j'avais prises il y a longtemps...
Alors, j'ai employé la commande

 sudo nvme error-log /dev/nvme0 

(attention à prendre la carte NVME pas le "namespace 1, /dev/nvme0n1)
Je récupère "en clair" les 64 entrées du log. J'en ai 63 qui sont "rigolotes" et identiques à ça :

................
 Entry[ 1]   
.................
error_count  : 0
sqid         : 0
cmdid        : 0
status_field : 0(SUCCESS: The command completed successfully)
parm_err_loc : 0
lba          : 0
nsid         : 0
vs           : 0
cs           : 0
................. 

La première en revanche m'interpelle car il semble qu'elle se soit reproduite souvent :

 
Error Log Entries for device:nvme0 entries:64
.................
 Entry[ 0]   
.................
error_count  : 812
sqid         : 0
cmdid        : 0x1002
status_field : 0x4004(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
parm_err_loc : 0xffff
lba          : 0
nsid         : 0
vs           : 0
cs           : 0

Dernière modification par georgesgiralt (Le 21/01/2022, à 14:26)

Hors ligne

#4 Le 21/01/2022, à 14:48

iznobe

Re : Smart erreur (popup)

Bonjour , il faut deja installer le paquet adequate pour les nvme , par defaut il ne l' est pas :

sudo apt install nvme-cli

puis donner :

sudo nvme error-log /dev/nvme0n1
sudo nvme smart-log /dev/nvme0n1

ca m' etonnerait que cela fonctionne , car il faudrait remplacer nvme0n1 par le nom du volume logique pour bien faire .

Note : je ne suis pas sur que creer un LV d ' un nvme avec un HDD soit une bonne idée .

Dernière modification par iznobe (Le 21/01/2022, à 14:50)

Hors ligne

#5 Le 21/01/2022, à 14:59

geole

Re : Smart erreur (popup)

Bonjour.
Merci donner l'état du disque dur. Paragraphe 3.1 https://doc.ubuntu-fr.org/smartmontools

Dernière modification par geole (Le 21/01/2022, à 15:01)


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
Je défie QUICONQUE de trouver une discussion où j'aurais suggéré de remplacer un SSD par un disque dur.
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#6 Le 21/01/2022, à 15:05

iznobe

Re : Smart erreur (popup)

Pour verifier l ' etat du disque :

sudo apt install smartmontools --no-install-recommends
sudo smartctl -s on -a /dev/nvme0n1

Hors ligne

#7 Le 21/01/2022, à 15:55

Vobul

Re : Smart erreur (popup)

@georgesgiralt j'ai la même chose que toi (à part trtype) :

sudo nvme error-log /dev/nvme0n1
Error Log Entries for device:nvme0n1 entries:64
.................
 Entry[ 0]   
.................
error_count	: 426
sqid		: 0
cmdid		: 0xe009
status_field	: 0x2002(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
phase_tag	: 0
parm_err_loc	: 0xffff
lba		: 0
nsid		: 0
vs		: 0
trtype		: The transport type is not indicated or the error is not transport related.
cs		: 0
trtype_spec_info: 0

puis toutes les autres entrées sont avec

status_field	: 0(SUCCESS: The command completed successfully)

Rien à signaler côté smart log :

 sudo nvme smart-log /dev/nvme0n1      
Smart Log for NVME device:nvme0n1 namespace-id:ffffffff
critical_warning			: 0
temperature				: 45 C (318 Kelvin)
available_spare				: 100%
available_spare_threshold		: 10%
percentage_used				: 1%
endurance group critical warning summary: 0
data_units_read				: 3,198,292
data_units_written			: 9,695,013
host_read_commands			: 43,584,598
host_write_commands			: 236,923,137
controller_busy_time			: 1,165
power_cycles				: 729
power_on_hours				: 893
unsafe_shutdowns			: 9
media_errors				: 0
num_err_log_entries			: 426
Warning Temperature Time		: 0
Critical Composite Temperature Time	: 0
Temperature Sensor 1           : 45 C (318 Kelvin)
Temperature Sensor 2           : 50 C (323 Kelvin)
Thermal Management T1 Trans Count	: 0
Thermal Management T2 Trans Count	: 0
Thermal Management T1 Total Time	: 0
Thermal Management T2 Total Time	: 0

De ce que je comprends, il log un truc genre "ça a marché", donc le nombre de truc loggé augmente, donc t'as une alerte. Donc perso je reste en mode autruche, mais autruche éclairée wink

Aussi, cela ne m'étonnerait pas que la première entrée soit comme ça car la valeur n'est pas initialisée la première fois que tu l'utilises, donc il marque une erreur, et après c'est bon (je suppute).


Vobul
Utilisez le retour utilisable de commandes !!!
J'aime la langue française, mais je parle franglais, deal with it.
RTFM

Hors ligne

#8 Le 21/01/2022, à 15:59

iznobe

Re : Smart erreur (popup)

Curieux tout de meme , sur mon nvme , je n' ai pas le meme constat que vous pour l' erreur de l ' entrée [0] .
Apres je n' ai pas de LV , peut etre pour ca ?

Hors ligne

#9 Le 21/01/2022, à 16:37

Vobul

Re : Smart erreur (popup)

@iznobe, quand tu dis LV tu veux dire Logical Volume ? Je n'en ai pas non plus, ce sont des partitions classiques, faites à la main avec tendresse et soin :

nvme0n1        259:0    0 465.8G  0 disk  
├─nvme0n1p1    259:1    0   512M  0 part  /efi
├─nvme0n1p2    259:2    0   512M  0 part  /boot
├─nvme0n1p3    259:3    0    16G  0 part  [SWAP]
└─nvme0n1p4    259:4    0 448.8G  0 part  
  └─cryptroot  254:0    0 448.7G  0 crypt /

Vobul
Utilisez le retour utilisable de commandes !!!
J'aime la langue française, mais je parle franglais, deal with it.
RTFM

Hors ligne

#10 Le 21/01/2022, à 16:45

iznobe

Re : Smart erreur (popup)

Vobul a écrit :

@iznobe, quand tu dis LV tu veux dire Logical Volume ?

oui tout a fait .

Donc ca n' a pas de rapport avec les volumes logiques ( en francais cette fois et en entier tongue )

Hors ligne

#11 Le 21/01/2022, à 18:27

georgesgiralt

Re : Smart erreur (popup)

iznobe a écrit :

Bonjour , il faut deja installer le paquet adequate pour les nvme , par defaut il ne l' est pas :

sudo apt install nvme-cli

puis donner :

sudo nvme error-log /dev/nvme0n1
sudo nvme smart-log /dev/nvme0n1

ca m' etonnerait que cela fonctionne , car il faudrait remplacer nvme0n1 par le nom du volume logique pour bien faire .

Note : je ne suis pas sur que creer un LV d ' un nvme avec un HDD soit une bonne idée .


Bonsoir et merci pour la réponse.
Alors, dans l'ordre,
Les nvme utils sont installés. Depuis longtemps, tellement que j'avais oublié.
Le log "error-log" du NVME est dans mon post au dessus du tien.
Je joins le "smart-log" :

nvme smart-log /dev/nvme0
Smart Log for NVME device:nvme0 namespace-id:ffffffff
critical_warning                    : 0
temperature                         : 28 C
available_spare                     : 100%
available_spare_threshold           : 10%
percentage_used                     : 0%
data_units_read                     : 3997195
data_units_written                  : 2808405
host_read_commands                  : 44237355
host_write_commands                 : 39251868
controller_busy_time                : 217
power_cycles                        : 614
power_on_hours                      : 162
unsafe_shutdowns                    : 402
media_errors                        : 0
num_err_log_entries                 : 813
Warning Temperature Time            : 0
Critical Composite Temperature Time : 0
Temperature Sensor 1                : 28 C
Thermal Management T1 Trans Count   : 0
Thermal Management T2 Trans Count   : 0
Thermal Management T1 Total Time    : 0
Thermal Management T2 Total Time    : 0

Voila. Rien de plus que précédemment.
Remarque :
Tu dis  "ca m' etonnerait que cela fonctionne , car il faudrait remplacer nvme0n1 par le nom du volume logique pour bien faire ."
Ben,le volume logique n'est qu'une partition du nvme. Et pas au même niveau d'abstraction. Donc pas lié IMHO.
Et aussi, tu dis : "Note : je ne suis pas sur que creer un LV d ' un nvme avec un HDD soit une bonne idée ."
Alors sur tous les serveurs qui sont connectés sur des baiesde disques (SAN) on met les données fréquemment utilisées sur du SSD et les autres sur du disque "à pas cher, classique, quoi". Donc ce type de mélange est employé dans disons 80%  des machines. Les deux disques sont des pV du même Volume group. Dans ce volume group, les volumes logiques /, /usr, /lib sont sur le nvme et les volumes logiques /home, /tmp, /var sur le HDD...

Hors ligne

#12 Le 21/01/2022, à 18:37

georgesgiralt

Re : Smart erreur (popup)

Vobul a écrit :

@georgesgiralt j'ai la même chose que toi (à part trtype) :

sudo nvme error-log /dev/nvme0n1
Error Log Entries for device:nvme0n1 entries:64
.................
 Entry[ 0]   
.................
error_count	: 426
sqid		: 0
cmdid		: 0xe009
status_field	: 0x2002(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
phase_tag	: 0
parm_err_loc	: 0xffff
lba		: 0
nsid		: 0
vs		: 0
trtype		: The transport type is not indicated or the error is not transport related.
cs		: 0
trtype_spec_info: 0

...........partie coupée pour la clarté........................................

De ce que je comprends, il log un truc genre "ça a marché", donc le nombre de truc loggé augmente, donc t'as une alerte. Donc perso je reste en mode autruche, mais autruche éclairée wink

Aussi, cela ne m'étonnerait pas que la première entrée soit comme ça car la valeur n'est pas initialisée la première fois que tu l'utilises, donc il marque une erreur, et après c'est bon (je suppute).


Alors, pas tout à fait.
L'entrée 0 s'est reproduite 810 fois en fait. Mais elle n'occupe que le slot 0 (sur 64 possibles) et seul le compteur est mis à jour à chaque occurrence.
Et il semble (je suis encore en train de chercher) que ce ne soit pas du tout normal ni souhaitable. JE n'ai pas encore trouvé la gravité exacte ni la cause détaillée. C'est pas simple les nvme...
Les 63 autres slots du journal sont remplis par des "OK j'ai bien bossé" sans intérêt ni conséquence. J'ai pas joué au jeu des 7 erreurs mais normalement et si j'ai tout compris, les 63 messages sont différents (sinon ils auraient occupé une entrée et seul le compteur d’occurrence serai modifié à chaque apparition.
Après, il semble qu'il y ait plein de différences dans les versions de la norme NVME et dans les implémentations par les divers constructeurs...
Bref, on n'est pas sorti du bois...
Un grand merci à tous pour vos réponses et votre aide.
Bon week-end

Hors ligne

#13 Le 21/01/2022, à 18:56

georgesgiralt

Re : Smart erreur (popup)

Me revoilà :
Voila comment sont construit mes machines :

$df
Sys. de fichiers            blocs de 1K   Utilisé Disponible Uti% Monté sur
/dev/mapper/slash     10255636   2941684    6773280  31% /
/dev/mapper/usr       30701476  21799824    7312404  75% /usr
/dev/mapper/boot       1998672    373956    1503476  20% /boot
/dev/mapper/tmp       11222216     41052   10640500   1% /tmp
/dev/mapper/var       20511312   1599956   17846396   9% /var
/dev/mapper/varlog    10190100   1212676    8436752  13% /var/log
/dev/mapper/vartmp     5029504     32856    4718120   1% /var/tmp
/dev/nvme0n1p1                    98304     73884      24420  76% /boot/efi
/dev/mapper/home     618222752 575983376   42222992  94% /home

le texte ci-dessus a été simplifié car mes groupes de volumes portent le nom de la machine sur laquelle ils ont été créé. Ceci permet en cas de panne de "monter" ce groupe de volume sur une autre machine (si j'avais laissé le nom par défaut, ils se seraient nommé vg0 et donc le même nom sur toutes les machine s du réseau). On devrait don lire par exemple pour la machine "toto" : /dev/mapper/toto-home car le groupe de volume se nommerait "toto".
le /boot/efi est sur le nvme car c'est une partition créée par Windows à l'installation. J'ai arrêté de me battre avec Windows et le laisse faire ses bêtises à son gré. Et je m'en accommode... comme je peux.
Enfin, j'ai séparé le /tmp, /var, /var/log et /var/tmp afin de pouvoir choisir où je place les données (pas de "temporaire" sur le SSD ni de logs qui prennent de la place) et des systèmes de fichiers montés en "nodev", "noexec" pour des raisons de sécurité...
Avec du LVM c'est hyper facile à faire et à maintenir.
La machine qui pose PB est un portable. Si cela avait été une machine de "bureau", j'aurais deux disques durs en RAID1 logiciel (md) et ce raid aurait été le volume physique du groupe de volume et j'aurais mis deux NVME en RAID1 logiciel (md aussi) comme second volume physique du groupe de volume... mais sur un portable, on peut pas tout faire rentrer dedans...
Avec les versions récente de l'installeur Ubuntu c'est un peu "touchy" de créer les RAID, VG, et volumes logiques d'un coup avant l'install...Mais on y arrive ;-)

Hors ligne

#14 Le 21/01/2022, à 19:05

georgesgiralt

Re : Smart erreur (popup)

J'ai oublié de vous dire que sur un ordinateur de bureau, le NVME est un Intel (assez ancien) et sudo nvme error-log /dev/nvme0 donne 64 fois ceci :

 .................
 Entry[ 0]   
.................
error_count  : 0
sqid         : 0
cmdid        : 0
status_field : 0(SUCCESS: The command completed successfully)
parm_err_loc : 0
lba          : 0
nsid         : 0
vs           : 0
cs           : 0

Donc l'erreur sur le Samsung qui trone dans mon portable a un PB. (le message ci-dessus vient d'une machine avec la même version d'Ubuntu, 20.04.3 LTS, et avec le même niveau logiciel )

Hors ligne

#15 Le 21/01/2022, à 19:11

iznobe

Re : Smart erreur (popup)

Dans ton smartlog , on voit quand meme 2 choses relativement importantes :
la 1ere c' est qu ' effectivement il a loggué 813 erreurs .
la 2eme c' est le nombre d' arret innopinés : 402

unsafe_shutdowns                    : 402
media_errors                        : 0
num_err_log_entries                 : 813

le tout pour seulement :

power_on_hours                      : 162

heures de fonctionnement .

Je serais toi la 1ere chose que je ferais , c' est d ' ouvrir le capot de ton portable et d' enlever le NVME pour le remettre , des fois qu ils soit mal inseré / clipsé , le nombre 402 unsafe shutdown est bien bien trop important .

Pour info voici le le smartctl de mon nvme :

iznobe@iznobe-PC:~$ sudo smartctl -s on -a /dev/nvme0n1
[sudo] Mot de passe de iznobe :    
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.11.0-46-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       ADATA SX8200PNP
Serial Number:                      2K0320065219
Firmware Version:                   42A4SANA
PCI Vendor/Subsystem ID:            0x1cc1
IEEE OUI Identifier:                0x000000
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512110190592 [512 GB]
Namespace 1 Utilization:            296546385920 [296 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Fri Jan 21 18:10:49 2022 CET
Firmware Updates (0x14):            2 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size:         64 Pages
Warning  Comp. Temp. Threshold:     75 Celsius
Critical Comp. Temp. Threshold:     80 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     9.00W       -        -    0  0  0  0        0       0
 1 +     4.60W       -        -    1  1  1  1        0       0
 2 +     3.80W       -        -    2  2  2  2        0       0
 3 -   0.0450W       -        -    3  3  3  3     2000    2000
 4 -   0.0040W       -        -    4  4  4  4    15000   15000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        28 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    1%
Data Units Read:                    9463622 [4,84 TB]
Data Units Written:                 7759677 [3,97 TB]
Host Read Commands:                 77917930
Host Write Commands:                69872618
Controller Busy Time:               2019
Power Cycles:                       637
Power On Hours:                     6495
Unsafe Shutdowns:                   28
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 2:               28 Celsius
Temperature Sensor 3:               32 Celsius
Temperature Sensor 4:               22 Celsius
Temperature Sensor 5:               22 Celsius
Temperature Sensor 6:               28 Celsius
Thermal Temp. 1 Transition Count:   3
Thermal Temp. 1 Total Time:         80

Error Information (NVMe Log 0x01, max 256 entries)
No Errors Logged
iznobe@iznobe-PC:~$ 

et le log :

iznobe@iznobe-PC:~$ sudo nvme error-log /dev/nvme0n1
Error Log Entries for device:nvme0n1 entries:64
.................
 Entry[ 0]   
.................
error_count  : 0
sqid         : 0
cmdid        : 0
status_field : 0(SUCCESS: The command completed successfully)
parm_err_loc : 0
lba          : 0
nsid         : 0
vs           : 0
cs           : 0
.................
 Entry[ 1]   
.................
error_count  : 0
sqid         : 0
cmdid        : 0
status_field : 0(SUCCESS: The command completed successfully)
parm_err_loc : 0
lba          : 0
nsid         : 0
vs           : 0
cs           : 0
.................

je n' ai mis que les 2 1eres , les 64 sont ( semblent ) identiques .

Les NVME etant recent , il est vrai que c ' est difficile de trouver de l' information pertinente quand a leur usage ...
j ' ai essayer aussi precedemment de trouver de l' information a ce sujet , malheureusement sans succés pour le moment .
la seule chose que j' ai remarqué dernierement , c' est qu ' on peut regler le BIOS sur raid pour le controleur et que ca fonctionne avec un seul disque NVME qui est censé ( mieux ) prendre en charge ( mais proprietaire ? ) le disque d ' une façon plus appropriée que le mode AHCI .

J' etais tombé sur une page interressante lors de mes recherches qui indiquait les differences entre le NVME geré en RAID et en AHCI , mais plus moyen d' y mettre la main dessus .

Dernière modification par iznobe (Le 21/01/2022, à 19:21)

Hors ligne

#16 Le 21/01/2022, à 21:45

georgesgiralt

Re : Smart erreur (popup)

Merci pour ta réponse.
Les unsafe shutdown augmentent à minima de deux à chaque fois que je boote sous Windows. Ne me demande pas pourquoi. Mais j'ai arrêté de m'en faire pour ce paramètre. Néanmoins, et bien que ce soit Mr Lenovo qui ait installé la carte M.2, je retiens ta proposition, et, demain matin, à la fraîche, je vais aérer l'intérieur du PC pour débrancher/rebrancher... En plus il paraît qu'il faut aérer souvent pour chasser les virus ;-)
Je suis comme toi, le manque d'information pertinentes au sujet du NVME m'énerve. Et comme je suis à la retraite, je n'ai plus accès au savoir collectif de mes anciens collègues .....
En tout cas, c'est pas grave, j'ai une sauvegarde du NVME et demain du HDD... Et le tout est sous garantie...
Bon week-end à tous !

Hors ligne

#17 Le 22/01/2022, à 01:02

geole

Re : Smart erreur (popup)

geole a écrit :

Bonjour.
Merci donner l'état du disque dur. Paragraphe 3.1 https://doc.ubuntu-fr.org/smartmontools

La commande est certainement

sudo smartctl  -s on   -a /dev/sda

Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
Je défie QUICONQUE de trouver une discussion où j'aurais suggéré de remplacer un SSD par un disque dur.
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#18 Le 22/01/2022, à 10:23

georgesgiralt

Re : Smart erreur (popup)

Bonjour Geole,
Voila pour ton plaisir :

smartctl -a /dev/sda
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.13.0-27-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 2.5 5400
Device Model:     ST2000LM015-2E8174
Serial Number:    WDZNNV6M
LU WWN Device Id: 5 000c50 0ccbb629e
Firmware Version: 0001
User Capacity:    2000398934016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 3b
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sat Jan 22 09:22:02 2022 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x71) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 330) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x3035)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   080   064   006    Pre-fail  Always       -       94417627
  3 Spin_Up_Time            0x0003   100   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   020    Old_age   Always       -       1092
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   080   060   045    Pre-fail  Always       -       96215092
  9 Power_On_Hours          0x0032   095   095   000    Old_age   Always       -       4468 (8 108 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       571
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   001   000    Old_age   Always       -       4295034524
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   068   050   040    Old_age   Always       -       32 (Min/Max 21/34)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       31
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       143
193 Load_Cycle_Count        0x0032   098   098   000    Old_age   Always       -       4483
194 Temperature_Celsius     0x0022   032   050   000    Old_age   Always       -       32 (0 16 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       2777 (156 12 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       15388552514
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       14743702889
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%       497         -
# 2  Vendor (0x50)       Fatal or unknown error        90%       412         0
# 3  Short offline       Completed without error       00%       411         -
# 4  Extended offline    Completed without error       00%       206         -
# 5  Extended offline    Completed without error       00%       197         -
# 6  Short offline       Completed without error       00%       178         -
# 7  Short offline       Completed without error       00%       177         -
# 8  Conveyance offline  Completed without error       00%       114         -
# 9  Extended offline    Completed without error       00%        28         -
#10  Short offline       Aborted by host               90%         8         -
#11  Short offline       Completed without error       00%         8         -
1 of 1 failed self-tests are outdated by newer successful extended offline self-test # 1

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Bon week-end

Hors ligne

#19 Le 22/01/2022, à 16:43

Vobul

Re : Smart erreur (popup)

oulah, il a pas l'air super en forme ce barracuda dis donc !


Vobul
Utilisez le retour utilisable de commandes !!!
J'aime la langue française, mais je parle franglais, deal with it.
RTFM

Hors ligne

#20 Le 22/01/2022, à 16:48

iznobe

Re : Smart erreur (popup)

Vobul a écrit :

oulah, il a pas l'air super en forme ce barracuda dis donc !

vu le nombre dans les " error_rate " , pas vraiment presque 190 Millions  yikes

Dernière modification par iznobe (Le 22/01/2022, à 16:50)

Hors ligne

#21 Le 22/01/2022, à 16:54

georgesgiralt

Re : Smart erreur (popup)

Si tu vivais la vie qu'il mène, tu ferais pas le fier...
Ben oui, les disques dur d'aujourd'hui ne sont pas aussi bien qu'avant...
Mais il fait le job depuis pas mal de temps et devrait continuer encore un peu...

Édit : Ce disque fait 7 mm d'épaisseur. C'est un 2,5 ". Les plateaux tournent à 5400 t/mn. Et dans ce volume il n'y a qu'un seul plateau. Donc chaque face contient 1 To de données. *
Il faut une précision extraordinaire pour placer la tête dans  "le bon sillon" au bon moment et qu'elle lise les bits avec suffisamment de niveau pour que ce soit utilisable...
C'est miraculeux qu'ils y arrivent. Et IMHO, c'est la limite technologique actuelle. Donc avoir des erreurs de lecture (qui sont corrigées vue qu'il n'y a pas d'erreurs dans les "logs") ou des erreurs de placement des têtes, c'est pas si pire.
Bien sur si on parlait d'un 3,5" en 5400 ou même 7200 t/mn avec plein de plateaux pour la même capacité, j'aurais déjà râlé chez le constructeur du disque et ne le garderai que pour faire des transfert entre machines...
Si vous avez encore des portables avec des hdd regardez ces erreurs et de quel type de disques elles sortent.... Et demandez vous pourquoi les 7200 t/mn sont limités à 1 To .... (soit deux faces d'un plateau de 1 To soit 500 Go par face)
Bien sur cela serait mieux si le nombre était zéro. Mais ça on ne le verra jamais car il n'y a plus trop de recherche sur les disques mécaniques et les constructeurs reconvertissent leurs usines à vitesse V pour faire du SSD. Et pourtant, quel est le coût d'un HDD de 2To par rapport à un SSD de 2 To ? Avec du LVM on n'a pas besoin d'avoir des disques hyper rapide si on gère bien le stockage ;-) Et si on prend un ordi qui a un port M.2 ET un emplacement pour un disque SATA HDD, on est les rois du pétrole. On a la vitesse et la place "à pas cher"...
Bon, j'ai étalé ma science, temps d'aller au resto et prendre mes cachets...
Bon Dimanche à tous.


* : en fait bien plus que ça. D'abord il y a les données de correction d'erreur et il faut beaucoup de bits par mot. Ensuite, il y a les données du constructeur pour éviter d'écrire sur les parties des plateaux qui sont mortes, ensuite il y a l'espace réservé pour les réallocations de blocs en cas de PB et enfin, il y a tous les logs, etc... Bref bien plus que les 2 To vendus par Mr Seagate....

Dernière modification par georgesgiralt (Le 22/01/2022, à 20:49)

Hors ligne

#22 Le 24/01/2022, à 11:53

georgesgiralt

Re : Smart erreur (popup)

Bonjour
Après le week-end, voila le point.
Coté NVME, Samsung m'a conseillé de vérifier le "disque" avec Samsun Magician. J'ai donc installé cet outil. Et il me dit "ce disque n'est pas supporté par Samsung Magician". Super. Je n'ai pas trouvé de firmware pour ce NVME sur leur site. Génial.
Coté HDD, j'ai continué à surveiller les logs. Ils ont terriblement augmentés pendant que je recopiais les données sur un autre disque. Et ont continué à croître.
J'ai donc mis dans le portable le disque cloné et posé une question à Mr Seagate (la garantie expire à la fin du mois)....
Je crois que je vais investir dans un disque 2.5" neuf....
Merci pour votre aide.
P.S. : j'ai ouvert le portable. Et je n'ai pas touché au SSD. En effet, la vis de fixation est scellée avec une étiquette "Lenovo" et la machine est sous garantie. De plus une rapide recherche me montre que je ne suis pas le seul à avoir des "unsafe shutdown" très nombreux et des erreurs bizarres en grand nombre sur ce type de SSD.... Bref, je vais faire l'autruche et m'assurer d'avoir de très bonne sauvegardes !

Édit : Voulant préparer un dossier de RMA Seagate, j'ai branché le disque et lancé un test SMART. Le taux d'erreurs 1 (Raw_Read_Error_Rate) est tombé de 94417627 à 84321112 ce matin...
Je suis un peu perplexe....

Dernière modification par georgesgiralt (Le 24/01/2022, à 12:10)

Hors ligne

#23 Le 24/01/2022, à 12:31

Vobul

Re : Smart erreur (popup)

georgesgiralt a écrit :

Édit : Voulant préparer un dossier de RMA Seagate, j'ai branché le disque et lancé un test SMART. Le taux d'erreurs 1 (Raw_Read_Error_Rate) est tombé de 94417627 à 84321112 ce matin...
Je suis un peu perplexe....

Le disque a compris que si il continuait à faire le malin il allait se faire RMA, alors il fait le beau !


Vobul
Utilisez le retour utilisable de commandes !!!
J'aime la langue française, mais je parle franglais, deal with it.
RTFM

Hors ligne

#24 Le 25/01/2022, à 19:20

georgesgiralt

Re : Smart erreur (popup)

Alors, j'avais posé la question à Seagate. Réponse : Envoyez le disque. Voici le numéro de RMA....
En cherchant, il semble que je ne sois pas le seul et que les erreurs corrigées se mettent à grimper très vite au bout d'un certain temps. Signe d'une future panne ? Je ne sais pas.
Voyons ce que va faire/dire Seagate.

Hors ligne

#25 Le 25/01/2022, à 20:05

geole

Re : Smart erreur (popup)

Bonjour
Puisque ce n'est pas le disque dur  qui est en cause, Peux-tu donner ce retour

sudo smartctl  -s on  -a /dev/nvme0n1
iznobe a écrit :

Pour info voici le  smartctl de mon nvme :

sudo smartctl -s on -a /dev/nvme0n1
=== START OF SMART DATA SECTION ===
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    1%

Dernière modification par geole (Le 25/01/2022, à 20:10)


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
Je défie QUICONQUE de trouver une discussion où j'aurais suggéré de remplacer un SSD par un disque dur.
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne