#1 Le 31/03/2024, à 13:08
- Arbiel
Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
Bonjour
Le message est le suivant :
LE DISQUE VA PROBABLEMENT BIENTÔT TOMBER EN PANNE (35 ℃ / 95 ℉)
mais j'ai dû le mettre en minuscules dans le titre pour satisfaire les contraintes du forum.
Que me conseillez-vous, un remplacement immédiat de mon disque SSD, ou ce message, qui se veut catastrophique, est-il trop alarmiste ?
À vrai dire, au démarrage précédent, il y a environ 3 heures, la température affichée était de 45 ℃.
Arbiel
Arbiel Perlacremaz
LDLC Aurore NK3S-8-S4 Ubuntu 20.04, GNOME 3.36.8
24.04 en cours de tests
Abandon d'azerty au profit de bépo, de google au profit de Lilo et de la messagerie électronique violable au profit de Protonmail, une messagerie chiffrée de poste de travail à poste de travail.
Hors ligne
#2 Le 31/03/2024, à 13:35
- geole
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
Bonjour.
Ce n'est probablement pas un problème de température
Installe l'application smartmontools si nécessaire
Publie l'état du disque. La lettre X est à adapter.
sudo smartctl -s on -a /dev/sdX
Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit, utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248
En ligne
#3 Le 31/03/2024, à 14:25
- Phil17
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
+1 avec geole, mes SSD miniatures (NVMe) sont régulièrement à des températures supérieures à 45°C lorsque je fais de l'encodage vidéo.
Pour connaître la lettre du disque externe, dans le Terminal :
mount | grep media
XPS15 version 2020 (7590) i7-9750H, RAM : 16 Go, SSD 512 Go, Écran FHD 15,6"
Xubuntu 22.04LTS, TLP en mode BAT persistant.
Hors ligne
#4 Le 01/04/2024, à 18:16
- Arbiel
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
Bonsoir
J'ai été occupé pour réparer le problème dont j'ai fait état ici.
Je ne sais pas si ces deux problèmes étaient liés. J'ai momentanément réparé l'autre problème, mais la batterie continue à me faire des soucis.
Pour l'instant, je n'ai plus d'alerte relative à l'état de mon disque. J'ai exécuté smartctl avec le résultat suivant
arbiel@arbiel-NK3S-8-S4:~$ sudo smartctl -s on -a /dev/sda
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.15.0-50-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: LDLC F6+M.2 480
Serial Number: 09292220J0403
Firmware Version: T0707A0
User Capacity: 480103981056 bytes [480 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: M.2
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-3 T13/2161-D revision 4
SATA Version is: SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Mon Apr 1 19:08:06 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 120) seconds.
Offline data collection
capabilities: (0x11) SMART execute Offline immediate.
No Auto Offline data collection support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
No Selective Self-test supported.
SMART capabilities: (0x0002) Does not save SMART data before
entering power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 10) minutes.
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x0032 100 100 050 Old_age Always - 0
5 Reallocated_Sector_Ct 0x0032 100 100 050 Old_age Always - 60
9 Power_On_Hours 0x0032 100 100 050 Old_age Always - 1800
12 Power_Cycle_Count 0x0032 100 100 050 Old_age Always - 4622
160 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 269
161 Unknown_Attribute 0x0033 100 100 050 Pre-fail Always - 95443684
163 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 21
164 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 9858
165 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 65
166 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 2
167 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 17
168 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 2000
169 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 100
175 Program_Fail_Count_Chip 0x0032 100 100 050 Old_age Always - 0
176 Erase_Fail_Count_Chip 0x0032 100 100 050 Old_age Always - 0
177 Wear_Leveling_Count 0x0032 100 100 050 Old_age Always - 0
178 Used_Rsvd_Blk_Cnt_Chip 0x0032 100 100 050 Old_age Always - 60
181 Program_Fail_Cnt_Total 0x0032 100 100 050 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 050 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 050 Old_age Always - 368
194 Temperature_Celsius 0x0022 100 100 050 Old_age Always - 33
195 Hardware_ECC_Recovered 0x0032 100 100 050 Old_age Always - 50732506
196 Reallocated_Event_Count 0x0032 100 100 050 Old_age Always - 269
197 Current_Pending_Sector 0x0032 100 100 050 Old_age Always - 60
198 Offline_Uncorrectable 0x0032 100 100 050 Old_age Always - 269
199 UDMA_CRC_Error_Count 0x0032 100 100 050 Old_age Always - 0
232 Available_Reservd_Space 0x0032 100 100 050 Old_age Always - 95443684
241 Total_LBAs_Written 0x0030 100 100 050 Old_age Offline - 139579
242 Total_LBAs_Read 0x0030 100 100 050 Old_age Offline - 356201
245 Unknown_Attribute 0x0032 100 100 050 Old_age Always - 63252
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
Selective Self-tests/Logging not supported
Qu'en pensez-vous ?
arbiel@arbiel-NK3S-8-S4:~$
Arbiel Perlacremaz
LDLC Aurore NK3S-8-S4 Ubuntu 20.04, GNOME 3.36.8
24.04 en cours de tests
Abandon d'azerty au profit de bépo, de google au profit de Lilo et de la messagerie électronique violable au profit de Protonmail, une messagerie chiffrée de poste de travail à poste de travail.
Hors ligne
#5 Le 01/04/2024, à 18:48
- geole
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
Bonjour.
Rien d'anormal de détecté mais tous les compteurs ont cette caractéristique 100 100 050. Je ne suis pas certain qu'elle soit bien gérée.
Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit, utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248
En ligne
#6 Le 01/04/2024, à 23:27
- inbox
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
Salut,
Cette ligne est intrigante :
161 Unknown_Attribute 0x0033 100 100 050 Pre-fail Always - 95443684
C'est une valeur "pre-fail" (qui peut indiquer une proche défaillance si le compteur est élevé) et le compteur 95443684. Ce qui m'intrigue, c'est que l'on ne sait pas à quoi ça correspond (161 Unknown_Attribute) et donc si c'est un vrai problème.
J'ai trouvé ce sujet ou est indiqué ce que représentent les valeurs 160 et suivantes.
160 (0xA0) - initial back (bad) block count (?)
161 (0xA1) - bad block count
162 (0xA2) - spare block count
163 (0xA3) - maximum erase count
164 (0xA3) - avg erase count
165 (0xA3) - avg erase count (?)
Le 161 est donc le compteur des 95443684 blocs défectueux !
Je pense donc que ton SSD a un joli problème. Peut-être faut-il vérifier les autres valeurs ?
A+
Un problème résolu ? Indiquez le en modifiant le titre du sujet.
Hors ligne
#7 Le 01/04/2024, à 23:47
- geole
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
Je suis presque convaincu que les N° de compteurs ne sont pas normalisés.
Il faudrait interroger LDLC
Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit, utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248
En ligne
#8 Le 02/04/2024, à 08:57
- Arbiel
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
Je compte effectivement interroger LDLC, d'autant plus que j'ai également ce problème, dans lequel j'indique que, fonctionnant sur la batterie, mon PC s'est brutalement arrêté avec un niveau d'énergie égal à environ 50%
Après la seconde panne, je n'ai pas eu ce même problème, mais en redémarrant j'ai constaté que le niveau d'énergie était à un peu moins de 50%. Ma batterie est donc défectueuse, et je vais la remplacer. Pourtant elle n'a que 3 ans, et, apparemment, une faible longévité. Ou peut-être un faux contact qui résulterait de mes déplacements. Je suis rentré de voyage avant-hier.
Arbiel Perlacremaz
LDLC Aurore NK3S-8-S4 Ubuntu 20.04, GNOME 3.36.8
24.04 en cours de tests
Abandon d'azerty au profit de bépo, de google au profit de Lilo et de la messagerie électronique violable au profit de Protonmail, une messagerie chiffrée de poste de travail à poste de travail.
Hors ligne
#9 Le 02/04/2024, à 17:45
- geole
Re : Le disque va probablement bientôt tomber en panne (35 ℃ / 95 ℉)
On voit quand même deux problèmes
5 Reallocated_Sector_Ct 0x0032 100 100 050 Old_age Always - 60
178 Used_Rsvd_Blk_Cnt_Chip 0x0032 100 100 050 Old_age Always - 60
qui montre que 60 secteurs ont du être remplacé et que 60 secteurs sont encore à remplacer
197 Current_Pending_Sector 0x0032 100 100 050 Old_age Always - 60
Mais qu'il n'y a aucun incident de lecture.
SMART Error Log Version: 1
No Errors Logged
Le fait qu'il y ait la même valeur me surprend un peu: Second compteur oublié d'être décrémentés lorsque passage dans le premier compteur?
Si 60 secteurs sont illisibles, il devrait y avoir au moins 60 erreurs de lecture.
De plus, le nombre de tentatives de corrections est nettement supérieur au nombre de corrections.
196 Reallocated_Event_Count 0x0032 100 100 050 Old_age Always - 269
Mais le plus embêtant est qu'il n'existe qu'un seul compteur pre-fail (161) qui indique bon à 100% et qu'on est incapable de savoir si le gros chiffre à droite est normal ou pas. De plus avec ce nom bidon....
'
Dans ce lien j'ai trouvé qu'une énorme valeur est excellente.
Attribute 161 - Valid Spare Block Count
Contains the remaining spare block percentage available on a solid state device.
The percentage starts at 100% and will typically decrease to 0% during use.
If this attribute reaches 0%, the solid state device becomes read-only.
attribute may contain the actual number of spare blocks.
Dernière modification par geole (Le 02/04/2024, à 18:10)
Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit, utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248
En ligne