Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 23/04/2023, à 10:04

MatthieuF44

Sauvegarde de serveur

Bonjour,

Je fais parti d'un Fablab et nous avons l'intention de convertir un ancien PC en serveur domotique. Pour cela nous avons donc installer ubuntu serveur, fait les différentes configurations et installer domoticz.
Nous devons certifier le serveur avec let's encrypt mais ayant déjà eu plusieurs déboires avec cette procédure j'aurais aimé faire une sauvegarde du serveur.

Nous avons donc installé un autre disque dur et lancé la commande suivante :

sudo dd if=/dev/sda of=/dev/sdb conv=notrunc,noerror status=progress

Le problème c'est que lorsque j'essaye de booter depuis la sauvegarde seule j'obtiens des erreurs au lancement du type

Failure : file system check of the root filesystem failed

Je ne comprends pas l'erreur dans ma procédure, pouvez-vous m'aider ?

Merci d'avance.

Hors ligne

#2 Le 23/04/2023, à 10:37

bruno

Re : Sauvegarde de serveur

Bonjour,

On ne peut pas faire une image disque fiable d'un système en cours d'exécution (sauf cas particuliers). Il faut faire une copie à froid ou envisager une solution de sauvegarde moins radicale.

#3 Le 23/04/2023, à 10:47

geole

Re : Sauvegarde de serveur

Bonjour.
Ta procedure n'a pas d'erreur. Tu obtiens un double parfait, un clone.
A condition de l'avoir laissée finir.
La bonne commande serait

sudo dd if=/dev/sda of=/dev/sdb bs=1M conv=notrunc,noerror status=progress && sync

Je ne sais pas quelle version serveur tu as installé 22.04? 22.10?
Je ne connais pas le boot serveur. A tout hasard, il panique en trouvant des UUID identiques!!!!!
N'aurais-tu pas un message complémentaire?

Dernière modification par geole (Le 23/04/2023, à 10:50)


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit,  utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir  https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#4 Le 23/04/2023, à 11:21

bruno

Re : Sauvegarde de serveur

Attention, dd est juste un outil de copie de fichier, cela ne garanti en aucun cas une copie parfaite. On peut d'ailleurs parfaitement réaliser la même chose avec cp ou même cat.

Je persiste à croire que le problème vient d'une copie effectuée a à chaud comme le laisse supposer la formulation du premier message.

#5 Le 23/04/2023, à 11:52

Compte supprimé

Re : Sauvegarde de serveur

bruno a écrit :

On ne peut pas faire une image disque fiable d'un système en cours d'exécution

C'est ce que je pensais pour l'avoir lu sur de nombreuses sources.
Mais alors, comment se fait-il que Timeshift fasse des sauvegardes avec rsync alors que le système fonctionne ? Et que ces sauvegardes peuvent être restaurées avec succès ?

D'autre part, c'est sûr que pour le sujet de ce fil, il y a des disques et des partitions qui portent les mêmes identifiants. Ce n'est peut-être pas la seule cause du problème, mais elle y participe.

Dernière modification par Compte supprimé (Le 23/04/2023, à 11:55)

#6 Le 23/04/2023, à 19:14

MatthieuF44

Re : Sauvegarde de serveur

Tout d'abord merci pour vos nombreuses réponses.

geole a écrit :

Bonjour.
Ta procedure n'a pas d'erreur. Tu obtiens un double parfait, un clone.
A condition de l'avoir laissée finir.
La bonne commande serait

sudo dd if=/dev/sda of=/dev/sdb bs=1M conv=notrunc,noerror status=progress && sync

Je ne sais pas quelle version serveur tu as installé 22.04? 22.10?
Je ne connais pas le boot serveur. A tout hasard, il panique en trouvant des UUID identiques!!!!!
N'aurais-tu pas un message complémentaire?

Pour te répondre j'ai mis tout en bas des photos des écrans avant et après avoir fait un FSCK. La version que j'utilise est un Ubuntu Server 22.04.

bruno a écrit :

Attention, dd est juste un outil de copie de fichier, cela ne garanti en aucun cas une copie parfaite. On peut d'ailleurs parfaitement réaliser la même chose avec cp ou même cat.

Je persiste à croire que le problème vient d'une copie effectuée a à chaud comme le laisse supposer la formulation du premier message.

La copie a été lancée depuis un live-USB, du coup je supposais faire une copie "à froid".

Si cela peux vous aider, je vous joint des photos de l'écran :
Photo avant FSCK :
https://media.discordapp.net/attachment … 094705.jpg

Photo après FSCK :
https://cdn.discordapp.com/attachments/ … 100739.jpg

(modéré : taille des images !)

Dernière modification par bruno (Le 24/04/2023, à 09:18)

Hors ligne

#7 Le 23/04/2023, à 19:46

geole

Re : Sauvegarde de serveur

La cause est très certainement la duplication faite à partir du système opérationnel lui-même qui devait être en train de créer/modifier des fichiers.    Il est  nettement préférable de faire cette copie à partir d'un support d'installation.
Mais cependant,    il n'y a pas de raison que le systême lui-même  ne puisse pas mettre en route. Déconnecte la duplication,

Dernière modification par geole (Le 23/04/2023, à 19:48)


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit,  utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir  https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#8 Le 23/04/2023, à 19:48

MatthieuF44

Re : Sauvegarde de serveur

geole a écrit :

La cause est très certainement la duplication faite à partir du système opérationnel lui-même qui devait être en train de créer/modifier des fichiers.    Il est  nettement préférable de faire cette copie à partir d'un support d'installation.
Mais cependant,    il n'y a pas de raison que le systême lui-même  ne puisse pas mettre en route. Déconnecte la duplication,

Donc depuis un live-usb ?

Hors ligne

#9 Le 23/04/2023, à 19:54

Compte supprimé

Re : Sauvegarde de serveur

geole a écrit :

Déconnecte la duplication,

C'est à dire débrancher un des deux disques. Le ive-usb n'intervient pas dans cette affaire.

Dernière modification par Compte supprimé (Le 23/04/2023, à 19:55)

#10 Le 23/04/2023, à 20:04

MatthieuF44

Re : Sauvegarde de serveur

Je parlais du live-USB pour ça :

geole a écrit :

Il est  nettement préférable de faire cette copie à partir d'un support d'installation.

Mais geole a modifié sa réponse en même temps que j'écrivais smile

Hors ligne

#11 Le 23/04/2023, à 22:32

geole

Re : Sauvegarde de serveur

bruno a d'ailleurs dit que c'était une  obligation.


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit,  utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir  https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#12 Le 23/04/2023, à 22:53

MatthieuF44

Re : Sauvegarde de serveur

Je viens de faire un nouvel essai. J'ai donc booté sur le live-usb et lancé la commande

sudo dd if=/dev/sda of=/dev/sdb bs=1M conv=notrunc,noerror status=progress && sync

- sda est le disque dur du serveur d'origine
- sdb est le disque dur formaté recevant la sauvegarde

A la fin de la copie, j'ai éteins le pc. Débranché l'alim et le sata du sda. Dans le doute j'ai inversé le sata avec sdb.
J'ai relancé le serveur et je me retrouve avec la même phrase d'erreur.

Hors ligne

#13 Le 23/04/2023, à 23:23

geole

Re : Sauvegarde de serveur

Oui mais si le disque initial est déjà vérolé au moment de la duplication, sa replique aura le même problème.


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit,  utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir  https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#14 Le 24/04/2023, à 06:20

MatthieuF44

Re : Sauvegarde de serveur

Si je branche le disque dur initial, je n'ai aucun souci au niveau du boot.

Avez-vous une autre solution de sauvegarde ?

Hors ligne

#15 Le 24/04/2023, à 08:00

bruno

Re : Sauvegarde de serveur

On oublie mon hypothèse puisque la copie a bien été effectuée à froid.

La première erreur demandant un fsck, il est possible que le disque de sauvegarde ait un souci.
Il faudrait déjà donner les caractéristiques des deux disques avec smartctl :

smartctl -a /dev/sda
smartctl -a /dev/sdb

La seconde erreur au démarrage :

mounting /dev on /root/dev failed

est provoquée par l'initramfs qui ne trouve pas la partition racine. C'est soit un disque défectueux, soit un problème d'UUID comme supposé par @geole. Il faudrait examiner les UUID des partitions et le paramètre root=UUID=****** passé au noyau par le GRUB.

#16 Le 24/04/2023, à 10:44

MatthieuF44

Re : Sauvegarde de serveur

J'ai fait le smartctl sur les deux disques, voici le résultat.

smartctl -a /dev/sda

smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.19.0-32-generic] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

Smartctl open device: /dev/sda failed: Permission denied
<font color="#26A269"><b>ubuntu@ubuntu</b></font>:<font color="#12488B"><b>~</b></font>$ sudo smartctl -a /dev/sda
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.19.0-32-generic] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda SpinPoint F3
Device Model:     ST500DM005 HD502HJ
Serial Number:    S20BJ90C193311
LU WWN Device Id: 5 0004cf 206b0a5a8
Firmware Version: 1AJ10001
User Capacity:    500107862016 bytes [500 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Mon Apr 24 08:28:37 2023 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		( 4680) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  78) minutes.
SCT capabilities: 	       (0x003f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       392
  2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
  3 Spin_Up_Time            0x0023   082   080   025    Pre-fail  Always       -       5570
  4 Start_Stop_Count        0x0032   094   094   000    Old_age   Always       -       6754
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       3939
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   252   252   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   094   094   000    Old_age   Always       -       6826
191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       1
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   061   000    Old_age   Always       -       22 (Min/Max 14/40)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       8
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       0
223 Load_Retry_Count        0x0032   252   252   000    Old_age   Always       -       0
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       6826

SMART Error Log Version: 1
ATA Error Count: 77 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It &quot;wraps&quot; after 49.710 days.

Error 77 occurred at disk power-on lifetime: 3939 hours (164 days + 3 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 06 22 6a 2a e5  Error: UNC 6 sectors at LBA = 0x052a6a22 = 86665762

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 20 6a 2a e5 08      00:00:00.808  READ DMA
  27 00 00 00 00 00 e0 08      00:00:00.808  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 08      00:00:00.808  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:00:00.808  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 08      00:00:00.808  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]

Error 76 occurred at disk power-on lifetime: 3939 hours (164 days + 3 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 06 22 6a 2a e5  Error: UNC 6 sectors at LBA = 0x052a6a22 = 86665762

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 20 6a 2a e5 08      00:00:00.807  READ DMA
  c8 00 08 18 6a 2a e5 08      00:00:00.807  READ DMA
  c8 00 08 10 6a 2a e5 08      00:00:00.807  READ DMA
  c8 00 08 08 6a 2a e5 08      00:00:00.807  READ DMA
  c8 00 08 00 6a 2a e5 08      00:00:00.807  READ DMA

Error 75 occurred at disk power-on lifetime: 3939 hours (164 days + 3 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 28 6a 2a e5  Error: UNC 8 sectors at LBA = 0x052a6a28 = 86665768

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 28 6a 2a e5 08      00:00:02.255  READ DMA
  27 00 00 00 00 00 e0 08      00:00:02.255  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 08      00:00:02.255  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:00:02.255  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 08      00:00:02.255  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]

Error 74 occurred at disk power-on lifetime: 3939 hours (164 days + 3 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 28 6a 2a e5  Error: UNC 8 sectors at LBA = 0x052a6a28 = 86665768

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 28 6a 2a e5 08      00:00:02.254  READ DMA
  27 00 00 00 00 00 e0 08      00:00:02.254  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 08      00:00:02.254  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:00:02.254  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 08      00:00:02.254  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]

Error 73 occurred at disk power-on lifetime: 3939 hours (164 days + 3 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 28 6a 2a e5  Error: UNC 8 sectors at LBA = 0x052a6a28 = 86665768

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 28 6a 2a e5 08      00:00:02.253  READ DMA
  27 00 00 00 00 00 e0 08      00:00:02.253  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 08      00:00:02.253  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:00:02.253  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 08      00:00:02.253  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Completed [00% left] (0-65535)
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

smartctl -a /dev/sdb

smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.19.0-32-generic] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate BarraCuda 3.5
Device Model:     ST1000DM010-2EP102
Serial Number:    ZN1VAGSC
LU WWN Device Id: 5 000c50 0e3fbef65
Firmware Version: CC46
User Capacity:    1000204886016 bytes [1,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Mon Apr 24 08:28:45 2023 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 105) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x1085)	SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   006    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0003   100   100   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       1
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   045    Pre-fail  Always       -       15
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       28
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       37
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   074   074   040    Old_age   Always       -       26 (Min/Max 25/26)
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       37
194 Temperature_Celsius     0x0022   026   019   000    Old_age   Always       -       26 (0 19 0 0 0)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       8h+40m+47.878s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       2930431037
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       1954207035

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Concernant les UUID, j'ai ça :
/dev/sda2 : 4793ffb0-89ab-44a4-84aa-3f2a2fff36ba
/dev/sda3 : Dw0bYk-pEKv-ptnT-ZYlf-7yi0-BshK-00TMXh
/dev/sdb2 : 4793ffb0-89ab-44a4-84aa-3f2a2fff36ba
/dev/sdb3 : Dw0bYk-pEKv-ptnT-ZYlf-7yi0-BshK-00TMXh

Hors ligne

#17 Le 24/04/2023, à 11:05

geole

Re : Sauvegarde de serveur

MatthieuF44 a écrit :
sudo smartctl -a /dev/sda
=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda SpinPoint F3
Device Model:     ST500DM005 HD502HJ
Serial Number:    S20BJ90C193311
User Capacity:    500107862016 bytes [500 GB]
Sector Size:      512 bytes logical/physical
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       3939
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       8

Error 77 occurred at disk power-on lifetime: 3939 hours Error: UNC 6 sectors at LBA =  86665762
Error 76 occurred at disk power-on lifetime: 3939 hours Error: UNC 6 sectors at LBA =  86665762
Error 75 occurred at disk power-on lifetime: 3939 hours Error: UNC 8 sectors at LBA =  86665768
Error 74 occurred at disk power-on lifetime: 3939 hours Error: UNC 8 sectors at LBA =  86665768
Error 73 occurred at disk power-on lifetime: 3939 hours Error: UNC 8 sectors at LBA =  86665768

Je n'aime pas cela du tout
Si ce disque SDA    est le "double" il a un problème à réparer. Ces secteurs peuvent être très utiles puisqu'on veut les lire.
Si ce disque SDA    est  "l'original", il y aurait dut y avoir un problème de duplication signalé et il ne devrait plus booter.

En attendant, on va tenter de réparer

DSKin=sda #### Disque à réparer
j= 86665760 #### Numéro premier secteur à tester.
n=16  #### Nombre de secteurs consécutifs à tester.
f=$(($j+$n)); for ((k=$j;k<$f;k++));do
sudo dd if=/dev/$DSKin bs=512 count=1 skip=$j 1>/dev/null 2>/tmp/REP ; A=$(cat /tmp/REP | sed  's/\xc2\xa0//g')
 if [[ $A =~ "1+0enregistrements lus" ]]; then echo bonne lecture du secteur $j; else    if [[ $A =~ "0+0enregistrements lus" ]]; then echo réparation du secteur $i; echo sudo hdparm --yes-i-know-what-i-am-doing --write-sector $j /dev/$DSKin; sleep 0.2; sudo dd if=/dev/$DSKin bs=512 count=1 skip=$j 1>/dev/null 2>/tmp/REP;A=$(cat /tmp/REP | sed  's/\xc2\xa0//g');         if [[ $A =~ "1+0enregistrements lus" ]]; then echo bonne Réparation du secteur $j;  else echo -e "\n\a\E[31mMAUVAISE REPARATION DU SECTEUR $j \E[0m";fi;    else echo  -e "\n\a\E[31mINCIDENT INCONNU AU SECTEUR $j \E[0m"; cat /tmp/REP;fi; fi;j=$(($j+1));done   
sudo smartctl -a /dev/$DSKin | egrep "Pending|Reallocated"

Notons que le disque SDB est neuf

  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       28

Dernière modification par geole (Le 24/04/2023, à 11:09)


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit,  utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir  https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#18 Le 24/04/2023, à 11:10

bruno

Re : Sauvegarde de serveur

Je laisse les spécialistes interpréter la sortie de smartctl, mais sda contient des erreurs (Current_Pending_Sector) apparues très récemment. Il faut voir comment cette valeur évolue dans le temps, mais pour moi ce disque n'est pas fiable pour un serveur.

Pour les UIID, cela devrait être ok si c'est bien le m^me qui est passé au noyau par GRUB (voir le contenu du fichier /boot/grub/grub.cfg). Par contre il ne faut pas que les deux disques soient présents en même temps au démarrage ! L'un des deux doit être débranché.

Personnellement je n'ai jamais compris l'utilité de cloner un disque entier : c'est long, peu fiable, et c'est un gaspillage de ressources et d'énergie. Une sauvegarde ne devrait contenir que des données, pas le système qui se réinstalle facilement et rapidement. Si une ou plusieurs procédure d'installation et de configuration des services ont été laborieuses, il faut les refaire en prenant des notes. Une procédure correctement documentée se reproduit vite et bien. Au pire on fait une sauvegarde de /etc/xxx pour avoir une copie des fichiers de configuration utiles.

Dernière modification par bruno (Le 24/04/2023, à 12:02)

#19 Le 24/04/2023, à 11:19

geole

Re : Sauvegarde de serveur

Il est vrai que pour un serveur qui doit vraiment faire office de serveur, on utilise du raid.
J'ai noté  cette option utilisée dans la commande dd
       noerror  ==>       continue after read errors
Je ne sais pas si l'erreur est signalée..... L'erreur bien est signalée.

sudo dd if=/dev/sdb of=fic.img conv=notrunc,noerror status=progress
520192 octets (520 kB, 508 KiB) copiés, 26 s, 20,3 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 28,4661 s, 18,3 kB/s
520192 octets (520 kB, 508 KiB) copiés, 28 s, 18,3 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 31,3045 s, 16,6 kB/s
520192 octets (520 kB, 508 KiB) copiés, 31 s, 16,6 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 34,0601 s, 15,3 kB/s
520192 octets (520 kB, 508 KiB) copiés, 34 s, 15,3 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 36,8822 s, 14,1 kB/s
520192 octets (520 kB, 508 KiB) copiés, 37 s, 14,1 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 39,7294 s, 13,1 kB/s
520192 octets (520 kB, 508 KiB) copiés, 40 s, 13,1 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 42,5432 s, 12,2 kB/s
520192 octets (520 kB, 508 KiB) copiés, 43 s, 12,2 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 45,3904 s, 11,5 kB/s
520192 octets (520 kB, 508 KiB) copiés, 45 s, 11,5 kB/s
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 48,2042 s, 10,8 kB/s
84996608 octets (85 MB, 81 MiB) copiés, 56 s, 1,5 MB/s^M
87511552 octets (88 MB, 83 MiB) copiés, 60 s, 1,5 MB/s^M
89598464 octets (90 MB, 85 MiB) copiés, 61 s, 1,5 MB/s^C
187529+0 enregistrements lus
187528+0 enregistrements écrits
96014336 octets (96 MB, 92 MiB) copiés, 62,0246 s, 1,5 MB/s

Sinon, c'est classique.

sudo dd if=/dev/sdb of=fic.img conv=notrunc
dd: erreur de lecture dans '/dev/sdb': Erreur d'entrée/sortie
1016+0 enregistrements lus
1016+0 enregistrements écrits
520192 octets (520 kB, 508 KiB) copiés, 5,69843 s, 91,3 kB/s

C'est donc peut-être l'original qui serait malade    avec oubli de copie de  secteurs dans son double. Dans ce cas je ne comprends pas comment il peut mettre en route.


AJOUT. Je n'avais pas fait attention. 

=== START OF INFORMATION SECTION  =====>  Pour SDA
User Capacity:    500107862016 bytes [500 GB]

=== START OF INFORMATION SECTION ===> Pour SDB
User Capacity:    1000204886016 bytes [1,00 TB]

Si SDB a été copié dans SDA,       il y a 50% de données perdues.  Pas surprenant que cela ne mette pas en route.
si SDA a été copié dans SDB hormis les 8 secteurs illisibles,    La taille du SDB a été réduite de 50%

Dans les deux cas, ce n'est pas merveilleux.
Si tu ne souhaites  pas sauver les données. il faut:
- Soit copier le disque dans  dans un fichier compressé de l'autre disque...
- Soit  dupliquer partition par partition. Pour  cela l'application gparted est merveilleuse.   Elle fabrique une partition de taille identique en ne copiant que les données utiles. Un petit piège, elle oublie les drapeaux.
- Soit copier partition par partition  (Paragraphe 4.11) dans  un fichier compressé  quelque part dans une partition  de l'autre disque.

sudo dd if=/dev/sdb1 bs=1M status=progress | gzip > /media/$USER/PointDeMontage/sdb1.gz
sudo dd if=/dev/sdb2 bs=1M status=progress | gzip > /media/$USER/PointDeMontage/sdb2.gz
sudo dd if=/dev/sdb3 bs=1M status=progress | gzip > /media/$USER/PointDeMontage/sdb3.gz

Dernière modification par geole (Le 24/04/2023, à 12:35)


Les grilles de l'installateur https://doc.ubuntu-fr.org/tutoriel/inst … _subiquity
"gedit admin:///etc/fstab" est proscrit,  utilisez "pkexec env DISPLAY=$DISPLAY XAUTHORITY=$XAUTHORITY xdg-open /etc/fstab" Voir  https://doc.ubuntu-fr.org/gedit
Les partitions EXT4 des disques externes => https://forum.ubuntu-fr.org/viewtopic.p … #p22697248

Hors ligne

#20 Le 01/05/2023, à 20:00

MatthieuF44

Re : Sauvegarde de serveur

Bonjour à tous,

Nous avons décidé de faire comme conseillé une sauvegarde du dossier /etc/ et des fichiers utiles seulement.

Merci pour vos conseils !

Hors ligne