Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 23/04/2019, à 07:07

hibiki.tokay

Extraction des images d'un lot de pdf.

Bonjour
Je voudrai procéder à l'extraction des images d'un grand nombre de pdf.
J'ai plus de 1000 pdf (mangas et bd), dans un certain nombre il y a des pages double. Pour la lecture sur tablette c'est ennuyeux.
Donc je voudrais extraire toutes les images de ces pdf afin de les découper.
Pdfmod fait ça bien mais 1 par 1. J'ai vu aussi pdfimage.
Ce que je voudrait c'est que l'extraction complète de chaque pdf ce fasse dans un dossier au même nom que le pdf.
Est ce que pdfimage sait le faire et si oui comment?
Merci pour votre aide.


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#2 Le 23/04/2019, à 16:04

cqfd93

Re : Extraction des images d'un lot de pdf.

Bonjour,

Je te donne une piste, après à toi d'écrire ton script.

On peut utiliser la fonction convert d'ImageMagick pour convertir un pdf en images.

Puisque tu veux que les images se trouvent dans un dossier du même nom que ton pdf, tu devras d'abord créer un dossier de ce nom et utiliser la commande :

convert monpdf.pdf jpg:monpdf/images%03d.jpg

(ici, le pdf s'appelle "monpdf" et la numérotation des images se fera sur 3 chiffres)


Priblème avec Imagemagick 6 : par défaut, la lecture et l'écriture de pdf est interdite (à la suite d'un bug ghostscript si j'ai bien compris, mais le bug aurait été corrigé). Pour y remédier, il faut éditer le fichier /etc/ImageMagick-6/policy.xml pour remplacer "none" par "read|write" dans la ligne :

<policy domain="coder" rights="none" pattern="PDF" />

Elle devient donc :

<policy domain="coder" rights="read|write" pattern="PDF" />

cqfd93

En ligne

#3 Le 23/04/2019, à 16:41

Nuliel

Re : Extraction des images d'un lot de pdf.

Hello,

Une tite recherche donne

naziel@naziel-ThinkPad-X220:~$ apt-cache search pdf image extract | sort
forensics-extra - Forensics Environment - extra console components (metapackage)
gimp-plugin-registry - dépôt d'extensions optionnelles pour GIMP
poppler-utils - utilitaires PDF (basés sur Poppler)
swftools - Collection d'utilitaires pour la manipulation/création des fichiers SWF
swftools-dbg - Collection d'utilitaires pour la manipulation/création des fichiers SWF (débogage)
texlive-latex-extra - TeX Live: LaTeX additional packages
naziel@naziel-ThinkPad-X220:~$

en particulier poppler-utils qui a l'air intéressant.

naziel@naziel-ThinkPad-X220:~$ apt-cache show poppler-utils
Package: poppler-utils
Architecture: amd64
Version: 0.62.0-2ubuntu2.8
Multi-Arch: foreign
Priority: optional
Section: utils
Source: poppler
Origin: Ubuntu
Maintainer: Ubuntu Developers <ubuntu-devel-discuss@lists.ubuntu.com>
Original-Maintainer: Debian freedesktop.org maintainers <pkg-freedesktop-maintainers@lists.alioth.debian.org>
Bugs: https://bugs.launchpad.net/ubuntu/+filebug
Installed-Size: 594
Provides: pdftohtml, xpdf-utils
Depends: libpoppler73 (= 0.62.0-2ubuntu2.8), libc6 (>= 2.14), libcairo2 (>= 1.12.0), libfreetype6 (>= 2.2.1), liblcms2-2 (>= 2.2+git20110628), libstdc++6 (>= 5.2)
Conflicts: pdftohtml
Breaks: xpdf-common, xpdf-utils (<< 1:0)
Replaces: pdftohtml, xpdf-reader, xpdf-utils (<< 3.02-2~)
Filename: pool/main/p/poppler/poppler-utils_0.62.0-2ubuntu2.8_amd64.deb
Size: 153696
MD5sum: 531f798391d9f7c00c10d53c702ccf11
SHA1: 732edcc64e0c1ff8fa2961a93769dc5bfd179add
SHA256: 41c805b8432d2010da543aee34476d1fc326d7a140ed306b1bc53b73bb26de3c
Homepage: http://poppler.freedesktop.org/
Description-fr: utilitaires PDF (basés sur Poppler)
 Poppler est une bibliothèque de rendu PDF fondée sur l'afficheur PDF Xpdf.
 .
 This package contains command line utilities (based on Poppler) for getting information of PDF documents, convert them to other formats, or manipulate them:
  * pdfdetach -- lists or extracts embedded files (attachments)
  * pdffonts -- font analyzer
  * pdfimages -- image extractor
  * pdfinfo -- document information
  * pdfseparate -- page extraction tool
  * pdfsig -- verifies digital signatures
  * pdftocairo -- PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
  * pdftohtml -- PDF to HTML converter
  * pdftoppm -- PDF to PPM/PNG/JPEG image converter
  * pdftops -- PDF to PostScript (PS) converter
  * pdftotext -- text extraction
  * pdfunite -- document merging tool
Description-md5: c82ab1c01fb88c7aab560b4a6154c69f
Task: ubuntu-desktop, print-server, kubuntu-desktop, xubuntu-core, xubuntu-desktop, lubuntu-desktop-share, lubuntu-gtk-desktop, lubuntu-desktop, lubuntu-qt-desktop, ubuntustudio-desktop-core, ubuntustudio-desktop, ubuntukylin-desktop, ubuntu-mate-core, ubuntu-mate-desktop, ubuntu-budgie-desktop
Supported: 5y

Package: poppler-utils
Architecture: amd64
Version: 0.62.0-2ubuntu2
Multi-Arch: foreign
Priority: optional
Section: utils
Source: poppler
Origin: Ubuntu
Maintainer: Ubuntu Developers <ubuntu-devel-discuss@lists.ubuntu.com>
Original-Maintainer: Debian freedesktop.org maintainers <pkg-freedesktop-maintainers@lists.alioth.debian.org>
Bugs: https://bugs.launchpad.net/ubuntu/+filebug
Installed-Size: 594
Provides: pdftohtml, xpdf-utils
Depends: libpoppler73 (= 0.62.0-2ubuntu2), libc6 (>= 2.14), libcairo2 (>= 1.12.0), libfreetype6 (>= 2.2.1), liblcms2-2 (>= 2.2+git20110628), libstdc++6 (>= 5.2)
Conflicts: pdftohtml
Breaks: xpdf-common, xpdf-utils (<< 1:0)
Replaces: pdftohtml, xpdf-reader, xpdf-utils (<< 3.02-2~)
Filename: pool/main/p/poppler/poppler-utils_0.62.0-2ubuntu2_amd64.deb
Size: 153964
MD5sum: 39a57870ff87e4d6684fcadc89a6feb5
SHA1: 0ec14f9f3026347d520192aa0c373f0b7c9dadde
SHA256: 600837c3bd1bda8325038d2dfcbeb083ce05e55fe7e5156ceb220de8717dcfe1
Homepage: http://poppler.freedesktop.org/
Description-fr: utilitaires PDF (basés sur Poppler)
 Poppler est une bibliothèque de rendu PDF fondée sur l'afficheur PDF Xpdf.
 .
 This package contains command line utilities (based on Poppler) for getting information of PDF documents, convert them to other formats, or manipulate them:
  * pdfdetach -- lists or extracts embedded files (attachments)
  * pdffonts -- font analyzer
  * pdfimages -- image extractor
  * pdfinfo -- document information
  * pdfseparate -- page extraction tool
  * pdfsig -- verifies digital signatures
  * pdftocairo -- PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
  * pdftohtml -- PDF to HTML converter
  * pdftoppm -- PDF to PPM/PNG/JPEG image converter
  * pdftops -- PDF to PostScript (PS) converter
  * pdftotext -- text extraction
  * pdfunite -- document merging tool
Description-md5: c82ab1c01fb88c7aab560b4a6154c69f
Task: ubuntu-desktop, print-server, kubuntu-desktop, xubuntu-core, xubuntu-desktop, lubuntu-desktop-share, lubuntu-gtk-desktop, lubuntu-desktop, lubuntu-qt-desktop, ubuntustudio-desktop-core, ubuntustudio-desktop, ubuntukylin-desktop, ubuntu-mate-core, ubuntu-mate-desktop, ubuntu-budgie-desktop
Supported: 5y

naziel@naziel-ThinkPad-X220:~$

Donc tu pourrais tenter d'installer poppler-utils et essayer pdfimages

Hors ligne

#4 Le 23/04/2019, à 17:56

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

Merci a vous 2.
Ce matin j’étais sur un mobile donc je n'avais pas trouvé mon bonheur. Après 2 bonnes heures de recherche j'ai trouvé ce que je cherché.

1) --- Dans un premier temps je créés un dossier du même nom que le fichier sans l'extension, ainsi que 2 autres dossiers a l’intérieur nommé 1 et 2

mkdir -p '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/1/' '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/2/'

Je doit passer par un ls puis copier la liste dans calc pour supprimer les extensions.

2) --- Ensuite j"utilise la commande suivante

pdfimages -j '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01.pdf' '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/20th century boy-01'

3) --- Ensuite je transfert manuellement les pages doubles dans le dossier 1 (je ne pense pas que cela soit possible d'automatiser cette partie)

4) --- Je coupe les pages double avec cette commande

convert '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/1/*.jpg'  -crop 2x1@ -set filename:f '%t.jpg' +adjoin '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/2/%[filename:f]-%03d.jpg'

MERCI à cqfd93 pour le %03d ça faisais bien 30min que je cherchais comment forcer la numérotation sur 3 chiffres

Mon problème avec cette partie c'est que ça donne (pour exemple)

pour la première image --> 20th century 000.jpg et 20th century 001.jpg
pour la seconde image --> 20th century 002.jpg et 20th century 003.jpg

or le fichier d'origine ce nomme 20th century boy-01-005 pour la première image a traiter et 20th century boy-01-006 pour la seconde. vu le nombre de fichier a traiter je voudrais que l'image soit séparer en deux images nommée 20th century boy-01-005-1, 20th century boy-01-005-2, 20th century boy-01-006-1 et 20th century boy-01-006-2

5) --- Par la suite je veux transférer ces nouvelles images dans le dossier d'origine.

mv -r '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/2' '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/20th century boy-01'

6) --- Modifier la résolution avec une hauteur de 1200 pixels

mogrify -resize 1200x1200 '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/*.jpg' 

7) --- Et enfin recréé le pdf

convert '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01/'*.jpg '/home/hibiki-tokay/Datas/A trier/mangas/20th century boy-01.pdf'

Pourriez vous m'aider pour créer un script qui pourrait automatiser dans un premier temps les étapes 1 et 2 ensemble, puis dans un second temps les étapes 4 à 7.
Pour le moment je passe par l’intermédiaire d'un fichier calc avec des "concat" pour me créer automatiquement les lignes de commande que je colle dans le terminal.

Pour l'exemple la j'ai 1029 pdf a traiter, imaginez le temps que l'étape 3 va me prendre.

Merci

Dernière modification par hibiki.tokay (Le 23/04/2019, à 18:40)


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#5 Le 23/04/2019, à 18:09

cqfd93

Re : Extraction des images d'un lot de pdf.

Si je comprends bien, certaines images d'un même pdf sont des doubles pages, mais pas toutes ? Ou alors toutes les images d'un même pdf sont doubles (ce qui serait plus simple à traiter par script) ?


cqfd93

En ligne

#6 Le 23/04/2019, à 18:11

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

Exactement seule quelques image sont en pages double.

Pour l'étape 3 serait il possible, si je modifie la résolution des images en premier de dire a imagemagic de déplacer les images plus large que haute vers le dossier 1? (si oui au lieu de lui donner 1200x1200 je lui donnerai 5000x1200 lors du redimensionnement)

Dernière modification par hibiki.tokay (Le 23/04/2019, à 18:16)


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#7 Le 23/04/2019, à 18:15

cqfd93

Re : Extraction des images d'un lot de pdf.

Dans ce cas, il faut que tu passes à la main dans chaque dossier (avec ton gestionnaire de fichiers) pour y sélectionner les pages que tu veux dédoubler avec un script de ton cru que tu lances comme un nautilus-script.


cqfd93

En ligne

#8 Le 23/04/2019, à 18:19

Nuliel

Re : Extraction des images d'un lot de pdf.

Ou alors s'il y a vraiment trop de doubles pages il est peut être possible de raisonner sur la taille des images pour couper seulement les images de taille assez grande. exiftool permet d'avoir des caractéristiques sur des images, ça pourrait être utilisé.

Pour ma part je fais jamais de script bash donc je vais avoir du mal

Hors ligne

#9 Le 23/04/2019, à 18:22

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

Jusqu’à présent je n'en avais pas eu besoin mais comme j'ai décidé de normaliser mes bds et mangas et avec environ 5000 fichiers a traiter au total, je pense que ce serais pas mal (de plus pour les suivants a venir ça ne servira toujours).
Mais mon problème c'est que je n'y comprend rien en script

Pour ma procédure décrite plus haut mes problèmes sont:
L'étape 3 (très chronophage)
et
L'étape 4 (avec ce problème de renommage pour conserver l'ordre des pages)

Si quelqu’un pouvait le crée ce script a partir de ces donnée si cela est possible je lui serais très reconnaissant.
Avec quelques explication pour pouvoir me débrouiller seul la prochaine fois.

Merci

Dernière modification par hibiki.tokay (Le 23/04/2019, à 18:27)


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#10 Le 23/04/2019, à 18:24

cqfd93

Re : Extraction des images d'un lot de pdf.

Si dans un même pdf, toutes les pages simples ont la même taille (en pixels) et les pages doubles font bien le double, oui ça doit pouvoir se traiter par script.

Je me suis fait un paquet de scripts adaptés à mes besoins que je lance par le menu droit nautilus (en fait caja mais c'est pareil). Niveau script, je n'arrive pas au petit orteil des cadors du forum, mais j'ai quand même un peu appris smile


cqfd93

En ligne

#11 Le 23/04/2019, à 18:36

cqfd93

Re : Extraction des images d'un lot de pdf.

Je profite de ce fil pour en apprendre davantage sur imagemagick wink

Pour connaître la taille en pixels d'une image (en réponse, ça donne juste deux nombres, la largeur et la hauteur) :

identify -ping -format '%w %h' monimage.jpg

(l'option -ping a pour but de récupérer l'information sans ouvrir l'image)

Si on ne veut que la largeur :

identify -ping -format '%w' monimage.jpg

cqfd93

En ligne

#12 Le 23/04/2019, à 18:42

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

Donc a partir de cette commande il devrait être possible de déplacer automatiquement les image qui font plus de 1000 pixels de large (dans mon cas) vers le dossier 1?


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#13 Le 23/04/2019, à 18:46

cqfd93

Re : Extraction des images d'un lot de pdf.

Oui, c'est tout à fait possible si tu es sûr que seules las pages doubles font plus de 1000 pixels de large.


cqfd93

En ligne

#14 Le 23/04/2019, à 18:51

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

Normalement oui car les pages feront 1200 de haut et environ 600 à 800 de large
Je viens de trouver ça http://softlibre.gloobe.org/imagemagick/doc_start avec pas mal d'info (trop même)


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#15 Le 23/04/2019, à 18:55

cqfd93

Re : Extraction des images d'un lot de pdf.

Donc tu devrais pouvoir automatiser la chose. Imagemagick a tellement de ressources que tu n'es pas prêt d'en voir les limites !


cqfd93

En ligne

#16 Le 23/04/2019, à 18:58

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

le truc c'est que je ne sais pas comment combiner par exemple un "mv" avec le "ping" .
En fait je ne sais pas combiner tout court, je suis sur que dans mes commande plus haut il serait possible de faire plus court et simple mais je n'en ai aucune idée


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#17 Le 23/04/2019, à 19:11

cqfd93

Re : Extraction des images d'un lot de pdf.

Il est certainement possible de faire plus simple. Déjà, il faut savoir ce que tu veux faire exactement avec toutes ces images : juste les conserver dans des dossiers séparés ou les recombiner en pdf sans page double (et jeter les dossiers d'images devenus inutiles) ?

Pour tout ce que tu veux faire, il est utile de mettre en évidence les grandes lignes et de ne pas vouloir tout faire d'un bloc. Ton futur script devra :
* prendre un fichier pdf dans ta sélection
* créer un dossier d'images
* convertir le pdf et stocker les images dans ce dossier
* pour chaque image du dossier
    + voir si sa taille est supérieure à 1000 pixels
        - si oui, la dédoubler en image-1 et image-2
        - si non, c'est tout bon (éventuellement renommer en image-1 si ça aide)
* renommer toutes les images du dossier
* éventuellement reconvertir en pdf

ps : je te donne des idées mais je n'écrirai pas ton script wink

Dernière modification par cqfd93 (Le 23/04/2019, à 19:22)


cqfd93

En ligne

#18 Le 24/04/2019, à 05:55

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

Oui effectivement ce que je voudrais faire c'est:
1) Créer un dossier au nom du fichier PDF.
2) Extraire les images de ce fichier PDF dans le dossier précédemment créé.
3) Redimensionner les images pour qu'elles aient une hauteur de 1200 pixels.
4) Créer un autre dossier et transférer dans ce dossier les images qui ferait plus d'une certaine largeur ou si c'est possible réaliser l'étape 5 sans passer par cette étape.
5) Traiter ses images pour les diviser en deux partie égale en conservant le nom d'origine plus 1 ou 2 à la fin de chacun des fichiers.
6) Transférer ces nouvelles image dans le dossier d'origine.
7) Convertir en PDF vers un nouveau dossier.
8) Supprimez le dossier.
9) Passer au pdf suivant.

Chacune de ces étapes séparément je sais les faire. Mise à part peut-être l'étape 4 que je ne vois pas du tout comment faire et l'étape 5 où j'ai un peu de mal actuellement avec le nom du fichier final. Par contre je sais pas du tout comment réaliser ça à partir d'un script

Dernière modification par hibiki.tokay (Le 24/04/2019, à 06:50)


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#19 Le 25/04/2019, à 17:17

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

pourriez vous me donnée une piste car la je galère, je ne comprend pas comment transcrire mes commandes vers un script...


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#20 Le 25/04/2019, à 17:46

cqfd93

Re : Extraction des images d'un lot de pdf.

Bonjour,

Je te donne un début, tu vas devoir l'étoffer.

Si ton gestionnaire de fichiers est Nautilus, commence par vérifier que tu as bien un dossier de scripts ~/.config/nautilus/scripts (s'il n'existe pas, crée-le). Pour caja, remplace nautilus par caja…

Dans ce dossier, crée un fichier texte que tu nommes script.sh et rends-le exécutable. Ensuite, ouvre-le dans ton éditeur de texte et colle ce code puis enregistre (ne ferme pas l'éditeur pour pouvoir faire des modifications ultérieures) :

#!/bin/bash

while [ $# -gt 0 ]; do

  fichier=$1
  dossier=`echo "$fichier" | sed 's/\.\w*$//'`
  mkdir $dossier

  shift
done

Dans ton gestionnaire de fichiers, sélectionne une petite poignée de tes pdf, clique droit et choisis Scripts puis script.sh, ça devrait te créer un dossier pour chacun des pdf sélectionnés (et uniquement ceux-là.

Explication - Ce script prend en boucle chacun des fichiers de la sélection
- place son nom dans la variable fichier
- affecte à la variable dossier le nom auquel il enlève le point et l'extension
- crée le dossier

On pourrait évidemment placer le script dans le dossier qui contient les pdf et le lancer dans un terminal avec :

./script.sh fichier1.pdf fichier2.pdf

mais c'est inenvisageable dans ton cas vu le nombre de fichiers à traiter.


cqfd93

En ligne

#21 Le 25/04/2019, à 17:59

cqfd93

Re : Extraction des images d'un lot de pdf.

Une fois que tu auras réussi l'étape du message 20, tu pourras ajouter ce qu'il faut au script pour lui faire extraire le fichier dans le dossier et bien sûr tester avec une toute petite sélection (entre 2 essais du script, il faut bien supprimer ce qu'il a créé)


cqfd93

En ligne

#22 Le 25/04/2019, à 18:10

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

Merci, pour te dire même ça je ne voyais pas comment faire.
J'utilise nemo (surtout a cause de la possibilité d'avoir 2 panneau), donc je suppose que c'est pareil.
Je vais tester.


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#23 Le 25/04/2019, à 18:16

cqfd93

Re : Extraction des images d'un lot de pdf.

C'est exactement pareil avec nemo (remplace nautilus par nemo).


cqfd93

En ligne

#24 Le 25/04/2019, à 18:20

hibiki.tokay

Re : Extraction des images d'un lot de pdf.

merci, comme j'ai des espace dans les noms de dossier ça ma crée plein de dossier. soit je déplace tous les fichiers dans un dossier sans espace soit serait il possible de le faire avec des espace?


Cooler Master MasterBox Q300L, ASRock B550M Steel Legend, AMD Ryzen 5 5600 , GTX 1050 Ti WINDFORCE, DDR4 32go (Ub22.10)
Portable Lenovo Ideapad Gaming 3 15IHU6 ram32Go, Mvne 2To + 4To + SSD 8To (Ub22.10)
Syno DS1819+ 8x6To (SHR2) et Syno DS1512+ 5x8To (SHR1)

Hors ligne

#25 Le 25/04/2019, à 18:34

cqfd93

Re : Extraction des images d'un lot de pdf.

Ah oui, alors ajoute ces deux lignes juste au-dessus du while :

# Gestion des noms de fichier avec espaces
IFS=$'\n'

cqfd93

En ligne