[Résolu] Extraction de la première page de pdf en image jpg

choco · Le 03/04/2012, à 14:39

Bonjour à tous,

J'aimerai connaître le moyen par une ligne de commande d'extraire 4677 premières pages de document pdf sous forme de jpg avec une résolution de 600x800.

Au vue de la quantité de document j'aurai aimé une commande récursive ou un script bash. Ce qui me manque c'est le nom du programme qui pourrait faire ça l'utilisation de ses options.

Mon objectif est de faire un carrousel en javascript/PHP qui afficherait les images de la bibliothèque sans générer des miniatures à la volé des pdf (trop gourmand en ressource pour mon serveur).

Dernière modification par choco (Le 03/04/2012, à 18:24)

dubis22 · Le 03/04/2012, à 15:04

Salut,

Avec cette doc : http://doc.ubuntu-fr.org/pdfsam?redirect=1
Tu devrais extraire les 4677 premières pages de ton document pdf dans un nouveau fichier puis utilise imagemagick: http://www.imagemagick.org/script/convert.php

sudo apt-get install imagemagick

choco · Le 03/04/2012, à 15:34

Je teste ça... merci ^^

[edit]
Oui bah non pdfsam c'est pas ce qu'il me faut, il me faut impérativement un logiciel en ligne de commande il faudrait que j'automatise la tâche par des scripts à chaque nouveaux documents qui entre dans la base.

imagemagick j'ai déjà explorer cette piste mais j'ai pas trouver dans le man le moyen de réaliser mon objectif.
[/edit]

Dernière modification par choco (Le 03/04/2012, à 15:42)

Postmortem · Le 03/04/2012, à 16:31

Salut,
Avec convert qui vient d'imagemagick :

convert  "*.pdf[0]" resultat.jpg

Pour la taille, il faut jouer avec les options -size ou -resize (je ne peux tester à cet instant)
Edit : ça va te générer des fichiers rsultat-1.jpg, resultat-2.jpg....

Dernière modification par Postmortem (Le 03/04/2012, à 16:33)

AnsuzPeorth · Le 03/04/2012, à 16:57

Bjr,
Tu n'as pas du chercher longtemps pour imagemagick ...
Premier lien google ... LIEN

SInon, tu peux faire une boucle (je sais pas si convert peut reprendre le nom de la source ? Et pas envie de chercher )

for fichier in *.pdf
  do
    convert "${fichier}"[0] -resize 800x600 "${fichier%.*}".jpg
  done

Tu peux aussi ajouté l'option suivante pour une meilleur qualité !

 -density 288

(ou 144)

choco · Le 03/04/2012, à 17:18

AnsuzPeorth a écrit :

Bjr,
Tu n'as pas du chercher longtemps pour imagemagick ...
Premier lien google ... LIEN

Euh si si mais sur des sites en français, pas en anglais... mon anglais laisse un peu à désirer.

AnsuzPeorth a écrit :

SInon, tu peux faire une boucle (je sais pas si convert peut reprendre le nom de la source ? Et pas envie de chercher )
for fichier in *.pdf
  do
    convert "${fichier}"[0] -resize 800x600 "${fichier%.*}".jpg
  done
Tu peux aussi ajouté l'option suivante pour une meilleur qualité !
 -density 288
(ou 144)

C'est à peu de chose près ce que je veux faire. Mais le souci c'est que j'ai un message d'erreur systématique avec convert

choco@choco:~/Bureau$ convert -resize 600x800 "test.pdf[0]" test.jpg
convert: unable to open image `test.pdf': /usr/lib/ImageMagick-6.6.0/modules-Q16/coders/pdf.la @ error/blob.c/OpenBlob/2489.
convert: unable to open image `test.pdf':  @ error/blob.c/OpenBlob/2489.
convert: missing an image filename `test.jpg' @ error/convert.c/ConvertImageCommand/2940.

C'est pour ça que je tourne en rond...
Je me demande si cela viens pas de mon installation? --> Debian Squeeze

Dernière modification par choco (Le 03/04/2012, à 17:19)

Postmortem · Le 03/04/2012, à 17:40

Euh... Question bête... Es tu sûr d'avoir un fichier test.pdf dans ton dossier ~/Bureau ?? Car apparemment, convert ne le trouve pas.

Edit : ou alors cela serait un pdf "exotique" que imagemagick ne saurait pas lire ?...

Re-edit : si tous tes fichiers pdf sont dans le même répertoire :

cd rep_orig
mkdir rep_resultat
convert -density 200 "*.pdf[0]" -set filename:nom_fic %t -resize 800x600 rep_resultat/"%[filename:nom_fic].jpg"

Ça te générera des fichiers jpg ayant le même nom que le pdf dans un sous répertoire rep_resultat

Dernière modification par Postmortem (Le 03/04/2012, à 18:18)

choco · Le 03/04/2012, à 18:23

Bah c'est pas si bête figures toi...

C'est juste que sur debian contrairement à Ubuntu le Bureau se nomme Desktop et vu que j'ai importé mon ancien /home ubuntu sur mon /home debian les 2 répertoires coexistaientt d'où mon message d'erreur test.pdf n'était pas au bon endroit.

C'est ça de faire des infidélités à ubuntu... Merci de vous être cassez la tête sur mon souci qui n'était en fait qu'une étourderie de ma part. Donc hop résolu. ^^

Dernière modification par choco (Le 03/04/2012, à 18:24)

Postmortem · Le 03/04/2012, à 18:25

choco a écrit :

Bah c'est pas si bête figures toi...

Je crois qu'il faut que tu lâches l'ordi pour aujourd'hui, tu risques de faire des conneries !

choco · Le 03/04/2012, à 18:32

Oui je crois aussi

Mais j'ai pas tous perdu je crois que je vais me servir de la ligne de ton dernier poste, ça m'a donné une idée. Je vais stocker mes images obtenue dans un répertoire séparer ./imagecache.

Je note ça sur mon petit carnet et je reprendrai ça demain à tête reposer.

Bonne soirée ^^;

serged · Le 03/04/2012, à 18:32

choco a écrit :

Bah c'est pas si bête figures toi...
C'est juste que sur debian contrairement à Ubuntu le Bureau se nomme Desktop et vu que j'ai importé mon ancien /home ubuntu sur mon /home debian les 2 répertoires coexistaientt d'où mon message d'erreur test.pdf n'était pas au bon endroit.
C'est ça de faire des infidélités à ubuntu... Merci de vous être cassez la tête sur mon souci qui n'était en fait qu'une étourderie de ma part. Donc hop résolu. ^^

Systématiquement, dans mes profil je fais un :

ln -s ~/Bureau ~/Desktop

(ou le contraire sous Debian)
Il y a quelques applis qui cherchent "Desktop" en dur.

choco · Le 03/04/2012, à 18:37

Ouep c'est ce je vais faire, mais je ne pense pas que je me referai prendre, une tite humiliation ça marque

Dernière modification par choco (Le 03/04/2012, à 18:37)

Ubuntu-fr

Navigation

Liens de recherche

Annonce

#1 Le 03/04/2012, à 14:39

[Résolu] Extraction de la première page de pdf en image jpg

#2 Le 03/04/2012, à 15:04

Re : [Résolu] Extraction de la première page de pdf en image jpg

#3 Le 03/04/2012, à 15:34

Re : [Résolu] Extraction de la première page de pdf en image jpg

#4 Le 03/04/2012, à 16:31

Re : [Résolu] Extraction de la première page de pdf en image jpg

#5 Le 03/04/2012, à 16:57

Re : [Résolu] Extraction de la première page de pdf en image jpg

#6 Le 03/04/2012, à 17:18

Re : [Résolu] Extraction de la première page de pdf en image jpg

#7 Le 03/04/2012, à 17:40

Re : [Résolu] Extraction de la première page de pdf en image jpg

#8 Le 03/04/2012, à 18:23

Re : [Résolu] Extraction de la première page de pdf en image jpg

#9 Le 03/04/2012, à 18:25

Re : [Résolu] Extraction de la première page de pdf en image jpg

#10 Le 03/04/2012, à 18:32

Re : [Résolu] Extraction de la première page de pdf en image jpg

#11 Le 03/04/2012, à 18:32

Re : [Résolu] Extraction de la première page de pdf en image jpg

#12 Le 03/04/2012, à 18:37

Re : [Résolu] Extraction de la première page de pdf en image jpg

Pied de page des forums