Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 03/04/2012, à 14:39

choco

[Résolu] Extraction de la première page de pdf en image jpg

Bonjour à tous,

J'aimerai connaître le moyen par une ligne de commande d'extraire 4677 premières pages de document pdf sous forme de jpg avec une résolution de 600x800.

Au vue de la quantité de document j'aurai aimé une commande récursive ou un script bash. Ce qui me manque c'est le nom du programme qui pourrait faire ça l'utilisation de ses options.

Mon objectif est de faire un carrousel en javascript/PHP qui afficherait les images de la bibliothèque sans générer des miniatures à la volé des pdf (trop gourmand en ressource pour mon serveur).

Dernière modification par choco (Le 03/04/2012, à 18:24)


geek 1.0 cherche geekette 1.0 pour une merge en dualgeek2.0, optimisation du code source envisageable pour une meilleure cohabitation.

Hors ligne

#2 Le 03/04/2012, à 15:04

dubis22

Re : [Résolu] Extraction de la première page de pdf en image jpg

Salut,

Avec cette doc : http://doc.ubuntu-fr.org/pdfsam?redirect=1
Tu devrais extraire les 4677  premières pages de ton  document pdf dans un nouveau fichier  puis  utilise imagemagick: http://www.imagemagick.org/script/convert.php

sudo apt-get install imagemagick

Pensez à passer vos sujets en [Résolu] lorsque ceux-ci le sont.

Hors ligne

#3 Le 03/04/2012, à 15:34

choco

Re : [Résolu] Extraction de la première page de pdf en image jpg

Je teste ça... merci ^^

[edit]
Oui bah non pdfsam c'est pas ce qu'il me faut, il me faut impérativement un logiciel en ligne de commande il faudrait que j'automatise la tâche par des scripts à chaque nouveaux documents qui entre dans la base.

imagemagick j'ai déjà explorer cette piste mais j'ai pas trouver dans le man le moyen de réaliser mon objectif.
[/edit]

Dernière modification par choco (Le 03/04/2012, à 15:42)


geek 1.0 cherche geekette 1.0 pour une merge en dualgeek2.0, optimisation du code source envisageable pour une meilleure cohabitation.

Hors ligne

#4 Le 03/04/2012, à 16:31

Postmortem

Re : [Résolu] Extraction de la première page de pdf en image jpg

Salut,
Avec convert qui vient d'imagemagick :

convert  "*.pdf[0]" resultat.jpg

Pour la taille, il faut jouer avec les options -size ou -resize (je ne peux tester à cet instant)
Edit : ça va te générer des fichiers rsultat-1.jpg, resultat-2.jpg....

Dernière modification par Postmortem (Le 03/04/2012, à 16:33)


Mot' a dit : « Un Hellfest sans Slayer, c'est comme une galette-saucisse sans saucisse ! »

Hors ligne

#5 Le 03/04/2012, à 16:57

AnsuzPeorth

Re : [Résolu] Extraction de la première page de pdf en image jpg

Bjr,
Tu n'as pas du chercher longtemps pour imagemagick ...
Premier lien google ... LIEN

SInon, tu peux faire une boucle (je sais pas si convert peut reprendre le nom de la source ? Et pas envie de chercher smile)

for fichier in *.pdf
  do
    convert "${fichier}"[0] -resize 800x600 "${fichier%.*}".jpg
  done

Tu peux aussi ajouté l'option suivante pour une meilleur qualité !

 -density 288

(ou 144)


Interface graphique pour bash, python ou autre: glade2script
Support Tchat: http://chat.jabberfr.org/muckl_int/inde … ade2script  (Hors ligne)

Hors ligne

#6 Le 03/04/2012, à 17:18

choco

Re : [Résolu] Extraction de la première page de pdf en image jpg

AnsuzPeorth a écrit :

Bjr,
Tu n'as pas du chercher longtemps pour imagemagick ...
Premier lien google ... LIEN

Euh si si mais sur des sites en français, pas en anglais... mon anglais laisse un peu à désirer.

AnsuzPeorth a écrit :

SInon, tu peux faire une boucle (je sais pas si convert peut reprendre le nom de la source ? Et pas envie de chercher smile)

for fichier in *.pdf
  do
    convert "${fichier}"[0] -resize 800x600 "${fichier%.*}".jpg
  done

Tu peux aussi ajouté l'option suivante pour une meilleur qualité !

 -density 288

(ou 144)

C'est à peu de chose près ce que je veux faire. Mais le souci c'est que j'ai un message d'erreur systématique avec convert

choco@choco:~/Bureau$ convert -resize 600x800 "test.pdf[0]" test.jpg
convert: unable to open image `test.pdf': /usr/lib/ImageMagick-6.6.0/modules-Q16/coders/pdf.la @ error/blob.c/OpenBlob/2489.
convert: unable to open image `test.pdf':  @ error/blob.c/OpenBlob/2489.
convert: missing an image filename `test.jpg' @ error/convert.c/ConvertImageCommand/2940.

C'est pour ça que je tourne en rond...
Je me demande si cela viens pas de mon installation? --> Debian Squeeze

Dernière modification par choco (Le 03/04/2012, à 17:19)


geek 1.0 cherche geekette 1.0 pour une merge en dualgeek2.0, optimisation du code source envisageable pour une meilleure cohabitation.

Hors ligne

#7 Le 03/04/2012, à 17:40

Postmortem

Re : [Résolu] Extraction de la première page de pdf en image jpg

Euh... Question bête... Es tu sûr d'avoir un fichier test.pdf dans ton dossier ~/Bureau ?? Car apparemment, convert ne le trouve pas.

Edit : ou alors cela serait un pdf "exotique" que imagemagick ne saurait pas lire ?...


Re-edit : si tous tes fichiers pdf sont dans le même répertoire :

cd rep_orig
mkdir rep_resultat
convert -density 200 "*.pdf[0]" -set filename:nom_fic %t -resize 800x600 rep_resultat/"%[filename:nom_fic].jpg"

Ça te générera des fichiers jpg ayant le même nom que le pdf dans un sous répertoire rep_resultat

Dernière modification par Postmortem (Le 03/04/2012, à 18:18)


Mot' a dit : « Un Hellfest sans Slayer, c'est comme une galette-saucisse sans saucisse ! »

Hors ligne

#8 Le 03/04/2012, à 18:23

choco

Re : [Résolu] Extraction de la première page de pdf en image jpg

Bah c'est pas si bête figures toi...

C'est juste que sur debian contrairement à Ubuntu le Bureau se nomme Desktop et vu que j'ai importé mon ancien /home ubuntu sur mon /home debian les 2 répertoires coexistaientt d'où mon message d'erreur test.pdf n'était pas au bon endroit.

C'est ça de faire des infidélités à ubuntu... Merci de vous être cassez la tête sur mon souci qui n'était en fait qu'une étourderie de ma part. Donc hop résolu. ^^

Dernière modification par choco (Le 03/04/2012, à 18:24)


geek 1.0 cherche geekette 1.0 pour une merge en dualgeek2.0, optimisation du code source envisageable pour une meilleure cohabitation.

Hors ligne

#9 Le 03/04/2012, à 18:25

Postmortem

Re : [Résolu] Extraction de la première page de pdf en image jpg

choco a écrit :

Bah c'est pas si bête figures toi...

Je crois qu'il faut que tu lâches l'ordi pour aujourd'hui, tu risques de faire des conneries ! big_smile


Mot' a dit : « Un Hellfest sans Slayer, c'est comme une galette-saucisse sans saucisse ! »

Hors ligne

#10 Le 03/04/2012, à 18:32

choco

Re : [Résolu] Extraction de la première page de pdf en image jpg

Oui je crois aussi

Mais j'ai pas tous perdu je crois que je vais me servir de la ligne de ton dernier poste, ça m'a donné une idée. Je vais stocker mes images obtenue dans un répertoire séparer ./imagecache.

Je note ça sur mon petit carnet et je reprendrai ça demain à tête reposer.

Bonne soirée ^^;


geek 1.0 cherche geekette 1.0 pour une merge en dualgeek2.0, optimisation du code source envisageable pour une meilleure cohabitation.

Hors ligne

#11 Le 03/04/2012, à 18:32

serged

Re : [Résolu] Extraction de la première page de pdf en image jpg

choco a écrit :

Bah c'est pas si bête figures toi...

C'est juste que sur debian contrairement à Ubuntu le Bureau se nomme Desktop et vu que j'ai importé mon ancien /home ubuntu sur mon /home debian les 2 répertoires coexistaientt d'où mon message d'erreur test.pdf n'était pas au bon endroit.

C'est ça de faire des infidélités à ubuntu... Merci de vous être cassez la tête sur mon souci qui n'était en fait qu'une étourderie de ma part. Donc hop résolu. ^^

Systématiquement, dans mes profil je fais un :

ln -s ~/Bureau ~/Desktop

(ou le contraire sous Debian)
Il y a quelques applis qui cherchent "Desktop" en dur.


LinuxMint Vera Cinnamon et d'autres machines en MATE, XFCE... 20.x , 21.x ou 19.x
Tour : Asus F2A55 / AMD A8-5600K APU 3,6GHz / RAM 16Go / Nvidia GeForce GT610 / LM21.1 Cinnamon
Portable : LDLC Mercure MH : Celeron N3450 /RAM 4Go / Intel HD graphics 500 i915 / biboot Win 10 (sur SSD) - LM21.1 MATE (sur HDD)

Hors ligne

#12 Le 03/04/2012, à 18:37

choco

Re : [Résolu] Extraction de la première page de pdf en image jpg

Ouep c'est ce je vais faire, mais je ne pense pas que je me referai prendre, une tite humiliation ça marque big_smile

Dernière modification par choco (Le 03/04/2012, à 18:37)


geek 1.0 cherche geekette 1.0 pour une merge en dualgeek2.0, optimisation du code source envisageable pour une meilleure cohabitation.

Hors ligne