Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 28/02/2024, à 11:02

Isaric

Je regarde poppler-utils comment convertir un pdf en Texte ?

Bonjour,

Je regarde poppler-utils, mais on le trouve plus dans la logitech ?
Y-a t-il maintenant un équivalent graphique qui permettrai de convertir un pdf en Texte  ?

J'ai testé :
"IMAGE to TEXT " perd certains accents ou se trompe disponible dans " Logiciel " (https://warlordsoftwares.com/trending-a … echnology/)
" LIBREOFFICE WRITER " ouvre " LIBREOFFICE DRAW " chaque ligne est un cadre avec le texte mais l'écriture des accents semble conforme.
Il ne reconnaît pas le texte en globalité en faisant une sélection à la corde et ensuite " Consolider le texte ".

Modération : vous ne trouverez pas la réponse dans un fil de 14 ans! Ne squattez pas des fils anciens, surtout de 14 ans !

Dernière modification par Ayral (Le 28/02/2024, à 23:21)


"Être bahá'í signifie simplement aimer la terre toute entière, aimer l'humanité et essayer de la servir, travailler pour la paix universelle et la famille humaine" 'Abdul'l-Bahá
"Vouloir s'ouvrir aux autres n'est pas une preuve de faiblesse, c'est une preuve d'intelligence"  Matthieu Ricard.

Hors ligne

#2 Le 28/02/2024, à 20:51

Isaric

Re : Je regarde poppler-utils comment convertir un pdf en Texte ?

Peut-être que Pandoc et disponible  https://pandoc.org/ dans un dépôt ?


"Être bahá'í signifie simplement aimer la terre toute entière, aimer l'humanité et essayer de la servir, travailler pour la paix universelle et la famille humaine" 'Abdul'l-Bahá
"Vouloir s'ouvrir aux autres n'est pas une preuve de faiblesse, c'est une preuve d'intelligence"  Matthieu Ricard.

Hors ligne

#3 Le 28/02/2024, à 22:28

moko138

Re : Je regarde poppler-utils comment convertir un pdf en Texte ?

Merci de montrer

dpkg -l | grep pdf | sort

Par ailleurs, poppler-utils est une suite de logiciels, et non un logiciel :

apt-cache show poppler-utils
 Ce paquet contient des utilitaires en ligne de commande (basé sur Poppler) pour obtenir des informations sur des documents PDF, les convertir vers d'autres formats ou les manipuler :
  * pdfdetach - liste ou extrait de fichiers intégrés (pièces jointes)
  * pdffonts - analyseur de police de caractères
  * pdfimages - extracteur d'images
  * pdfinfo - informations sur le document
  * pdfseparate - outil d'extraction de page
  * pdftocairo - convertisseur PDF vers les formats PNG/JPEG/PDF/PS/EPS/SVG à l'aide de Cairo
  * pdftohtml - convertisseur de PDF vers le format HTML
  * pdftoppm - convertisseur d'images PDF vers les formats PPM/PNG/JPEG
  * pdftops - convertisseur de PDF vers le format PostScript (PS)
  * pdftotext - extraction de texte
  * pdfunite - outil pour la fusion de documents

Pour voir s'il est installé :

dpkg -l | grep poppler

et si oui, essaie pdftotext, en lisant, bien sûr :

man pdftotext

%NOINDEX%
Un utilitaire précieux : ncdu
Photo, mini-tutoriel :  À la découverte de dcraw

Hors ligne

#4 Le 29/02/2024, à 11:03

Isaric

Re : Je regarde poppler-utils comment convertir un pdf en Texte ?

Merci moko138

:~$ dpkg -l | grep pdf | sort
ii  libqpdf29:amd64                               11.5.0-1ubuntu1                         amd64        runtime library for PDF transformation/inspection software
:~$ apt-cache show poppler-utils
Package: poppler-utils
Architecture: amd64
Version: 23.08.0-2ubuntu1
Multi-Arch: foreign
Priority: optional
Section: utils
Source: poppler
Origin: Ubuntu
Maintainer: Ubuntu Developers <ubuntu-devel-discuss@lists.ubuntu.com>
Original-Maintainer: Debian freedesktop.org maintainers <pkg-freedesktop-maintainers@lists.alioth.debian.org>
Bugs: https://bugs.launchpad.net/ubuntu/+filebug
Installed-Size: 684
Provides: pdftohtml, xpdf-utils
Depends: libpoppler130 (= 23.08.0-2ubuntu1), libc6 (>= 2.38), libcairo2 (>= 1.17.8), libfreetype6 (>= 2.2.1), liblcms2-2 (>= 2.2+git20110628), libstdc++6 (>= 13.1)
Conflicts: pdftohtml
Breaks: xpdf-utils (<< 3.02-2~)
Replaces: pdftohtml, xpdf-reader, xpdf-utils (<< 3.02-2~)
Filename: pool/main/p/poppler/poppler-utils_23.08.0-2ubuntu1_amd64.deb
Size: 200744
MD5sum: 3ca93f62ff4f47eddd1d9c49bb85439f
SHA1: 6f49ab19739665c9d7d2c494a4ea3f6755dd4be6
SHA256: 12389a159b4e87e2969e64dd84b248271fe39236f9b626df366e2f82dab71aa3
SHA512: 01e2ddc88b356bbed441e2a9cdd626a841b69da9e38492498e87565b0d3842c55c3221bba296ef7de482f3eb6a90069da75ccdc9b006053823263b2801a1d27c
Homepage: https://poppler.freedesktop.org/
Description-fr: utilitaires PDF (basés sur Poppler)
 Poppler est une bibliothèque de rendu PDF fondée sur l'afficheur PDF Xpdf.
 .
 This package contains command line utilities (based on Poppler) for getting information of PDF documents, convert them to other formats, or manipulate them:
  * pdfdetach -- lists or extracts embedded files (attachments)
  * pdffonts -- font analyzer
  * pdfimages -- image extractor
  * pdfinfo -- document information
  * pdfseparate -- page extraction tool
  * pdfsig -- verifies digital signatures
  * pdftocairo -- PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
  * pdftohtml -- PDF to HTML converter
  * pdftoppm -- PDF to PPM/PNG/JPEG image converter
  * pdftops -- PDF to PostScript (PS) converter
  * pdftotext -- text extraction
  * pdfunite -- document merging tool
Description-md5: c82ab1c01fb88c7aab560b4a6154c69f
Task: print-server, ubuntu-desktop-minimal, ubuntu-desktop, ubuntu-desktop-raspi, kubuntu-desktop, xubuntu-minimal, xubuntu-desktop, lubuntu-desktop, ubuntustudio-desktop-core, ubuntustudio-desktop, ubuntukylin-desktop, ubuntu-mate-core, ubuntu-mate-desktop, ubuntu-budgie-desktop-minimal, ubuntu-budgie-desktop, ubuntu-budgie-desktop-raspi, ubuntu-unity-desktop, ubuntucinnamon-desktop, ubuntucinnamon-desktop-raspi
:~$ dpkg -l | grep poppler
ii  libpoppler-cpp0v5:amd64                       23.08.0-2ubuntu1                        amd64        PDF rendering library (CPP shared library)
ii  libpoppler-glib8:amd64                        23.08.0-2ubuntu1                        amd64        PDF rendering library (GLib-based shared library)
ii  libpoppler130:amd64                           23.08.0-2ubuntu1                        amd64        PDF rendering library
ii  poppler-data                                  0.4.12-1                                all          encoding data for the poppler PDF rendering library
ii  poppler-utils                                 23.08.0-2ubuntu1                        amd64        PDF utilities (based on Poppler)
man pdftotext

donne :

pdftotext(1)                General Commands Manual               pdftotext(1)

NAME
       pdftotext  -  Portable Document Format (PDF) to text converter (version
       3.03)

SYNOPSIS
       pdftotext [options] PDF‐file [text‐file]

DESCRIPTION
       Pdftotext converts Portable Document Format (PDF) files to plain text.

       Pdftotext reads the PDF file, PDF‐file, and writes a text  file,  text‐
       file.   If  text‐file  is not specified, pdftotext converts file.pdf to
       file.txt.  If text‐file is ´‐’, the text is sent to  stdout.   If  PDF‐
       file is ´‐’, it reads the PDF file from stdin.

OPTIONS
       -f number
              Specifies the first page to convert.

       -l number
              Specifies the last page to convert.

"Être bahá'í signifie simplement aimer la terre toute entière, aimer l'humanité et essayer de la servir, travailler pour la paix universelle et la famille humaine" 'Abdul'l-Bahá
"Vouloir s'ouvrir aux autres n'est pas une preuve de faiblesse, c'est une preuve d'intelligence"  Matthieu Ricard.

Hors ligne