#1 Le 28/02/2024, à 12:02
- Isaric
Je regarde poppler-utils comment convertir un pdf en Texte ?
Bonjour,
Je regarde poppler-utils, mais on le trouve plus dans la logitech ?
Y-a t-il maintenant un équivalent graphique qui permettrai de convertir un pdf en Texte ?
J'ai testé :
"IMAGE to TEXT " perd certains accents ou se trompe disponible dans " Logiciel " (https://warlordsoftwares.com/trending-a … echnology/)
" LIBREOFFICE WRITER " ouvre " LIBREOFFICE DRAW " chaque ligne est un cadre avec le texte mais l'écriture des accents semble conforme.
Il ne reconnaît pas le texte en globalité en faisant une sélection à la corde et ensuite " Consolider le texte ".
Modération : vous ne trouverez pas la réponse dans un fil de 14 ans! Ne squattez pas des fils anciens, surtout de 14 ans !
Dernière modification par Ayral (Le 29/02/2024, à 00:21)
"Être bahá'í signifie simplement aimer la terre toute entière, aimer l'humanité et essayer de la servir, travailler pour la paix universelle et la famille humaine" 'Abdul'l-Bahá
"Vouloir s'ouvrir aux autres n'est pas une preuve de faiblesse, c'est une preuve d'intelligence" Matthieu Ricard.
Hors ligne
#2 Le 28/02/2024, à 21:51
- Isaric
Re : Je regarde poppler-utils comment convertir un pdf en Texte ?
Peut-être que Pandoc et disponible https://pandoc.org/ dans un dépôt ?
"Être bahá'í signifie simplement aimer la terre toute entière, aimer l'humanité et essayer de la servir, travailler pour la paix universelle et la famille humaine" 'Abdul'l-Bahá
"Vouloir s'ouvrir aux autres n'est pas une preuve de faiblesse, c'est une preuve d'intelligence" Matthieu Ricard.
Hors ligne
#3 Le 28/02/2024, à 23:28
- moko138
Re : Je regarde poppler-utils comment convertir un pdf en Texte ?
Merci de montrer
dpkg -l | grep pdf | sort
Par ailleurs, poppler-utils est une suite de logiciels, et non un logiciel :
apt-cache show poppler-utils
Ce paquet contient des utilitaires en ligne de commande (basé sur Poppler) pour obtenir des informations sur des documents PDF, les convertir vers d'autres formats ou les manipuler :
* pdfdetach - liste ou extrait de fichiers intégrés (pièces jointes)
* pdffonts - analyseur de police de caractères
* pdfimages - extracteur d'images
* pdfinfo - informations sur le document
* pdfseparate - outil d'extraction de page
* pdftocairo - convertisseur PDF vers les formats PNG/JPEG/PDF/PS/EPS/SVG à l'aide de Cairo
* pdftohtml - convertisseur de PDF vers le format HTML
* pdftoppm - convertisseur d'images PDF vers les formats PPM/PNG/JPEG
* pdftops - convertisseur de PDF vers le format PostScript (PS)
* pdftotext - extraction de texte
* pdfunite - outil pour la fusion de documents
Pour voir s'il est installé :
dpkg -l | grep poppler
et si oui, essaie pdftotext, en lisant, bien sûr :
man pdftotext
%NOINDEX%
Un utilitaire précieux : ncdu
Photo, mini-tutoriel : À la découverte de dcraw
Hors ligne
#4 Le 29/02/2024, à 12:03
- Isaric
Re : Je regarde poppler-utils comment convertir un pdf en Texte ?
Merci moko138
:~$ dpkg -l | grep pdf | sort
ii libqpdf29:amd64 11.5.0-1ubuntu1 amd64 runtime library for PDF transformation/inspection software
:~$ apt-cache show poppler-utils
Package: poppler-utils
Architecture: amd64
Version: 23.08.0-2ubuntu1
Multi-Arch: foreign
Priority: optional
Section: utils
Source: poppler
Origin: Ubuntu
Maintainer: Ubuntu Developers <ubuntu-devel-discuss@lists.ubuntu.com>
Original-Maintainer: Debian freedesktop.org maintainers <pkg-freedesktop-maintainers@lists.alioth.debian.org>
Bugs: https://bugs.launchpad.net/ubuntu/+filebug
Installed-Size: 684
Provides: pdftohtml, xpdf-utils
Depends: libpoppler130 (= 23.08.0-2ubuntu1), libc6 (>= 2.38), libcairo2 (>= 1.17.8), libfreetype6 (>= 2.2.1), liblcms2-2 (>= 2.2+git20110628), libstdc++6 (>= 13.1)
Conflicts: pdftohtml
Breaks: xpdf-utils (<< 3.02-2~)
Replaces: pdftohtml, xpdf-reader, xpdf-utils (<< 3.02-2~)
Filename: pool/main/p/poppler/poppler-utils_23.08.0-2ubuntu1_amd64.deb
Size: 200744
MD5sum: 3ca93f62ff4f47eddd1d9c49bb85439f
SHA1: 6f49ab19739665c9d7d2c494a4ea3f6755dd4be6
SHA256: 12389a159b4e87e2969e64dd84b248271fe39236f9b626df366e2f82dab71aa3
SHA512: 01e2ddc88b356bbed441e2a9cdd626a841b69da9e38492498e87565b0d3842c55c3221bba296ef7de482f3eb6a90069da75ccdc9b006053823263b2801a1d27c
Homepage: https://poppler.freedesktop.org/
Description-fr: utilitaires PDF (basés sur Poppler)
Poppler est une bibliothèque de rendu PDF fondée sur l'afficheur PDF Xpdf.
.
This package contains command line utilities (based on Poppler) for getting information of PDF documents, convert them to other formats, or manipulate them:
* pdfdetach -- lists or extracts embedded files (attachments)
* pdffonts -- font analyzer
* pdfimages -- image extractor
* pdfinfo -- document information
* pdfseparate -- page extraction tool
* pdfsig -- verifies digital signatures
* pdftocairo -- PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
* pdftohtml -- PDF to HTML converter
* pdftoppm -- PDF to PPM/PNG/JPEG image converter
* pdftops -- PDF to PostScript (PS) converter
* pdftotext -- text extraction
* pdfunite -- document merging tool
Description-md5: c82ab1c01fb88c7aab560b4a6154c69f
Task: print-server, ubuntu-desktop-minimal, ubuntu-desktop, ubuntu-desktop-raspi, kubuntu-desktop, xubuntu-minimal, xubuntu-desktop, lubuntu-desktop, ubuntustudio-desktop-core, ubuntustudio-desktop, ubuntukylin-desktop, ubuntu-mate-core, ubuntu-mate-desktop, ubuntu-budgie-desktop-minimal, ubuntu-budgie-desktop, ubuntu-budgie-desktop-raspi, ubuntu-unity-desktop, ubuntucinnamon-desktop, ubuntucinnamon-desktop-raspi
:~$ dpkg -l | grep poppler
ii libpoppler-cpp0v5:amd64 23.08.0-2ubuntu1 amd64 PDF rendering library (CPP shared library)
ii libpoppler-glib8:amd64 23.08.0-2ubuntu1 amd64 PDF rendering library (GLib-based shared library)
ii libpoppler130:amd64 23.08.0-2ubuntu1 amd64 PDF rendering library
ii poppler-data 0.4.12-1 all encoding data for the poppler PDF rendering library
ii poppler-utils 23.08.0-2ubuntu1 amd64 PDF utilities (based on Poppler)
man pdftotext
donne :
pdftotext(1) General Commands Manual pdftotext(1)
NAME
pdftotext - Portable Document Format (PDF) to text converter (version
3.03)
SYNOPSIS
pdftotext [options] PDF‐file [text‐file]
DESCRIPTION
Pdftotext converts Portable Document Format (PDF) files to plain text.
Pdftotext reads the PDF file, PDF‐file, and writes a text file, text‐
file. If text‐file is not specified, pdftotext converts file.pdf to
file.txt. If text‐file is ´‐’, the text is sent to stdout. If PDF‐
file is ´‐’, it reads the PDF file from stdin.
OPTIONS
-f number
Specifies the first page to convert.
-l number
Specifies the last page to convert.
"Être bahá'í signifie simplement aimer la terre toute entière, aimer l'humanité et essayer de la servir, travailler pour la paix universelle et la famille humaine" 'Abdul'l-Bahá
"Vouloir s'ouvrir aux autres n'est pas une preuve de faiblesse, c'est une preuve d'intelligence" Matthieu Ricard.
Hors ligne