Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 27/01/2007, à 09:18

MitraSun

Passer un pdf à l'ocr...

Bonjour à tous.

Sur une imprimante Xerox de mon boulot j'ai numérisé une imposante documentation, cours d'administration AIX, et ai obtenu un gros fichier pdf. Je souhaite maintenant faire de la reconnaissance de caractères pour y ajouter mes notes mais ne sais comment faire.

gocr, par exemple, ne lit que des pam, ppm, pgm, pbm.

Connaissez-vous un logiciel faisant de la roc sur du pdf (un collègue en utilise un sous W...) ?
Ou un autre convertissant le pdf en format reconnu par gocr ?

Dans l'attente de vous lire.

J'ajoute une idée qui me vient.
Comment ajouter une zone de texte à un fichier pdf ? De façon automatique bien sûr.

Dernière modification par MitraSun (Le 27/01/2007, à 16:02)

Hors ligne

#2 Le 27/01/2007, à 11:43

ch0c0bn

Re : Passer un pdf à l'ocr...

Je veux pas te décourager mais j'ai lu quelque part (désolé là, je me rappelle plus de la source) que l'OCR était vraiment le domaine à la traine sur les système linux. Alors même si tu converti ton pdf tu risque d'être déçu du résultat (pas de reconnaissance des accents notamment, vu que les softs sont développées aux US)

Ceci dit, je ne demande qu'à être contredit.

Hors ligne

#3 Le 27/01/2007, à 12:02

Math

Re : Passer un pdf à l'ocr...

et ton pdf, tu peux pas faire "select all" puis "copier-coller" ??

Hors ligne

#4 Le 27/01/2007, à 15:55

MitraSun

Re : Passer un pdf à l'ocr...

et ton pdf, tu peux pas faire "select all" puis "copier-coller" ??

sur 700 pages de texte et dessins ?

Hors ligne

#5 Le 27/01/2007, à 16:42

trashie

Re : Passer un pdf à l'ocr...

Salut,

Je vois que les sujets à propos des PDF sont nombreux en ce moment, et c'est normal vu l'étendu de ce format (et ses qualités !).

2 chose donc pour te répondre :
* il y a effectivement un membre du planet qui a "testé" les logiciels de reconnaissance de caractère sous Linux... en concluant que pour l'instant autant les oublier (je pense que c'était le fond de sa pensée). Donc va faire un tour sur planet pour voir son post.
* si tu veux uniquement ajouter des notes, va voir le post suivant http://forum.ubuntu-fr.org/viewtopic.php?id=39985

@+, en espérant que ça t'éclaire un peu

Mathieu


"Que d'hommes se pressent vers la lumière non pas pour voir mieux, mais pour mieux briller." [Friedrich Nietzsche]

Hors ligne

#6 Le 28/01/2007, à 03:01

MitraSun

Re : Passer un pdf à l'ocr...

Oui, je désire seulement ajouter mes notes de cours et ai essayé d'installer PDFedit. Mais la compilation ne passe pas...

root@mitra:/home/rt/tmp/pdfedit-0.2.3# ./configure
checking for g++... no
checking for c++... no
checking for gpp... no
checking for aCC... no
checking for CC... no
checking for cxx... no
checking for cc++... no
checking for cl.exe... no
checking for FCC... no
checking for KCC... no
checking for RCC... no
checking for xlC_r... no
checking for xlC... no
checking for C++ compiler default output file name... configure: error: C++ compiler cannot create executables
See `config.log' for more details.
root@mitra:/home/rt/tmp/pdfedit-0.2.3#

... même après avoir ajouté kdebase-dev, libqt3-mt-dev

Mais quelle distribution est utilisée ? D'où sortent les commandes /usr/bin/uname -p ; /bin/uname -X /usr/bin/arch -k ; /usr/convex/getsysinfo ; /usr/bin/hostinfo ; /bin/machine ; /usr/bin/oslevel ; /bin/universe dont il est question dans le config.log ?

Dernière modification par MitraSun (Le 28/01/2007, à 03:26)

Hors ligne

#7 Le 28/01/2007, à 03:13

Link31

Re : Passer un pdf à l'ocr...

Kword peut importer des PDF et les enregistrer en ODT, en conservant plus ou moins la mise en page. Même 700 pages devraient passer.

Hors ligne

#8 Le 28/01/2007, à 04:07

MitraSun

Re : Passer un pdf à l'ocr...

KWord importe les pdf, ce que ne fait pas OOo. Mais il perd énormément de mise en page ce qui le rend inutilisable pour mon document.
Merci du tuyau, @++

Dernière modification par MitraSun (Le 28/01/2007, à 04:08)

Hors ligne

#9 Le 29/01/2007, à 00:55

trashie

Re : Passer un pdf à l'ocr...

Salut,

MitraSun, as-tu installé les packages libboost-* ? Ils sont nécessaire. Et installe aussi le pacquet "build-essential" qui sert à compiler.
Sinon, est-ce que tu peux nous donner ton fichier d'erreur de compilation (le 'config.log') ?

Enfin, les commandes que tu cites sont des commandes de bases linux (uname...).
Si avec tout ça tu n'arrives pas à compiler, je veux bien te donner mes exécutables (si tu es sur un 386, de préférence centrino), mais j'ai peur qu'en compilant il mette des librairies partout sur le PC...


@+

Mathieu


"Que d'hommes se pressent vers la lumière non pas pour voir mieux, mais pour mieux briller." [Friedrich Nietzsche]

Hors ligne