Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 30/05/2011, à 06:28

yano1966

OCR pour Ebooks epub

Bonjour à tous,

J'aimerais vos avis sur la question :

Je convertis certains de mes livres papiers en format epub pour les avoir avec moi dans ma liseuse électronique.

Pour l'instant je travaille sous Win7 et je voudrais savoir si je peux faire pareil sous Ubuntu.
Voici comment je procède (sous Win7) :

1- Numérisation à la volée de toutes les pages du bouquin + OCR ; le tout effectué avec avec FineReader Pro 10 ; une fois fait, je clique sur "envoyer" et ça m'envoie le document en rtf dans un document OpenOffice où j'utilise quelques macros de mise en page. Pour finir, gestion bibliothèque, conversion et transfert vers liseuse avec le logiciel Calibre...

2-Pour pouvoir avoir accès à ma biblio en déplacement, j'utilise Dropbox et le programme Calibre2OPDS.
(Voici ce que ça donne : Bibliothèque en ligne )

Donc, pour l'instant, j'ai Installé Calibre et Dropbox sous Ubuntu.

Existe-t-il un OCR qui numérise "à la volée" + reconnaissance + transfert vers OpenOffice ?

Merci à vous.


Tour custom - Gigabyte P55-USB3 - Intel i7-870 - RAM 16Go DDR3 1333Mhz - MSI GeForce GT 710 - DD: 500Go - Linux Mint 20 Cinnamon.
Tour custom - ASRock H310CM-HDV - Intel i3-9100F - RAM 16Go DDR4 2400Mhz - MSI GeForce GTX 1650 - SSD: 240Go - DD: 2To - Manjaro 20 KDE.
FreeBox V5 en ADSL2+ @ 15000 kbps ( 1,8 Mo/s )

Hors ligne

#2 Le 30/05/2011, à 07:05

serged

Re : OCR pour Ebooks epub

Un petit tour sur la doc, et tu pourras utiliser Xsane (l'interface de scan) pour générer tes textes. Je conseille d'utiliser Cuneiform comme moteur d'OCR.

Sinon, tu peux utiliser ton FineReader dans Wine...
PS: Fait attention de bien renseigner le champs "auteur" dans tes fichier EPUB...

Dernière modification par serged (Le 30/05/2011, à 07:11)


LinuxMint Vera Cinnamon et d'autres machines en MATE, XFCE... 20.x , 21.x ou 19.x
Tour : Asus F2A55 / AMD A8-5600K APU 3,6GHz / RAM 16Go / Nvidia GeForce GT610 / LM21.1 Cinnamon
Portable : LDLC Mercure MH : Celeron N3450 /RAM 4Go / Intel HD graphics 500 i915 / biboot Win 10 (sur SSD) - LM21.1 MATE (sur HDD)

Hors ligne

#3 Le 30/05/2011, à 07:35

compte supprimé

Re : OCR pour Ebooks epub

Regarde du côté de OCRfeeder, ça t'ocrise en .odt et tu peux ouvrir OOO/LibO directement en cliquant sur une icone dans ORfeeder.
Tu peux d'ailleurs directement enregistrer en epub avec OOO/LibO : suffit d'installer l'extension writer2epub.

Dernière modification par monsieurweller (Le 30/05/2011, à 07:45)

#4 Le 30/05/2011, à 11:09

yano1966

Re : OCR pour Ebooks epub

Merci à tous deux pour les infos, je vais creuser tout ça.

@Serged: Je n'utilise pas Wine car je n'aime pas le principe.


Tour custom - Gigabyte P55-USB3 - Intel i7-870 - RAM 16Go DDR3 1333Mhz - MSI GeForce GT 710 - DD: 500Go - Linux Mint 20 Cinnamon.
Tour custom - ASRock H310CM-HDV - Intel i3-9100F - RAM 16Go DDR4 2400Mhz - MSI GeForce GTX 1650 - SSD: 240Go - DD: 2To - Manjaro 20 KDE.
FreeBox V5 en ADSL2+ @ 15000 kbps ( 1,8 Mo/s )

Hors ligne

#5 Le 30/05/2011, à 17:24

serged

Re : OCR pour Ebooks epub

monsieurweller a écrit :

Regarde du côté de OCRfeeder, ça t'ocrise en .odt et tu peux ouvrir OOO/LibO directement en cliquant sur une icone dans ORfeeder.
Tu peux d'ailleurs directement enregistrer en epub avec OOO/LibO : suffit d'installer l'extension writer2epub.

Ça semble bien OCRFeeder, mais j'ai pas trouvé comment scanner directement. Il semble qu'il faille d'abord scanner les images, puis de les traiter.


LinuxMint Vera Cinnamon et d'autres machines en MATE, XFCE... 20.x , 21.x ou 19.x
Tour : Asus F2A55 / AMD A8-5600K APU 3,6GHz / RAM 16Go / Nvidia GeForce GT610 / LM21.1 Cinnamon
Portable : LDLC Mercure MH : Celeron N3450 /RAM 4Go / Intel HD graphics 500 i915 / biboot Win 10 (sur SSD) - LM21.1 MATE (sur HDD)

Hors ligne

#6 Le 30/05/2011, à 18:44

oswald-p

Re : OCR pour Ebooks epub

sinon il y a gscan2pdf, qui permet de scanner plusieurs pages et de transformer tout ça en pdf. il y a même la reconnaissance d'écriture via "tesserac" qui est installé par défaut avec gscan2pdf. Lors de l'installation, bien vérifier d'installer le paquet "fr" pour tesserac (c'est la version us par défaut je crois).

O-p


Chuck Norris a terrassé Prince de Lu avec un cookie

Hors ligne

#7 Le 31/05/2011, à 08:16

compte supprimé

Re : OCR pour Ebooks epub

serged a écrit :
monsieurweller a écrit :

Regarde du côté de OCRfeeder, ça t'ocrise en .odt et tu peux ouvrir OOO/LibO directement en cliquant sur une icone dans ORfeeder.
Tu peux d'ailleurs directement enregistrer en epub avec OOO/LibO : suffit d'installer l'extension writer2epub.

Ça semble bien OCRFeeder, mais j'ai pas trouvé comment scanner directement. Il semble qu'il faille d'abord scanner les images, puis de les traiter.

Il faut faire fichier :::: > importer une image du scanner. wink
Mais il faut xsane/sane d'installé pour ça il me semble ! smile

#8 Le 31/05/2011, à 14:09

serged

Re : OCR pour Ebooks epub

monsieurweller a écrit :

Il faut faire fichier :::: > importer une image du scanner. wink
Mais il faut xsane/sane d'installé pour ça il me semble ! smile

J'ai pas ça dans le menu "File" (ni les autres...)... Pourtant xsane est installé (et fonctionne). Version 0.6.6


LinuxMint Vera Cinnamon et d'autres machines en MATE, XFCE... 20.x , 21.x ou 19.x
Tour : Asus F2A55 / AMD A8-5600K APU 3,6GHz / RAM 16Go / Nvidia GeForce GT610 / LM21.1 Cinnamon
Portable : LDLC Mercure MH : Celeron N3450 /RAM 4Go / Intel HD graphics 500 i915 / biboot Win 10 (sur SSD) - LM21.1 MATE (sur HDD)

Hors ligne

#9 Le 31/05/2011, à 15:04

compte supprimé

Re : OCR pour Ebooks epub

Ah ?
Euh moi j'ai une version compilée du dépôt git, fournie par le dépôt ppa de nutznboltz, qui a viré le paquet depuis on dirait !?!?!?!?!
https://launchpad.net/~nutznboltz/+archive/tesseract
Ce dépôt apporte toujours tesseract3, dont il est plus qu'intéressant de l'installer.
Quand à OCRfeeder, faut le compiler du coup.
Pour récupérer le code :

git clone git://git.gnome.org/ocrfeeder

Ou alors, backporter les paquets de debian experimental (OCRfeeder 0.7.3.1 visiblement).

#10 Le 31/05/2011, à 15:08

roger64

Re : OCR pour Ebooks epub

Bonjour

Tu trouveras quelques informations sur ma signature. La version 2 de l'EPUB en pantoufles paraitra sans doute en juin.

En gros, je conseille LibreOffice ou OpenOffice.org plutôt que Word.
En OCR, je n'ai pas trouvé mieux que FineReader.

Hors ligne

#11 Le 31/05/2011, à 15:13

compte supprimé

Re : OCR pour Ebooks epub

Pour OCRfeeder, j'ai trouvé un paquet pour Maverick :
https://launchpad.net/~ferramroberto/+a … pa_all.deb

#12 Le 24/06/2012, à 05:44

roger64

Re : OCR pour Ebooks epub

roger64 a écrit :

Bonjour

Tu trouveras quelques informations sur ma signature. La version 2 de l'EPUB en pantoufles paraitra sans doute en juin.

En gros, je conseille LibreOffice ou OpenOffice.org plutôt que Word.
En OCR, je n'ai pas trouvé mieux que FineReader.

Mais maintenant, vous pouvez utiliser OCRcorrector avec Cuneiform. J'ai fait l'essai avec un livre au format PDF images et ça fonctionne en utilisant le traitement par lot.Pour des explications détailées:

http://forum.ubuntu-fr.org/viewtopic.php?id=955291

Hors ligne