Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 17/02/2013, à 16:50

roger64

Outil d'aide à la correction orthographique.

Bonjour

Il s'agit de la mise au point d'un outil d'aide à la correction orthographique. Il est inspiré d'une macro qui existe sous Windows et est fondé sur  un principe différent de celui utilisé pour minimax. Le but est de détecter, par force brute, des mots fautifs qui ont échappé au correcteur orthographique hunspell (voir exemples plus bas)

Au départ nous avons deux fichiers:
- un fichier texte normal (roman par exemple)
- une liste de noms (environ 600). Ce sont les mots qui provoquent fréquemment des confusions (genre : auge/ange, mais,maïs)

Vous trouverez deux fichiers tests ici:
http://dl.dropbox.com/u/31141350/Force.zip

- "Les petits béguins" en version odt et txt (appelé plus loin le Texte)
- Liste des mots (dans un ordre alphabétique approximatif)
J'ai ajouté le script minimax v2 qui permet de calculer des occurrences au cas où. Il permet aussi de générer le fichier txt à partir de l'odt.

Je souhaiterais pouvoir faire deux choses:

1. Vérifier (améliorer, mettre au point) la validité de la liste des mots en comptant le nombre d'occurrences de chaque mot de la Liste que l'on trouve dans le Texte. Le classement final serait fait par nombre d'occurrences (et non par ordre alphabétique). La raison est que, dans le cas de paires asymétriques ("mais" avec beaucoup d'occurrences, "maïs" avec très peu, il est possible que je ne retienne que le second, encore faut-il se baser sur quelque chose d'objectif.

2. Non seulement sélectionner mais marquer de façon durable (gras, surlignage, etc.) dans le Texte chacune des occurrences des mots de la Liste - ceux qui sont présents dans le texte, bien sûr . Le contrôle de l'orthographe s'effectue ensuite sur le Texte avec un affichage par groupes de trois pages et en se concentrant sur les mots marqués.

Je lancerais cela bien sûr sous forme de deux scripts.

Dernière modification par roger64 (Le 17/02/2013, à 17:06)

Hors ligne

#2 Le 18/02/2013, à 09:52

roger64

Re : Outil d'aide à la correction orthographique.

Bonjour

Il semble que mon intitulé provoque quelques difficultés. sad

1. La première question devrait pouvoir se résoudre par un problème de comparaison de liste à liste.
Le script minimax v2 joint est capable de produire le fichier ....2txt qui est une liste comprenant le classement par nombre décroissant d'occurrences de tous les mots d'un fichier txt. Il s'agirait d'extraire les mots de la Liste qui se trouvent dans le fichier ...2txt.
Cette formulation a l'air plus classique?

2. En ce qui concerne la deuxième question, s'il était possible de m'aiguiller sur  la façon de résoudre le problème?

Dernière modification par roger64 (Le 18/02/2013, à 09:54)

Hors ligne