[résolu] CMU Sphinx reconnaissance vocale

bernie_liege · Le 19/07/2012, à 15:17

Eventuellement, pour ceux qui sont toujours interéssées par sphinx, il y a un excellent tuto pour utiliser cette librairie avec java (via eclipse).

http://code.google.com/p/voicecmdr/wiki … ognitionFR

markos_le_malos · Le 26/07/2012, à 00:49

plop merci

on se penche dessus et on teste (même si j'ai pas tout compris aussi)

temps · Le 14/03/2013, à 22:39

Bonjour,
Pour ceux qui sont intéressés, j'avance toujours sur mon projet audio pour le synthétiseur vocal je viens de mettre en ligne un convertisseur de fichier texte en fichier audio des principaux API phonétique. J'ai utilisé des fichiers texte qui est beaucoup plus lourd qu'un fichier binaire pour que chacun puisse ajusté sa phonétique, mais avec un peu d'observation on s’aperçoit que ma modélisation en fichier texte pèse toujours beaucoup plus léger que les fichiers audio et a une bien meilleur qualité. C'est en ligne et c'est ici
Autrement pour le reste du projet, j'ai 5 formes d'écriture du format audio "jo" selon l'utilisation en exemple 2 octets par front pour la téléphonie, et ce week-end je présente un proto de carte audio que j'ai réalisé avec une équipe de tux.
Cordialement

Dernière modification par temps (Le 14/03/2013, à 23:37)

temps · Le 04/05/2013, à 10:37

Bonjour,
Bien que l'idée est germée en 2009, que j'ai commencé à en parlé sur le forum en 2010, finalement j'ai pu la réaliser même si j'ai du tout reprendre au début (presque car sox fait le lien entre la ligne de commande et les cartes audio du moment).

Je poste sur ce fil pour dire que l'idée se concrétise et que j'ai mis en ligne une première version de synthétiseur vocal libre que sous linux.
Je viens tout juste d'écrire ce matin la notice d'utilisation en ajoutant le son "ch".

En controlant j'ai pu m’apercevoir qu'il est apparu un parasite à chaque début de lettre qui n'existait pas au début, je pense qu'il apparaît quand je concatene le fichier tampon, mais les sons restent audibles et maintenant que je l'ai vu je trouverai la cause et la corrigerai.

Tout retour d'information ou participation à la création ou amélioration des sons de base est la bienvenue (voix grave, aigue, enfantine, accent belge, régional ou canadien... toutes les richesses de notre langue

Je poste le message qui a ouvert le fil en résolu, puisque j'ai la solution

Dernière modification par temps (Le 04/05/2013, à 10:41)

markos_le_malos · Le 04/05/2013, à 14:22

arf... je vais aller voir le résultat.

je ne sais pas encore comment ni si ça fonctionne (du moins ici) n'empêche qu'on peut dire que temps est du genre coriace et tétu

j'y go de suite sur tes liens, et en attendant, quand même bravo et merci pour tout ce taf.

allez on teste

temps · Le 04/05/2013, à 16:44

Bonjour,
J'ai corrigé le code car le compteur qui filtre l'entete des fichier ne marche pas et cela produit 6 ondes de trops.
En d'autres mots, j'ai refais la bibliothèque sans entete en plus cela va diviser le code par 2.
Mais je ne peux pas encore le faire car la création des fichiers audio dans la zone tampon est beaucoup trop rapide, sox n'arrive pas à lire le fichier audio qu'un autre commence déja à se créer. Ja vais regardé comment récupéré dans sox que le fichier a fini d'être lu pour envoyer l'écriture du suivant en atendant je vais réduire la vitesse de lecture dans le main de l'application

Astuce, j'ai accordé par hasard en jouant des sons à la place d'une lettre, ça donne un effet pas mal comme une programmation de piano. Mais pour l'instant, j'ai pas le temps d'explorer cette voie.

Cordialement

Dernière modification par temps (Le 04/05/2013, à 19:41)

Apsylus · Le 16/06/2015, à 23:27

Bonjour à tous ! J'espère que ce post n'arrive pas trop tard :

J'ai réalisé une vidéo sur Sphinx, si ça peut aider

https://www.youtube.com/watch?v=LIDEam25vxM

Dernière modification par Apsylus (Le 17/06/2015, à 09:56)

fanfantasy7 · Le 16/06/2015, à 23:38

"cette vidéo n'est pas disponible"

Apsylus · Le 17/06/2015, à 09:56

Edit

Benoitfra · Le 25/06/2015, à 16:45

Hello je suis en train de developper Voxgenerator un package python pour creer et deployer des plugins utilisant la reconnaissance vocale. Je fournis un pipeline qui publie les transcriptions via dbus. Les resultats sont alors traites par les plugins qui declenchent des commandes. Pour plus d infos rechercher VOXGenerator sur github.

Ubuntu-fr

Navigation

Liens de recherche

Annonce

#26 Le 19/07/2012, à 15:17

Re : [résolu] CMU Sphinx reconnaissance vocale

#27 Le 26/07/2012, à 00:49

Re : [résolu] CMU Sphinx reconnaissance vocale

#28 Le 14/03/2013, à 22:39

Re : [résolu] CMU Sphinx reconnaissance vocale

#29 Le 04/05/2013, à 10:37

Re : [résolu] CMU Sphinx reconnaissance vocale

#30 Le 04/05/2013, à 14:22

Re : [résolu] CMU Sphinx reconnaissance vocale

#31 Le 04/05/2013, à 16:44

Re : [résolu] CMU Sphinx reconnaissance vocale

#32 Le 16/06/2015, à 23:27

Re : [résolu] CMU Sphinx reconnaissance vocale

#33 Le 16/06/2015, à 23:38

Re : [résolu] CMU Sphinx reconnaissance vocale

#34 Le 17/06/2015, à 09:56

Re : [résolu] CMU Sphinx reconnaissance vocale

#35 Le 25/06/2015, à 16:45

Re : [résolu] CMU Sphinx reconnaissance vocale

Pied de page des forums