Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#26 Le 19/07/2012, à 15:17

bernie_liege

Re : [résolu] CMU Sphinx reconnaissance vocale

Eventuellement, pour ceux qui sont toujours interéssées par sphinx, il y a un excellent tuto pour utiliser cette librairie avec java (via eclipse).

http://code.google.com/p/voicecmdr/wiki … ognitionFR


J'au un projet: devenir fou (Charles Buckowski)

Hors ligne

#27 Le 26/07/2012, à 00:49

markos_le_malos

Re : [résolu] CMU Sphinx reconnaissance vocale

plop merci

on se penche dessus et on teste (même si j'ai pas tout compris aussi)


The Ubuntu Counter Project - user number # 25857

Hors ligne

#28 Le 14/03/2013, à 22:39

temps

Re : [résolu] CMU Sphinx reconnaissance vocale

Bonjour,
Pour ceux qui sont intéressés, j'avance toujours sur mon projet audio pour le synthétiseur vocal je viens de mettre en ligne un convertisseur de fichier texte en fichier audio des  principaux API phonétique. J'ai utilisé des fichiers texte qui est beaucoup plus lourd qu'un fichier binaire pour que chacun puisse ajusté sa phonétique, mais avec un peu d'observation on s’aperçoit que ma modélisation en fichier texte pèse toujours beaucoup plus léger que les fichiers audio et a une bien meilleur qualité. C'est en ligne et c'est ici
Autrement pour le reste du projet, j'ai 5 formes d'écriture du format audio "jo" selon l'utilisation en exemple 2 octets par front pour la téléphonie, et ce week-end je présente un proto de carte audio que j'ai réalisé avec une équipe de tux.
Cordialement

Dernière modification par temps (Le 14/03/2013, à 23:37)


Parce que l'USB bootable est le support des systèmes experts,
Parce que l'USB bootable contient sa propre image au démarrage.
L'USB bootable permet de créer un monde à la dimension de son imagination
https://www.letime.net

Hors ligne

#29 Le 04/05/2013, à 10:37

temps

Re : [résolu] CMU Sphinx reconnaissance vocale

Bonjour,
Bien que l'idée est germée en 2009, que j'ai commencé à en parlé sur le forum en 2010, finalement j'ai pu la réaliser même si j'ai du tout reprendre au début (presque car sox fait le lien entre la ligne de commande et les cartes audio du moment).

Je poste sur ce fil pour dire que l'idée se concrétise et que j'ai mis en ligne une première version de synthétiseur vocal libre que sous linux.
Je viens tout juste d'écrire ce matin la notice d'utilisation en ajoutant le son "ch".

En controlant j'ai pu m’apercevoir qu'il est apparu un parasite à chaque début de lettre qui n'existait pas au début, je pense qu'il apparaît quand je concatene le fichier tampon, mais les sons restent audibles et maintenant que je l'ai vu je trouverai la cause et la corrigerai.

Tout retour d'information ou participation à la création ou amélioration des sons de base est la bienvenue (voix grave, aigue, enfantine, accent belge, régional ou canadien... toutes les richesses de notre langue

Je poste le message qui a ouvert le fil en résolu, puisque j'ai la solution

Dernière modification par temps (Le 04/05/2013, à 10:41)


Parce que l'USB bootable est le support des systèmes experts,
Parce que l'USB bootable contient sa propre image au démarrage.
L'USB bootable permet de créer un monde à la dimension de son imagination
https://www.letime.net

Hors ligne

#30 Le 04/05/2013, à 14:22

markos_le_malos

Re : [résolu] CMU Sphinx reconnaissance vocale

arf... je vais aller voir le résultat.

je ne sais pas encore comment ni si ça fonctionne (du moins ici) n'empêche qu'on peut dire que temps est du genre coriace et tétu smile

j'y go de suite sur tes liens, et en attendant, quand même bravo wink et merci pour tout ce taf.

allez on teste cool


The Ubuntu Counter Project - user number # 25857

Hors ligne

#31 Le 04/05/2013, à 16:44

temps

Re : [résolu] CMU Sphinx reconnaissance vocale

Bonjour,
J'ai corrigé le code car le compteur qui filtre l'entete des fichier ne marche pas et cela produit 6  ondes de trops.
En d'autres mots, j'ai refais la bibliothèque sans entete en plus cela va diviser le code par 2.
Mais je ne peux pas encore le faire car la création des fichiers audio dans la zone tampon est beaucoup trop rapide, sox n'arrive pas à lire le fichier audio qu'un autre commence déja à se créer. Ja vais regardé comment récupéré dans sox que le fichier a fini d'être lu pour envoyer l'écriture du suivant en atendant je vais réduire la vitesse de lecture dans le main de l'application

Astuce, j'ai accordé par hasard en jouant des sons à la place d'une lettre, ça donne un effet pas mal comme une programmation de piano. Mais pour l'instant, j'ai pas le temps d'explorer cette voie.

Cordialement

Dernière modification par temps (Le 04/05/2013, à 19:41)


Parce que l'USB bootable est le support des systèmes experts,
Parce que l'USB bootable contient sa propre image au démarrage.
L'USB bootable permet de créer un monde à la dimension de son imagination
https://www.letime.net

Hors ligne

#32 Le 16/06/2015, à 23:27

Apsylus

Re : [résolu] CMU Sphinx reconnaissance vocale

Bonjour à tous ! J'espère que ce post n'arrive pas trop tard :

J'ai réalisé une vidéo sur Sphinx, si ça peut aider smile

https://www.youtube.com/watch?v=LIDEam25vxM

Dernière modification par Apsylus (Le 17/06/2015, à 09:56)

Hors ligne

#33 Le 16/06/2015, à 23:38

fanfantasy7

Re : [résolu] CMU Sphinx reconnaissance vocale

"cette vidéo n'est pas disponible"


Fanfantasy7
pc fixe : Linux Mint
pc portable : Ubuntu LTS

Hors ligne

#34 Le 17/06/2015, à 09:56

Apsylus

Re : [résolu] CMU Sphinx reconnaissance vocale

Edit smile

Hors ligne

#35 Le 25/06/2015, à 16:45

Benoitfra

Re : [résolu] CMU Sphinx reconnaissance vocale

Hello je suis en train de developper Voxgenerator un package python pour creer et deployer des plugins utilisant la reconnaissance vocale. Je fournis un pipeline qui publie les transcriptions via dbus. Les resultats sont alors traites par les plugins qui declenchent des commandes. Pour plus d infos rechercher VOXGenerator sur github.

Hors ligne