Download Free Contribution A La Reconnaissance Automatique De La Parole Book in PDF and EPUB Free Download. You can read online Contribution A La Reconnaissance Automatique De La Parole and write the review.

Ce mémoire propose, dans un premier temps, une introduction détaillée de la reconnaissance automatique de la parole avec données manquantes appuyée par de nombreuses références bibliographiques. Il est montré que l'estimation de masques constitue une étape cruciale. En effet, la qualité des masques estimés conditionne les performances du système de reconnaissance. L'amélioration de la fiabilité des masques constitue donc un enjeu important. Dans un second temps, les travaux menés dans le cadre de l'estimation bayésienne des masques de données manquantes sont présentés. D'une part je propose de nouveaux modèles de masques permettant de modéliser les dépendances entre les masques de différents coefficients d'un signal. Ces modèles sont évalués comparativement à un modèle de référence. Les résultats sont présentés en termes d'erreur de masques ainsi qu'en taux de reconnaissance. Les résultats montrent que ces dépendances contribuent à améliorer les taux de reconnaissance et soulignent l'importance du contexte temporel d'un masque. Je présente, dans un second temps, une nouvelle définition de masque: les masques de contribution. Ces nouveaux masques sont évalués comparativement aux masques usuellement utilisés, fondés sur le seuillage du SNR. Je montre que cette nouvelle définition permet d'améliorer l'algorithme de décodage en affinant les intervalles de marginalisation. L'évaluation, dans le cadre de la marginalisation de données et en présence d'un bruit stationnaire, montrent que les intervalles sont considérablement réduits entraînant une nette amélioration des taux de reconnaissance.
Présentation de la reconnaissance de la parole comme un cas particulier de la reconnaissance des formes. Puis formulation élémentaire de la théorie du flou. Mise en oeuvre de cet algorithme par l'identification à des sous-ensembles flous des formes acoustiques fournies par l'analyseur vocal. Validité et extension de la méthode. Généralisation au cas de plusieurs locuteurs.
La RAP non native souffre encore d'une chute significative de précision. Cette dégradation est due aux erreurs d'accent et de prononciation que produisent les locuteurs non natifs. Les recherches que nous avons entreprises ont pour but d'atténuer l'impact des accents non natifs sur les performances des systèmes de RAP. Nous avons proposé une nouvelle approche pour la modélisation de prononciation non native permettant de prendre en compte plusieurs accents étrangers. Cette approche automatique utilise un corpus de parole non native et deux ensembles de modèles acoustiques: le premier ensemble représente l'accent canonique de la langue cible et le deuxième représente l'accent étranger. Les modèles acoustiques du premier ensemble sont modifiés par l'ajout de nouveaux chemins d'états HMM. Nous avons proposé une nouvelle approche pour la détection de la langue maternelle basée sur la détection de séquences discriminantes de phonèmes. Par ailleurs, nous avons proposé une approche de modélisation de prononciation non native multi-accent permettant de prendre en compte plusieurs accents étrangers simultanément. D'autre part, nous avons proposé l'utilisation de contraintes graphémiques. Nous avons conçu une approche automatique pour la detection des contraintes graphémiques et leur prise en compte pour l'approche de RAP non native. Vu que notre méthode de modélisation de prononciation augmente la complexité des modèles acoustiques, nous avons étudié les approches de calcul rapide de vraisemblance pour les GMM. En outre, Nous avons proposé trois nouvelles approches efficaces dont le but est l'accélération du calcul de vraisemblance sans dégradation de la précision.
Le but du travail est de construire un système de dialogue oral avec une machine acceptant en temps réel des phrases prononcées en continu sur un sujet déterminé. On étudie le choix des paramètres, les problèmes d'acquisition des données en temps réel, des algorithmes de segmentation et de classification phonémique des problèmes d'analyse lexicale.
La reconnaissance automatique de la parole donne aujourd'hui lieu à un ensemble important d'applications de nature et de difficulté très variées, concernant quotidiennement des millions de personnes à travers le monde. On peut prévoir que la parole fera de plus en plus partie des interfaces multimédia entre un utilisateur et un système automatique, d'une part grâce à l'amélioration de la robustesse des systèmes de reconnaissance automatique de la parole et, d'autre part, du fait de la sensibilisation croissante du grand public à cette technologie encore peu connue. Cet ouvrage illustre le caractère pluridisciplinaire de la reconnaissance automatique de la parole qui fait appel à des notions variées allant des mathématiques, du traitement du signal, de l'informatique et de l'intelligence artificielle jusqu'à la phonétique, à la linguistique, aux sciences cognitives et aux neurosciences. Il présente les fondements théoriques du domaine ainsi que les différents modèles et algorithmes utilisés (statistiques, neuromimétiques, symboliques) en les illustrant par des exemples réels. Les grands domaines d'application sont également étudiés : dictée, commandes, télématique, traduction, etc. Ce livre s'adresse aux étudiants en master et en doctorat, aux élèves ingénieurs, aux chercheurs, aux professionnels des interfaces homme-machine, ainsi qu'à toute personne ayant un niveau scientifique suffisant.