ParisTech se présente
 Evénements
 
 Etudier à ParisTech
 La coopération internationale
 Ressources documentaires
 Vivre à ParisTech
 ParisTech et les entreprises
 ParisTech Libres Savoirs
 
 

Modélisation sinusoïdale et applications à l’indexation sonore.

Accueil || Parcours || Recherche || S'enregistrer || Mon Compte || Contacts || Aide || Langues

Betser, Michaël A. (2008) Modélisation sinusoïdale et applications à l’indexation sonore. Doctorat mathématiques appliqués, ENST p.265.

Plein texte disponible en tant que :

- These_Michael_Betser_v2.pdf ( 3463 Kb )
Licence: CC 3.0

Résumé

L'objectif de la thèse est l'analyse des signaux audio-numériques basée sur la modélisation sinusoïdale.

La première partie de la thèse est dédiée à l’estimation des paramètres sinusoïdaux, et en particulier aux méthodes basées sur la transformée de Fourier. Les avantages de cette famille de méthodes sont une faible complexité algorithmique et une grande facilité d'utilisation. Un état de l’art complet des méthodes d’estimation sinusoïdale basées sur la transformée de Fourier est présenté. Nous parlons ensuite des nouveaux estimateurs qui ont été développé pendant la thèse, en particulier deux nouvelles méthodes qui permettent d’estimer tous les paramètres d’une sinusoïde modulée à la fois en amplitude et en fréquence, et dont les performances se sont révélées meilleures que la seule méthode équivalente de l’état de l’art existante, l’interpolation quadratique de la transformée de Fourier (QIFFT).

L'indexation sonore est un domaine assez vaste dont la problématique est de répondre aux besoins d'accès par le contenu des documents audio. Dans la deuxième partie de la thèse nous nous sommes attachés à appliquer la modélisation sinusoïdale à deux tâches d'indexation audio pour lesquelles cette modélisation est particulièrement adaptée: l’estimation de pitch et la détection d'objets sonores. Les deux algorithmes développés font intervenir des principes similaires : un appariement des pics sinusoïdaux estimés dans le flux audio avec ceux de l’objet sonore de référence, ainsi qu’une mesure de vraisemblance de l’appariement.

Type d'EPrint:Thèse (Doctorat)
Directeur de Thèse:Richard, Gaël et David, Bertrand
Date:16 Juin 2008
Jury de Thèse:D'Alessandro, Christophe et Girin, Laurent et Flandrin, Patrick et Daudet, Laurent et Collen, Patrice
Ecole Doctorale:ED 130 INFORMATIQUE, TELECOMMUNICATIONS ET ELECTRONIQUE (EDITE)
Discipline:mathématiques appliqués
Fonds:TELECOM ParisTech (ENST)
Institution:ENST
Sujets:1. Mathématiques et leurs applications
Mots-clés libres:Estimation sinusoïdale Estimation de pitch Identification audio fréquence fondamentale indexation audio, Sinusoidal estimation pitch estimation audio identification audio id fundamental frequency audio indexing
Code ID:4089
Déposé par :Michael Betser
Déposé le :09 Janvier 2009

Statistiques de consultation

Administrateurs de l'archive uniquement : éditer cet enregistrement

 
ParisTech
 
droits de reproduction et de diffusion réservés © ParisTech 2007