ParisTech se présente
 Evénements
 
 Etudier à ParisTech
 La coopération internationale
 Ressources documentaires
 Vivre à ParisTech
 ParisTech et les entreprises
 ParisTech Libres Savoirs
 
 

Transcription automatique de la musique de piano.

Accueil || Parcours || Recherche || S'enregistrer || Mon Compte || Contacts || Aide || Langues

Emiya, Valentin (2008) Transcription automatique de la musique de piano. Doctorat Signal et images, Département Traitement du Signal et des Images, ENST p.230.

Plein texte disponible en tant que :

- Emiya_2008_these.pdf ( 10850 Kb )
Licence: Copyright

Résumé

La transcription automatique de la musique (TAM) s'inscrit dans le champ de l'indexation audio et de la recherche d'informations musicales. Elle vise à extraire l'information relative aux notes jouées – début, fin, hauteur – dans un enregistrement numérique. Cette thèse aborde la TAM dans le cadre du piano, instrument difficile à transcrire par les systèmes actuels et qui occupe une place majeure d'instrument solo dans la musique occidentale. La problématique générale de la TAM étant vaste et complexe, nous exploitons certains aspects spécifiques du piano pour spécialiser la tâche, tout en abordant des thématiques générales comme l'estimation de fréquences fondamentales (F0) ou l'évaluation.

Nous étudions tout d’abord la caractérisation spectrale des sons de piano pour la transcription à travers la distribution inharmonique des partiels, la modélisation de l'enveloppe spectrale des notes et celle du bruit.

Nous proposons ensuite une méthode d'estimation de F0 isolées performante dans des conditions d'analyse difficiles qui sont réunies dans le cas du piano: les contraintes d'une fenêtre d'analyse courte et d'un registre étendu.

L'estimation de F0 multiples et du degré de polyphonie est abordée via une modélisation conjointe paramétrique (autorégressive/à moyenne ajustée). Cette méthode spectrale s'intègre dans un système de TAM pour le piano analysant tout enregistrement avec des limites raisonnables en termes de polyphonie, de vélocité et de tessiture.

Enfin, nous proposons de nouvelles métriques d’évaluation des transcriptions, un cadre d'évaluation de la qualité des métriques et une base de données de sons de piano pour l'estimation de F0 multiples et la TAM.

Type d'EPrint:Thèse (Doctorat)
Directeur de Thèse:David, Bertrand et Roland, Badeau
Date:10 Octobre 2008
Jury de Thèse:d’Alessandro, Christophe et de Cheveigné, Alain et Daudet, Laurent et Klapuri, Anssi et Richard, Gaël et Vincent, Emmanuel et David, Bertrand et Roland, Badeau
Ecole Doctorale:ED 130 INFORMATIQUE, TELECOMMUNICATIONS ET ELECTRONIQUE (EDITE)
Discipline:Signal et images
Fonds:TELECOM ParisTech (ENST)
Institution:ENST
Laboratoire:Département Traitement du Signal et des Images
Sujets:2. Sciences et technologies de l'information et de la communication
Mots-clés libres:Traitement du signal, Audio, Indexation, Recherche d'information, Acoustique musicale, Transcription, Piano, Musique
Code ID:4867
Déposé par :Valentin Emiya
Déposé le :10 Avril 2009

Table des Matières

1 État de l’art

2 Paramétrisation spectrale des sons de piano

3 Estimation à court terme de hauteur simple sur un registre étendu

4 Estimation de fréquences fondamentales multiples

5 Système de transcription

6 Évaluation

Conclusion et perspectives

Statistiques de consultation

Administrateurs de l'archive uniquement : éditer cet enregistrement

 
ParisTech
 
droits de reproduction et de diffusion réservés © ParisTech 2007