Accueil || Parcours || Recherche || S'enregistrer || Mon Compte || Contacts || Aide || Langues
Emiya, Valentin (2008) Transcription automatique de la musique de piano. Doctorat Signal et images, Département Traitement du Signal et des Images, ENST p.230.
Plein texte disponible en tant que :
|
|
Résumé
La transcription automatique de la musique (TAM) s'inscrit dans le champ de l'indexation audio et de la recherche d'informations musicales. Elle vise à extraire l'information relative aux notes jouées – début, fin, hauteur – dans un enregistrement numérique. Cette thèse aborde la TAM dans le cadre du piano, instrument difficile à transcrire par les systèmes actuels et qui occupe une place majeure d'instrument solo dans la musique occidentale. La problématique générale de la TAM étant vaste et complexe, nous exploitons certains aspects spécifiques du piano pour spécialiser la tâche, tout en abordant des thématiques générales comme l'estimation de fréquences fondamentales (F0) ou l'évaluation.
Nous étudions tout d’abord la caractérisation spectrale des sons de piano pour la transcription à travers la distribution inharmonique des partiels, la modélisation de l'enveloppe spectrale des notes et celle du bruit.
Nous proposons ensuite une méthode d'estimation de F0 isolées performante dans des conditions d'analyse difficiles qui sont réunies dans le cas du piano: les contraintes d'une fenêtre d'analyse courte et d'un registre étendu.
L'estimation de F0 multiples et du degré de polyphonie est abordée via une modélisation conjointe paramétrique (autorégressive/à moyenne ajustée). Cette méthode spectrale s'intègre dans un système de TAM pour le piano analysant tout enregistrement avec des limites raisonnables en termes de polyphonie, de vélocité et de tessiture.
Enfin, nous proposons de nouvelles métriques d’évaluation des transcriptions, un cadre d'évaluation de la qualité des métriques et une base de données de sons de piano pour l'estimation de F0 multiples et la TAM.
| Type d'EPrint: | Thèse (Doctorat) |
|---|---|
| Directeur de Thèse: | David, Bertrand et Roland, Badeau |
| Date: | 10 Octobre 2008 |
| Jury de Thèse: | d’Alessandro, Christophe et de Cheveigné, Alain et Daudet, Laurent et Klapuri, Anssi et Richard, Gaël et Vincent, Emmanuel et David, Bertrand et Roland, Badeau |
| Ecole Doctorale: | ED 130 INFORMATIQUE, TELECOMMUNICATIONS ET ELECTRONIQUE (EDITE) |
| Discipline: | Signal et images |
| Fonds: | TELECOM ParisTech (ENST) |
| Institution: | ENST |
| Laboratoire: | Département Traitement du Signal et des Images |
| Sujets: | 2. Sciences et technologies de l'information et de la communication |
| Mots-clés libres: | Traitement du signal, Audio, Indexation, Recherche d'information, Acoustique musicale, Transcription, Piano, Musique |
| Code ID: | 4867 |
| Déposé par : | Valentin Emiya |
| Déposé le : | 10 Avril 2009 |
Table des Matières
1 État de l’art
2 Paramétrisation spectrale des sons de piano
3 Estimation à court terme de hauteur simple sur un registre étendu
4 Estimation de fréquences fondamentales multiples
5 Système de transcription
6 Évaluation
Conclusion et perspectives
Administrateurs de l'archive uniquement : éditer cet enregistrement