Les factorisations en matrices non-négatives

Evanescente par nature, la musique peut être fixée sur de nombreux supports de nature très différente : la mémoire humaine, la partition classique, les formats audionumériques tel que le CD, les formats de fichiers symboliques comme le MIDI… La nécessité de conserver la musique sur un support pérenne répond à de nombreux besoins apparus au fil du temps, et comporte de nombreuses difficultés conceptuelles et technologiques. La transcription, du latin trans, au-delà, et scribere, écrire, est l’opération qui consiste à produire un tel support, mais pas n’importe lequel : la forme de représentation de la musique produite par cette opération doit contenir du sens, dire quelque chose sur la musique qu’elle contient. Il faut pour cela disposer d’un format qui permet la représentation de telles informations sémantiques, et de techniques pour convertir la musique vers ce format.

S’il existe des arguments, notamment archéologiques, indiquant que nos ancêtres pratiquèrent la musique dès le paléolithique  , la notation musicale est évidemment postérieure à l’écriture elle-même. Elle lui est pourtant quasi contemporaine : alors que la première écriture, l’écriture cunéiforme des Sumériens, apparaît aux alentours de 3300 av. J.-C., une tablette babylonienne datée du XVIe siècle av. J.-C. atteste de premiers essais de notation musicale [Dablemont, 2008]. La notation est alors très inspirée de l’écriture elle-même : les notes sont représentées par des lettres, surmontées d’accents. Cette notation alphabétique se retrouve chez les Grecs, qui la développent considérablement à partir du Ve siècle av. J.-C., puis au Moyen-Âge, où l’écriture de la musique prend véritablement son essor.

Ces notations archaïques semblent relever davantage de l’aide-mémoire que de l’écriture fidèle de la musique : il paraît difficile d’interpréter la musique écrite ici sans l’avoir jamais entendue. [Cullin, 2008] souligne d’ailleurs que les fonctions de la musique écrite vont bien au-delà de cette fonction d’aide-mémoire : elle possède notamment un aspect religieux, rituel voire sacré, comme dépositaire de la parole divine (les neumes, apparus au IXe siècle, sont utilisés dans les monastères) et de support à la méditation. L’aspect esthétique est également indéniable, avec des ornementations et illustrations accompagnant la notation informative. D’abord allusive (contours mélodiques, accents…), l’information acquiert au fil des siècles de plus en plus de précision : apparition de la ⋆portée  et des hauteurs relatives, puis des clefs et de la notation de la hauteur absolue ; normalisation des valeurs rythmiques (rondes, blanches, noires…).

Jusqu’au milieu du XXe siècle, la question de la transcription ne se pose évidemment qu’en termes d’expertise humaine. Puis, avec l’émergence de sciences et surtout de technologies capables de s’attaquer au problème, l’étude automatisée de la musique devient un domaine de recherche très actif, présentant à la fois de grands défis et des enjeux applicatifs. Cela n’est pas étonnant : les scientifiques s’intéressent à l’étude de la musique depuis Pythagore (580-498 av. J.-C.), qui formalise une construction de la gamme (« cycle des quintes ») et observe le rapport entre la longueur d’une corde, la fréquence de sa vibration et la hauteur du son produit. Avec la démocratisation de la pratique musicale et l’apparition de moyens de plus en plus perfectionnés d’enregistrement et de reproduction du son, le défi scientifique et technologique que représente la production automatisée d’une représentation symbolique de la musique devient également un préalable pour remplir de nouveaux besoins. Transcrire automatiquement la musique n’est pas seulement un but en soi, mais aussi un objectif dont le résultat peut déboucher sur de très nombreuses applications, avec des enjeux commerciaux, légaux, artistiques, pédagogiques…

En effet, la manipulation de représentations symboliques est bien plus aisée que celle du son brut, et peut bénéficier de nombreux travaux antérieurs et contemporains sur les séquences de symboles de manière générale, comme par exemple les recherches en traitement du language naturel ou en bioinformatique (étude des séquences ADN). Si l’on dispose d’une représentation symbolique de la musique contenue dans un fichier son, de très nombreuses applications sont envisageables, parmi lesquelles :

– Indexation et navigation dans de grandes bases de données sonores, telles qu’elles sont disponibles aujourd’hui en grande quantité, par exemple sur Internet ou dans nos bibliothèques personnelles ;
– Recherche par similarité, recommandation musicale, recherche de reprises ;
– Protection des droits d’auteur, recherche de plagiat, de copies illégales ;
– Aide au musicologue : recherche de thèmes, d’influences d’un compositeur sur un autre ;
– Aide à l’apprentissage, apprentissage interactif de la musique ;
– Écoute active de la musique.

Table des matières

Introduction
Partie I Transcription automatique de la musique
I Présentation du problème et approches historiques
I.1 Introduction
I.2 La tâche de transcription
I.2.1 Transcription au sens large
I.2.2 La note de musique
I.2.3 Restriction du problème
I.3 Approches historiques
I.3.1 La transcription monodique
I.3.2 Premiers systèmes de transcription polyphonique
II État de l’art
II.1 Introduction
II.2 Estimation de fréquences fondamentales multiples
II.2.1 État de l’art de l’estimation de hauteurs multiples
II.2.2 Du multipitch à la transcription
II.3 Transcription fondée sur des connaissances
II.3.1 Apprentissage hors ligne
II.3.2 Utilisation de connaissances musicologiques
II.4 Méthodes bayésiennes
II.5 Transcription aveugle ou semi-aveugle
II.5.1 Panorama
II.5.2 Méthodes basées sur la NMF
II.6 Problématique de la thèse
Partie II Approche déterministe
III État de l’art de la NMF non contrainte
III.1 Introduction
III.2 Existence et unicité des solutions
III.2.1 Existence des solutions
III.2.2 Degrés d’invariance
III.2.3 Conditions d’unicité
III.3 Fonctions de coût
III.3.1 Fonctions usuelles
III.3.2 Propriétés
III.3.3 Fonctions de coût généralisées
III.4 Algorithmes usuels
III.4.1 Algorithmes multiplicatifs
III.4.2 Autres algorithmes
III.5 Convergence des algorithmes multiplicatifs
III.5.1 Décroissance du critère
III.5.2 Convergence vers un point stationnaire
III.6 Initialisation
III.6.1 K-moyennes sphériques
III.6.2 Clustering des lignes
IV Éviter les minima locaux
IV.1 Introduction
IV.2 Initialisation
IV.2.1 Sur un exemple simple
IV.2.2 Sur données réelles
IV.2.3 Conclusion
IV.3 Algorithme tempéré
IV.3.1 Algorithme
IV.3.2 Résultats expérimentaux : données de synthèse
IV.3.3 Résultats expérimentaux : données réelles
IV.4 Conclusion
V Variantes contraintes de la NMF
V.1 Introduction
V.2 Panorama des variantes contraintes
V.2.1 Parcimonie
V.2.2 Régularité
V.2.3 Décorrélation
V.2.4 Harmonicité
V.2.5 Autres
V.3 NMF harmonique
V.3.1 Motivation
V.3.2 Modèle génératif
V.3.3 Patterns
V.3.4 Paramètres supplémentaires
V.3.5 Algorithme
Conclusion

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *