Evanescente par nature, la musique peut être fixée sur de nombreux supports de nature très différente : la mémoire humaine, la partition classique, les formats audionumériques tel que le CD, les formats de fichiers symboliques comme le MIDI… La nécessité de conserver la musique sur un support pérenne répond à de nombreux besoins apparus au fil du temps, et comporte de nombreuses difficultés conceptuelles et technologiques. La transcription, du latin trans, au-delà, et scribere, écrire, est l’opération qui consiste à produire un tel support, mais pas n’importe lequel : la forme de représentation de la musique produite par cette opération doit contenir du sens, dire quelque chose sur la musique qu’elle contient. Il faut pour cela disposer d’un format qui permet la représentation de telles informations sémantiques, et de techniques pour convertir la musique vers ce format.
S’il existe des arguments, notamment archéologiques, indiquant que nos ancêtres pratiquèrent la musique dès le paléolithique , la notation musicale est évidemment postérieure à l’écriture elle-même. Elle lui est pourtant quasi contemporaine : alors que la première écriture, l’écriture cunéiforme des Sumériens, apparaît aux alentours de 3300 av. J.-C., une tablette babylonienne datée du XVIe siècle av. J.-C. atteste de premiers essais de notation musicale [Dablemont, 2008]. La notation est alors très inspirée de l’écriture elle-même : les notes sont représentées par des lettres, surmontées d’accents. Cette notation alphabétique se retrouve chez les Grecs, qui la développent considérablement à partir du Ve siècle av. J.-C., puis au Moyen-Âge, où l’écriture de la musique prend véritablement son essor.
Ces notations archaïques semblent relever davantage de l’aide-mémoire que de l’écriture fidèle de la musique : il paraît difficile d’interpréter la musique écrite ici sans l’avoir jamais entendue. [Cullin, 2008] souligne d’ailleurs que les fonctions de la musique écrite vont bien au-delà de cette fonction d’aide-mémoire : elle possède notamment un aspect religieux, rituel voire sacré, comme dépositaire de la parole divine (les neumes, apparus au IXe siècle, sont utilisés dans les monastères) et de support à la méditation. L’aspect esthétique est également indéniable, avec des ornementations et illustrations accompagnant la notation informative. D’abord allusive (contours mélodiques, accents…), l’information acquiert au fil des siècles de plus en plus de précision : apparition de la ⋆portée et des hauteurs relatives, puis des clefs et de la notation de la hauteur absolue ; normalisation des valeurs rythmiques (rondes, blanches, noires…).
Jusqu’au milieu du XXe siècle, la question de la transcription ne se pose évidemment qu’en termes d’expertise humaine. Puis, avec l’émergence de sciences et surtout de technologies capables de s’attaquer au problème, l’étude automatisée de la musique devient un domaine de recherche très actif, présentant à la fois de grands défis et des enjeux applicatifs. Cela n’est pas étonnant : les scientifiques s’intéressent à l’étude de la musique depuis Pythagore (580-498 av. J.-C.), qui formalise une construction de la gamme (« cycle des quintes ») et observe le rapport entre la longueur d’une corde, la fréquence de sa vibration et la hauteur du son produit. Avec la démocratisation de la pratique musicale et l’apparition de moyens de plus en plus perfectionnés d’enregistrement et de reproduction du son, le défi scientifique et technologique que représente la production automatisée d’une représentation symbolique de la musique devient également un préalable pour remplir de nouveaux besoins. Transcrire automatiquement la musique n’est pas seulement un but en soi, mais aussi un objectif dont le résultat peut déboucher sur de très nombreuses applications, avec des enjeux commerciaux, légaux, artistiques, pédagogiques…
En effet, la manipulation de représentations symboliques est bien plus aisée que celle du son brut, et peut bénéficier de nombreux travaux antérieurs et contemporains sur les séquences de symboles de manière générale, comme par exemple les recherches en traitement du language naturel ou en bioinformatique (étude des séquences ADN). Si l’on dispose d’une représentation symbolique de la musique contenue dans un fichier son, de très nombreuses applications sont envisageables, parmi lesquelles :
– Indexation et navigation dans de grandes bases de données sonores, telles qu’elles sont disponibles aujourd’hui en grande quantité, par exemple sur Internet ou dans nos bibliothèques personnelles ;
– Recherche par similarité, recommandation musicale, recherche de reprises ;
– Protection des droits d’auteur, recherche de plagiat, de copies illégales ;
– Aide au musicologue : recherche de thèmes, d’influences d’un compositeur sur un autre ;
– Aide à l’apprentissage, apprentissage interactif de la musique ;
– Écoute active de la musique.
Introduction |