Analyse de données musicales
À cet effet (section 8.1), on divise la partition en durées égales, puis on transforme des par- titions numériques (cf. chapitre 7) en tables de contingence qui comptent la durée de chaque note pour chaque intervalle de temps. Cette représentation, très proche de la représentation sur rouleau de piano pneumatique (piano-roll representation) et, pour les fichiers audio, de la repré- sentation Chroma (voir par exemple Ellis et Poliner, 2007; Müller et Ewert, 2011; Kriesel, 2013, section 2.4), a l’avantage de représenter de la musique polyphonique dans un format compatible avec des méthodes d’analyse de données courantes, telles que l’AFC, et d’être invariante sous agrégation (cf. section 8.1.1). Pour commencer (section 8.2), des morceaux de musique complets sont analysés, par l’inter- médiaire de l’AFC et de l’indice d’autocorrélation. Ces deux méthodes permettent de découvrir des structures intrinsèques dans des partitions de musique, ainsi que d’en visualiser les patterns. Elles sont illustrées par un exemple monophonique et par plusieurs exemples polyphoniques. Ensuite, dans la section 8.3, les différentes voix d’une même partition, ainsi que les liens qui existent entre elles, sont analysés par l’intermédiaire d’une analyse des correspondances mul- tiples (ACM) floue et de l’indice d’autocorrélation croisée. Ces deux méthodes sont appliquées à deux partitions polyphoniques composées pour plusieurs instruments. Finalement, une mesure de similarité entre deux partitions, basée sur la représentation des partitions de musique par des tables de contingence, est présentée dans la section 8.4. À partir de cette mesure de similarité, des partitions écrites par plusieurs compositeurs sont regroupées par une classification ascendante hiérarchique.
Aussi, toutes les hauteurs de note sont rapportées à l’octave et l’on attribue la valeur de 0 à do ; de 1 à do♯ ou ré♭ ; de 2 à ré, etc. Ensuite, un vrai silence, z, qui correspond à un moment durant lequel aucune note n’est jouée, est ajouté. Au final, j peut prendre 13 valeurs différentes : 0 à 11 et z. Concernant les intervalles de temps, ils ont une durée constante qui vaut τ . Cette durée peut prendre n’importe quelle valeur, telle qu’un nombre de doubles croches, de mesures ou de millisecondes. Par conséquent, la durée totale d’une partition (ou d’un extrait) vaut τ = nτ . Les figures 8.1 et 8.2 présentent deux exemples de la table de contingence transposée, un pour l’extrait d’une partition de piano et un autre pour l’extrait d’une partition pour un quatuor à cordes, chacune avec deux valeurs de τ . En plus de permettre de traiter de la musique polyphonique, cette représentation a l’avantage d’être invariante sous agrégation : ainsi doubler la valeur de τ revient à sommer les effectifs de deux intervalles de temps successifs. Donc, si T représente un intervalle de temps composé d’intervalles de temps plus petits t, alors les nouveaux effectifs deviennent :
comme l’illustrent les figures 8.1 et 8.2. Lavrenko et Pickens (2003) et Morando (1981) utilisent des représentations relativement similaires, à ceci près que les premiers ne considèrent ni la durée des notes, ni celle entre les notes, et que le second base sa représentation sur la succession des accords. De plus, ces représentations ne sont pas invariantes sous agrégation, à l’inverse de celle présentée ici. musicien et disponibles sur Internet (cf. section 7.3.3). En particulier, pour conserver l’œuvre dans sa version complète, on utilise les fichiers comportant toutes les répétitions, telles qu’elles sont indiquées sur la partition. Lorsque des modifications sont nécessaires, telle qu’une trans- position ou l’extraction d’une voix, par exemple, la série de programmes Humdrum extras est utilisée. Ensuite, ils sont transformés en format Melisma (cf. section 7.3.1), plus simple pour le traitement informatique, à l’aide du programme « kern2melisma » de la série Humdrum extras. Avant cette transformation, le tempo des fichiers Humdrum est fixé, arbitrairement et sans conséquences sur les applications, à 100 pulsations par minute pour une noire (*MM100). Ainsi, lors de la transformation en fichier Melisma, une noire aura une durée exacte de 600 ms. Finale- ment, les fichiers Melisma sont transformés en tables de contingence brutes par l’intermédiaire d’un programme en Perl.Dans un second temps, l’agrégation est exécutée dans R. Dans toutes les applications de ce chapitre, à l’exception des figures 8.21 et 8.22, lorsque la durée τ est plus grande ou égale à une mesure et que le morceau de musique commence avec une anacrouse (ou levée), cette dernière est ajoutée à la première mesure lors de l’agrégation. Aussi, si le choix de la durée τ ne permet pas d’obtenir des diviseurs entiers de τ.