Algorithme de recherche d’orchestrations
Nous abordons dans cette thèse le problème de l’orchestration assitée par ordinateur d’un point de vue algorithmique. Nous nous ramenons à un problème combinatoire dans lequel il s’agit de trouver une combinaison de sons instrumentaux qui, joués simultanément, produisent le timbre désiré par le compositeur. Des questions préliminaires surgissent aussitôt : Comment caractériser ce timbre ciblé ? Comment représenter la connaissance instrumentale dans un outil informatique ? Comment évaluer la qualité d’un mélange (i.e. sa “distance” à la cible) ? Sur quels critères se baser ? Ce chapitre aborde ces questions. Nous y exposons nos propres conceptions et les choix méthodologiques qui en découlent.D’un point de vue scientifique, l’intention du compositeur doit être pensée comme une « cible », un objectif à atteindre par une méthode appropriée. Si l’objectif ne peut être atteint, il faut alors trouver la solution la plus proche. La notion de « distance » est donc primordiale, et notre travail doit consister dans un premier temps à définir cette distance, dans un second temps à imaginer une méthode appropriée pour la minimiser. On pourrait bien sûr décider de se passer de la cible, et prendre le parti d’explorer l’espace des timbres de manière itérative. L’orchestre serait alors un simple réservoir de sons dans lequel on puiserait pour « construire » Il nous faut donc définir une cible. Dans notre cas, elle serait un ensemble de caractéris- tiques décrivant les particularités du timbre souhaité. Or, caractériser le timbre nécessite une collection de termes établis et univoques — chacun d’entre eux se référant à une caractéris- tique précise du son — partagée par les compositeurs, les chercheurs et les instrumentistes. Hélas, la construction d’un tel vocabulaire est illusoire, car la manière dont la perception auditive est verbalisée implique toujours une grande part de subjectivité. Certains champs lexicaux conviennent certes davantage que d’autres. Erickson [Eri75] fait ainsi observer que « des termes du vocabulaire visuel ou tactile sont souvent appropriés pour décrire les sons ou les combinaisons de sons : tranchant, rugueux, sourd, doux, mordant, clair, éclatant, cassant, épais, fin, sec, vaporeux, aéré, minutieux, flasque, fluide, translucide, flamboyant, granuleux, cru, brumeux, lourd, glacial, ébréché, limpide, luxuriant, léger, ondulé, pour en citer quelques uns. » Mais qu’est-ce, en définitive, qu’un son fluide ? Qu’est-ce qu’un son glacial ? Interro- geons des compositeurs, ils donneront (s’ils le peuvent) des exemples différents, en rapport avec leur expérience musicale personnelle. Alors que tout le monde s’entend sur ce qu’est un accord majeur, ou un accelerando.
Nous ne prétendrons pas ici résoudre le problème de la verbalisation du timbre, d’autant moins que les problématiques psychoacoustiques ne sont que périphériques à notre sujet de recherche. Nous adoptons donc dans un premier temps l’approche de nos aînés, et supposons que le compositeur dispose du son enregistré qu’il désire reproduire avec l’orchestre. Après tout, « proposer un arrangement instrumental qui se rapproche le plus possible de la source d’origine » faisait partie de requêtes des compositeurs exposées au paragraphe 4.2. En outre, les questions sous-jacentes à cette idée sont déjà de taille : Comment analyser le son cible ? Comment évaluer la similarité entre la cible et une proposition d’orchestration ? Comment trouver l’orchestration optimale ?Toutefois, la question d’un timbre que le compositeur aurait « seulement en tête » ne saurait être prématurément écartée. Il nous faut ici introduire un distingo entre ce que nous nommerons désormais l’orchestration imitative, à savoir la reproduction à l’orchestre d’un timbre défini par un son enregistré et l’orchestration générative, à savoir. . . tout le reste. Plus précisément, il s’agirait de trouver un moyen de contrôler en entrée notre outil d’orchestra- tion avec une autre matière qu’un fichier son. L’idée est donc la suivante : puisqu’il semble illusoire, pour l’instant, de se passer de ce son, ne peut-on trouver un moyen de le générer à partir de données symboliques, via un processus de synthèse par exemple ? La figure 7.1 illustre ce principe. L’idée maîtresse est que le compositeur en passe toujours par le sonore pour communiquer avec l’ordinateur. Lorsque le timbre visé n’est pas un son enregistré, le compositeur dispose d’une interface de synthèse sonore pour le « construire » itérativement, à travers un processus d’essais/erreurs. Bien sûr, il y a fort à parier que le son ainsi créé soit très pauvre d’un point de vue perceptif, mais son rôle est uniquement de « capturer » l’en- semble des caractéristiques sonores souhaitées par le compositeur. Il n’est qu’un modèle, un « portrait-robot » dont l’orchestration finale proposée par le système possèdera les traits tout en y ajoutant la richesse du timbre instrumental. Comme l’illustre la figure 7.1, des données symboliques peuvent aussi être passées au système dans le cas d’une orchestration générative. Nous donnerons davantage de détails à ce sujet au chapitre 12.