Généralisation de l’approche ambisonique
Suite aux expérimentations dans le domaine des harmoniques sphériques et à l’appropriation musicale des techniques ambisoniques, les principes initiaux sur lesquels reposent ces techniques de spatialisation du son ont été remis en question. Ces approches ont notamment permis de révéler le potentiel musical de la représentation du champ sonore sous la forme de signaux associés aux harmoniques sphériques. Mais, de manière plus générale, elles ont amené à changer le regard porté sur la décomposition en harmoniques sphériques, en mettant en avant le potentiel inspirant et créatif de la représentation spatiale qui en découle. Celle-ci s’est trouvée libérée des éléments techniques, matériels, acoustiques et psychoacoustiques qui ont amené à son utilisation et s’est révélé être un outil puissant pour concevoir des espaces sonores. Cette représentation intermédiaire de l’espace est redevenue abstraite, dans le sens où elle n’est plus liée explicitement à une représentation rationnelle du champ sonore. Et par ce biais, elle laisse entrevoir de multiples autres possibilités de représentations abstraites de l’espace, pouvant être utilisées de manière intermédiaire, afin de générer des espaces sonores. C’est à cette spéculation que cette partie tente de répondre. De nombreuses propositions concrètes peuvent dès lors apparaître. Mais le cadre de ces recherches pourrait à peine en recouvrir une infime partie, et, s’il était possible d’en présenter suffisamment pour offrir un aperçu du large éventail des possibilités, celles-ci ne seraient traitées que superficiellement. Aussi, le choix a été fait de concentrer les travaux sur une représentation particulière de l’espace. Cette approche a été préférée pour plusieurs raisons. D’une part, cela permet de présenter une approche en profondeur et de façon plus complète. Mais aussi de proposer des outils adaptés et surtout de concevoir des expérimentations et des utilisations concrètes, permettant de valider une proposition qui n’était jusqu’à présent que conceptuelle. D’autre part, l’enjeu par cette présentation est de concevoir en filigrane une méthodologie de l’approche qui puisse être réadaptée pour d’autres propositions de représentation de l’espace. En rapprochant cette approche de l’appropriation musicale des techniques ambisoniques, l’objectif est de définir des spécifications conceptuelles, techniques et fonctionnelles de la spatialisation du son fondées sur une représentation intermédiaire et abstraite de l’espace. Aussi, bien que la présentation au cœur de cette partie reste très centrée sur une approche particulière qui sera présentée par la suite, les enjeux auxquels elle tente de répondre sont bien plus généraux. Et de même, la méthodologie employée et les outils proposés se veulent les plus génériques possibles.
De nouveaux outils
Pour proposer de nouvelles approches et de nouvelles techniques de spatialisation fondées sur des représentations abstraites et intermédiaires de l’espace, il est nécessaire d’avoir des outils logiciels permettant de mettre en œuvre, mais surtout d’expérimenter, de telles approches. Cependant, aucun de ces nouveaux processus de mise en espace du son n’est pour le moment défini. Cela rend alors impossible la définition d’un ensemble de spécifications précises et d’outils dédiés à une technique particulière. Ce problème peut alors paraître sans fin. Aussi, pour répondre à ce sujet a priori sans issue, ce travail de recherche propose de porter sur l’analyse et la critique de la bibliothèque HOA, afin de déterminer les approches qui pourraient être généralisées et de définir ainsi certaines spécifications. Suite à cette étude, une solution concrète au problème sera proposée, sous la forme d’un petit ensemble d’outils logiciels pour le logiciel Pure Data. Cet ensemble d’outils tentera de répondre au mieux aux spécifications établies précédemment, en offrant un système flexible et des fonctionnalités qui pourront s’adapter à de nombreuses propositions. Avant de procéder à une première suggestion d’un nouveau système de spatialisation fondé sur une représentation intermédiaire et abstraite de l’espace, ces outils nécessitent d’être d’abord confrontés à un usage réel permettant de les critiquer. Il s’agira alors de mettre en œuvre via ces outils, certains traitements déjà réalisés avec la bibliothèque HOA afin de définir à l’avance leurs contraintes et leurs limites et de pouvoir proposer des solutions ou dans le cas contraire, en tenir compte pour les futures mises en œuvre.
.Spécifications
L’objectif est définir les spécifications techniques et fonctionnelles d’un ensemble d’outils génériques qui pourraient s’adapter à de multiples représentations intermédiaires et abstraites de l’espace, toutes aussi différentes que variées. La méthodologie proposée est de revenir sur la mise en œuvre de la bibliothèque HOA afin de critiquer les approches, pour pourvoir envisager des fonctionnalités intéressantes répondant à de futurs besoins. L’enjeu est, en quelque sorte, de définir ce qui fait la spécificité de cette mise en œuvre, afin de la généraliser. Selon les travaux présentés dans la première partie de cette thèse, la bibliothèque HOA tente de répondre à plusieurs problématiques. Il s’agit, d’une part, de répondre aux enjeux d’optimisation et d’utilisabilité des processus, notamment pour le contexte de musiques tempsréel. D’autre part, les approches proposées visent à satisfaire des enjeux didactiques et 212 pédagogiques, notamment en tentant de rendre intelligibles et transparents les mécanismes sous-jacent aux processus mis en jeu. Enfin, le point le plus important est d’offrir un système relativement flexible et adapté à l’approche ambisonique, qui permette de mettre en œuvre de nouvelles expérimentations de l’espace et du son via la création de traitements orignaux dans le domaine des harmoniques sphériques. Aussi, afin de répondre à ces problématiques, trois classes d’objets ont été proposés : les objets de type « boîte » de traitement du signal, les interfaces graphiques, et les outils de vectorisation des processus dont l’élément central est l’objet hoa.2/3d.process~. Pour chacune de ces classes, en confrontant les mises en œuvre des objets avec les utilisations qui en sont faites, cela au regard des problématiques qui viennent d’être rappelées, il sera possible d’offrir un aperçu général des objectifs atteints ou, au contraire, des problèmes persistants. A partir de ces observations, le but est de définir les atouts des outils proposés, afin de reproduire les mécanismes en vue d’une utilisation plus générale, mais aussi, à l’opposé, afin de révéler leurs points faibles.
Traitement du signal
Comme cela a été énoncé pendant leurs présentations, les objets de traitement du signal, bien qu’offrant des avantages certains sur le plan de l’utilisabilité et de l’optimisation, ne semblent a priori pas la meilleure approche. Afin de justifier cette affirmation, il semble pertinent de revenir sur les deux opérations les plus communes de l’approche ambisonique, à savoir l’encodage et le décodage. Les outils d’encodage sont au nombre de deux, l’objet hoa.2/3d.encoder~ et l’objet hoa.2/3d.map~. Mais étant donné que le premier est une version restreinte du second214, il est possible de ne considérer que ce dernier. Cet outil permet d’encoder un nombre dynamique de sources sonores à n’importe quel ordre de décomposition. Il est donc à remarquer une certaine ergonomie de l’outil par son aspect dynamique et offrant la possibilité de s’adapter à plusieurs situations. De plus, les mécanismes mis en jeu sont relativement complexes de par les calculs des amplitudes des harmoniques sphériques. Les opérations sont réalisées à des fréquences relativement élevées, à savoir la fréquence d’échantillonnage audionumérique. Il est donc possible d’estimer que cette approche offre un avantage vis-à-vis de l’optimisation. Cependant, les mécanismes restent opaques à l’utilisateur. Afin de répondre à ce problème, un tutoriel spécifique à la question de l’encodage et des processus mis en œuvre a d’ailleurs été réalisé. Et, Il est d’ailleurs suggéré dans la première partie de cette thèse que le premier objet soit totalement remplacé par le second bien qu’elle réponde aux questions d’optimisation et d’utilisabilité, l’approche ne satisfait que très peu les enjeux didactiques et pédagogiques et il en est de même pour les enjeux expérimentaux. Selon les besoins actuels, il est évident que la nécessité d’offrir un système flexible, adaptable et transparent afin de rendre les mécanismes intelligibles, est une priorité. De ce fait, cette approche n’est que peu convaincante. Il a été remarqué lors de la mise en œuvre du flanging ambisonique, que l’opération d’encodage peut être réalisée sous forme de patch, rendant ainsi envisageable une autre approche, plus ouverte, bien que cela soit au détriment de l’optimisation. Mais dans ce contexte cette considération peut être négligée. Il est néanmoins nécessaire de déterminer si une telle approche reste suffisamment dynamique est flexible. De plus, cette approche présentée dans la mise en œuvre du flanging ambisonique est restreinte à une représentation en deux dimensions. Aussi les mécanismes en jeu évitent les calculs récursifs des polynômes associés de Legendre, facilitant la mise en œuvre. Pour avoir réalisé cette même opération pour une représentation tridimensionnelle de l’espace sous forme de patch, notamment à destination des tutoriels, force est de constater que l’approche est alors bien plus complexe et bien moins adaptée à une utilisation musicale. Et cela d’autant plus dans un contexte de temps-réel. De l’autre côté, les trois opérations de décodage offertes par l’objet hoa.2/3d.decoder~ définissent elles aussi un système relativement optimisé et flexible, en permettant de s’adapter à différents ordres de décomposition. Et comme cela a été présenté auparavant, un travail a été réalisé afin d’optimiser les calculs matriciels, notamment pour la restitution binaurale. Néanmoins, force est de constater que cette volonté d’optimiser les processus n’est pas sans conséquences. Cette approche a multiplié la charge de travail en utilisant tout d’abord une bibliothèque tierce qui n’était pas sous licence libre – un choix évidemment non idéal que ce soit en terme d’extensibilité et modularité, mais surtout pour des questions d’accessibilité des mécanismes en mis en jeu – puis en programmant manuellement les opérations. De plus, les processus du décodage binaural ou du décodage irrégulier peuvent être assimilés à une double opération, consistant premièrement en la projection du champ sonore puis, soit en une synthèse binaurale soit en du vector base amplitude panning. Or, une partie des optimisations réside dans l’utilisation d’algorithmes qui réunissent ces deux étapes en une seule. Par cette caractéristique l’approche est encore, d’une part, bien moins intelligible et d’autre part, restrictive vis-à-vis de la capacité d’adaptabilité et d’extension du système. Ce qui limite les possibilités d’expérimentations possibles. Une approche bien plus en adéquation avec ce contexte de recherche consisterait à ne proposer qu’une opération de projection qui puisse être réalisée pour n’importe quel système de haut-parleurs, à savoir sans limitation due au fait que la discrétisation 214 de l’espace puisse être irrégulière ou sous optimale215. Puis cette approche mettrait en œuvre par la suite les systèmes de spatialisation secondaires permettant une restitution au casque, via la synthèse binaurale, ou sur un système de haut-parleurs irrégulier, via le VBAP. Envisager un tel système permettrait aussi d’expérimenter l’approche avec d’autres systèmes de spatialisation secondaires tels que le Distance Based Amplitude Panning (DBAP) [Lossius & al., 2009], [Kostadinov & al., 2010] ou le Virtual Microphone Control (ViMiC) [Braasch, 2005]. Un autre avantage serait aussi de changer plus facilement les HRIR de la synthèse binaurale permettant vraisemblablement d’offrir un rendu bien plus optimal pour de nombreuses personnes. Enfin de manière générale, l’approche serait plus pédagogique encore si l’opération de projection était réalisée sous la forme d’un patch. Il est important de noter que ce procédé a déjà été mis en œuvre pour les tutoriels, afin de présenter la restitution bidimensionnelle. Et compte tenu du caractère statique de l’opération, le résultat était relativement optimisé. Contrairement à l’opération d’encodage où les angles des sources sonores virtuelles varient en temps réel, ici, les positions des haut-parleurs sont fixes. De même, un module de VBAP adapté à l’approche ambisonique a aussi été mis en œuvre sous forme de patch pour une restitution tridimensionnelle sur le système de haut-parleurs du Stevens Institute of Technology dans le cadre de la Pd Convention 2016. Il est donc envisageable que la deuxième opération du décodage soit aussi réalisée sous forme de patch.