Etat de l’art de la séparation aveugle de sources audio
Dans ce chapitre, nous présentons un état de l’art des principales méthodes de séparation aveugle de sources. Nous nous concentrerons ensuite sur les méthodes qui ont été appliquées dans le cadre de l’audition des robots. Mais tout d’abord, nous commençons par le modèle de mélange et les principales notations que nous adopterons le long de ce rapport.où n (t) est un vecteur de bruit stationnaire. Nous considérons un bruit diffus, spatialement décorrélé, dont l’énergie est supposée être négligeable par rapport à celle des sources. Si le bruit est ponctuel, il sera considéré comme une source sonore. Ce scénario correspond à notre processus expérimental et à l’application finale.où n (t) est un vecteur de bruit stationnaire. Nous considérons un bruit diffus, spatialement décorrélé, dont l’énergie est supposée être négligeable par rapport à celle des sources. Si le bruit est ponctuel, il sera considéré comme une source sonore. Ce scénario correspond à notre processus expérimental et à l’application finale.Dans le domaine fréquentiel, quand la longueur de la fenêtre d’analyse Nf de la Transformée de Fourier à Court Terme (TFCT) est au moins deux fois plus grande que la longueur L des filtres de mélanges (les réponses impulsionnelles), le mélange convolutif est approché à un mélange instantané à chaque fréquence f . Le problème de séparation devient donc plus simple que celui posé dans le domaine temporel etnous estimons des matrices de séparation au lieu de filtres de séparation dont la longueur devient importante si nous travaillons avec des signaux réels.
La séparation de sources dans le domaine fréquentiel présente un avantage par rapport à la séparation de sources dans le domaine temporel qui est l’estimation de matrices de séparation au lieu de filtres, ce qui engendre des algorithmes de sé- paration plus simples et donc plus rapides. Cependant, travailler dans le domaine fréquentiel présente deux problèmes bien connus : le problème d’échelle et le pro- blème de permutation. Ces problèmes se traduisent en écrivant l’équation (2.3) des sources estimées dans le domaine temps-fréquence sous la forme :Problème de permutation L’ordre des sources estimées peut être différent à des fréquences adjacentes. Ceci est modélisé par la multiplication des sources originales dans le domaine fréquentiel S (f; k) par une matrice de permutation P(f ). Si le pro- blème de permutation n’est pas résolu, la reconstruction dans le domaine temporel d’une source donnée contiendra des contributions des autres sources.Problème de permutation L’ordre des sources estimées peut être différent à des fréquences adjacentes. Ceci est modélisé par la multiplication des sources originales dans le domaine fréquentiel S (f; k) par une matrice de permutation P(f ). Si le pro- blème de permutation n’est pas résolu, la reconstruction dans le domaine temporel d’une source donnée contiendra des contributions des autres sources.
Le livre de Pierre Comon and Christian Jutten [24] présente un bon résumé de l’histoire de la séparation de source dont voici les principaux points. Le problème de la séparation de sources a été formulé pour la première fois en 1982 par Bernard Ans, Jeanny Hérault et Christian Jutten dans le cadre de la modélisation neuronale pour le décodage de mouvements dans les vertèbres. A Grenoble en septembre 1987, les acteurs sont J.F. Cardoso, J. Hérault, P. Comon et C. Jutten. Lors d’un work- shop, J.F. Cardoso visite J. Hérault et C. Jutten qui lui expliquent le principe de la séparation de sources et lui montrent une démonstration en temps-réel accompli par un appareil purement analogique que C. Jutten a construit en 1985. L’appareil était capable de séparer en temps-réel deux sources audio dans un mélange contrôlé par un potentiomètre. Immédiatement mais indépendamment, J.-F. Cardoso et P. Comon deviennent très enthousiastes à propos de la séparation aveugle de sources audio. Ensuite en 1990, le problème de séparation de sources a été traité par plu- sieurs chercheurs de plusieurs domaines : traitement de signal, statistique, réseau de neurones, etc, … En 1991, le premier papier international consacré à ce problème a été publié dans le journal Signal Processing et en 1999, la première conférence in- ternationale complètement dédiée à la séparation aveugle de sources a été organisée à Aussois dans les Alpes Français et a attiré 130 chercheurs du monde entier.