Généralisation des contrastes
Les approches développées dans cette thèse sont basées sur la notion de fonction de contraste. L’intérˆet de ce concept est de ramener le problème de la séparation de sources à un problème d’optimisation : une fonction de contraste —appelée aussi contraste— est un critère qui, par sa maximisation, permet d’obtenir la séparation des sources. La définition d’un contraste peut cependant légèrement différer selon le cadre dans lequel on se place (instantané, convolutif, MIMO, MISO) et les propriétés que l’on souhaite imposer au critère en question (symétrie vis à vis des ambigu¨ıtés de la séparation de sources, . . . ). La définition que nous adoptons dans ce chapitre sur les approches conjointes est la suivante :Définition 3 Une fonction de contraste (ou contraste) est une fonction réelle des sorties du système global et qui satisfait les deux conditions suivantes : (i) C((y(n))n∈Z) ≤ C((s(n))n∈Z), (ii) si C((y(n))n∈Z) = C((s(n))n∈Z), alors la séparation des sources est effective, o`u (y(n))n∈Z est la sortie du système global, résultant d’un mélange par un filtre quelconque d’un tirage du vecteur (s(n))n∈Z de sources indépendantes. Notons qu’un contraste est une fonction du filtre séparant W[z], mais que nous pourrons le considérer de fa¸con équivalente comme fonction du filtre global G[z], ou, par extension, du vecteur des sorties globales (y(n))n∈Z.
Une approche fréquentielle
Nous adoptons dans tout ce paragraphe 2.2.1 un point de vue fréquentiel. La matrice de la réponse fréquentielle du filtre de fonction de transfert M[z] sera notée M(ω). Rappelons que nous supposons les observations blanchies et par conséquent M[z] est para-unitaire, ce qui se traduit sur la réponse fréquentielle par l’unitarité de M(ω) : ∀ω M(ω)M(ω) H = IdN (2.6) Comme expliqué précédemment, le filtre séparant W[z] —de réponse fréquentielle W(ω)— est recherché dans la classe des filtres para-unitaires. Il en résulte que le filtre global G[z] —de réponse fréquentielle G(ω)— est également para-unitaire. Notons au passage une conséquence du fait que seuls des filtres para-unitaires sont considérés : l’ambigu¨ıté de filtrage scalaire indiquée dans le paragraphe 1.4.1-a) est dans ce cas une ambigu¨ıté de filtrage scalaire passe-tout et l’équation (1.8) traduisant le fait que le filtre global est séparant s’écrit : ∀ω G(ω) = Pe ıΦ(ω) (2.7) o`u Φ(ω) = Diag¡ φ1(ω), . . . , φN (ω) ¢ est une matrice diagonale réelle et P une matrice de permutation. Ce fait apparaˆıtra dans les preuves et les énoncés établissant la validité des fonctions de contrastes ici introduites. Nous citons d’abord les idées fondatrices d’une méthode de séparation fréquentielle. Le critère de diagonalisation conjointe introduit à ce propos servira de base à la construction des contrastes ensuite démontrés. Enfin, l’effet d’une discrétisation en fréquences sera considéré.
Un critère de diagonalisation conjointe
Ce paragraphe rappelle des idées présentes dans [19] et[20] et qui ont été à l’origine d’un algorithme de séparation de sources dans le cas i.i.d. Le principe est basé sur la diagonalisation conjointe de matrices, ce qui nous amènera à définir le critère (2.12). Cette mˆeme expression sera utilisée dans le paragraphe suivant afin de déduire des contrastes fréquentiels valables dans le cas de sources non i.i.d. Considérons l’inter-trispectre des observations (xi(n))n∈Z prises sur les capteurs (i, j, l1, l2) ∈ {1, . . . , N} 4 . Ce dernier s’écrit : C 4 ijl1l2 (ω1, ω2, ω3) = X (τ1,τ2,τ3)∈Z3 Cum{xi(n), x∗ j (n + τ1), xl1 (n + τ2), x∗ l2 (n + τ3)} e −ı(ω1τ1+ω2τ2+ω3τ3) .L’indépendance et la gaussianité du bruit permet d’éliminer l’influence de ce dernier au cours du calcul. L’inter-trispectre peut alors s’exprimer en fonction du filtre de mélange et du trispectre Γ 4 p (ω1, ω2, ω3) de chacune des sources (sp(n))n∈Z, p ∈ {1, . . . , N} : C 4 ijl1l2 (ω1, ω2, ω3) = X N p=1 Γ 4 p (ω1, ω2, ω3)Mip(−ω1 − ω2 − ω3)M∗ jp(−ω1)Ml1p(ω2)M∗ l2p (−ω3). (2.9) Si l’on définit C4 l1l2 (ω1, ω2, ω3) la matrice dont le (i, j)-ème élément vaut C 4 ijl1l2 (ω1, ω2, ω3) et la matrice diagonale Dl1l2 (ω1, ω2, ω3) := Diag³© Γ 4 p (ω1, ω2, ω3)Ml1p(ω2)M∗ l2p (−ω3) ª p=1,…,N ´ , (2.10) l’équation ci-dessus peut s’écrire : C4 l1l2 (ω1, ω2, ω3) = M(−ω1 − ω2 − ω3)Dl1l2 (ω1, ω2, ω3)M(−ω1) H. (2.11) Le problème de la séparation de sources peut alors ˆetre abordé de la fa¸con suivante : pour un couple de fréquences (ω2, ω3), on cherche W(−ω1 − ω2 − ω3) et W(−ω1) H, inverses estimées respectives des matrices unitaires M(−ω1 − ω2 − ω3) et M(−ω1) H, qui mènent à une diagonalisation conjointe (ou plus précisément une décomposition conjointe en valeurs singulières) de l’ensemble des matrices (C4 l1l2 (ω1, ω2, ω3))l1,l2 . Ceci est l’idée à la base d’un algorithme de séparation [20], valable uniquement dans le cas de sources i.i.d. Plus précisément, [20] suggère pour tout ω1, de rechercher W(−ω1 − ω2 − ω3) et W(−ω1) H comme étant les matrices unitaires qui maximisent : I(ω1, ω2, ω3) := X l1,l2 on(W(−ω1 − ω2 − ω3)C4 l1l2 (ω1, ω2, ω3)W(−ω1) H) (2.12) o`u on(M) représente la somme des modules au carré des termes sur la diagonale de la matrice M et (ω2, ω3) est choisi de fa¸con appropriée. Nous n’irons pas plus loin dans l’approche développée dans [20] mais la fonction I va jouer un rˆole clé dans la déduction des contrastes fréquentiels qui suivent. Notons que I(ω1, ω2, ω3) est une fonction de W(ω), c’est-à-dire du système séparant. Par souci de concision des notations, nous ne rendrons pas explicite cette dépendance ni pour I(ω1, ω2, ω3), ni pour les autres critères qui seront déduits de I(ω1, ω2, ω3). La propriété suivante de I(ω1, ω2, ω3) sera utilisée par la suite dans la démonstration de la validité des contrastes proposés. Remarque 1: Le critère I(ω1, ω2, ω3) ne réalise pas un contraste. En effet, par des raisonnements similaires à ceux qui seront donnés dans la démonstration de la proposition 1, on obtient que I(ω1, ω2, ω3) est maximum uniquement dans le cas o`u le système global sépare, mais pour seulement un couple de fréquences. Ceci n’est pas suffisant pour assurer la propriété de séparation et dans les paragraphes suivants, nous serons donc amenés à intégrer ce critère sur différents ensembles de fréquences. D’autre part, l’équation (2.14) montre de fa¸con simple que, en général, on ne peut espérer identifier la phase du système à partir de la seule maximisation de I(ω1, ω2, ω3), car la valeur de ce critère ne dépend que des modules de Gij (−ω1 − ω2 − ω3) et Gij (−ω1). Le lemme montre aussi que le critère optimisé ne dépend en fait pas des valeurs Ml1i(ω2)M∗ l2i (−ω3) qui apparaissent dans la définition de Dl1l2 (ω1, ω2, ω3). Ces valeurs sont cependant importantes dans la méthode décrite dans [20] afin de résoudre l’ambigu¨ıté de permutation.
Contrastes discrétisés
L’utilisation pratique et l’estimation numérique des contrastes fréquentiels introduits précédemment peuvent ˆetre délicates. Aussi, nous proposons d’étudier dans ce paragraphe leurs versions équivalentes après discrétisation des fréquences. Considérons le critère suivant : I¯(K) := 4π 2 K2 K X−1 p=0 K X−1 q=0 I ³ νp, νq+rp,q 2 , νq−rp,q 2 ´ (2.47) o`u pour tout p ∈ {0, . . . , K − 1}, νp = 2πp/K et pour tout (p, q) ∈ {0, . . . , K − 1} 2 , rp,q ∈ {−K + 1, . . . , K − 1}. I¯(K) est obtenu à partir de l’équation (2.23) après discrétisation sur K ∈ N ∗ points fréquentiels. Pour clarifier le liens qui existe entre I¯(K) et le critère I¯ dans (2.23), supposons que αω,ν = 2πaω,ν/P o`u P ∈ N ∗ et aω,ν ∈ {−P + 1, . . . , P − 1}. Supposons aussi que la fonction (ω, ν) 7−→ I³ ω, ν + αω,ν 2 , ν − αω,ν 2 ´ (2.48) est intégrable au sens de Riemann. Alors, en choisissant K = kP avec k ∈ N et, pour tout (p, q) ∈ {0, . . . , K − 1} 2 , rp,q = k aνp,νq , on obtient directement : limk→∞ I¯(K) = I¯. Nous allons étudier maintenant ce qui ce passe lorsque nous ne sommes pas dans les conditions asymptotiques. L’hypothèse H.5 doit d’abord modifiée comme suit : H.8 Pour tout (p, q) ∈ {0, . . . , K − 1} 2 , il existe rp,q ∈ {−K + 1, . . . , K − 1} tel que, pour au moins N − 1 sources : Γ 4 j ³ νp, νq+rp,q 2 , νq−rp,q 2 ´ 6= 0. (2.49) Nous pouvons alors donner le résultat suivant, qui peut ˆetre vu comme la forme équivalente de la proposition 1 dans le cas discrétisé : Proposition 3 Sous l’hypothèse H.8, la borne supérieure de I¯(K) est atteinte si et seulement si, pour tout p ∈ {0, . . . , K − 1}, G(νp) = P(K) e ıΦ (K) p , o`u P(K) est une matrice de permutation et o`u, pour tout p ∈ {0, . . . , K − 1}, Φ (K) p est une matrice diagonale réelle. De plus, si le système global a pour réponse impulsionnelle (gij (k))k de longueur finie, inférieure ou égale à un entier K, ce que l’on note1 : gij (k) = 0 pour k < 0 ou k ≥ K (2.50) la borne supérieure est atteinte si et seulement si la séparation est réalisée. On a alors pour tout ω, G(ω) = P e ı(Φ+Dω) o`u P est une matrice de permutation, Φ est une matrice diagonale réelle et D est une matrice diagonale à éléments entiers.