Développement d’une Segmentation et Classification de Bio-images

Développement d’une Segmentation et Classification de Bio-images

La matrice de cooccurrence au niveau de gris (GLCM)

Cet outil statistique, introduit par Haralick en 1973 [4], est intéressant car il mesure la distribution des niveaux de gris dans l’image tout en prenant en compte les interactions spatiales entre les pixels, le GLCM, également connu sous le nom de matrice de dépendance spatiale de niveau de gris. Les fonctions GLCM caractérisent la texture d’une image en calculant la fréquence à laquelle des paires de pixels avec des valeurs spécifiques et dans une relation spatiale spécifiée apparaissent dans une image, créant un GLCM, puis extrayant des mesures statistiques de cette matrice. Contrairement aux fonctions de filtre de texture, les paramètres GLCM décrits dans l’analyse de texture ne peuvent pas fournir d’informations sur la forme, c’est-à-dire les relations spatiales des pixels dans une image. La matrice de cooccurrence au niveau de gris est une matrice carrée de taille où représente le niveau de gris de l’image.Cette approche est devenue la plus connue et la plus utilisée pour extraire des caractéristiques de textures, elle est basée sur l’occurrence répétée d’une certaine configuration de niveau de gris dans la texture qui varie rapidement avec la distance dans les textures fines et lentement dans les textures larges. La matrice de cooccurrence au niveau de gris GLCM contiennent beaucoup d’éléments (elles sont de taille 256×256 éléments pour une image sur 256 niveaux de gris) et sont donc difficilement manipulables. Il est à noter d’ailleurs que, dans la partie expérimentale suivante (chapitre 4), les images sont souvent altérées afin de ne considérer qu’une partie des niveaux de gris (8,16, 32…). Pour pourvoir analyser le résultat de ces matrices, des paramètres ont été calculés, permettant de caractériser la texture à un niveau spatial.

Extraction des caractéristiques de textures

Les caractéristiques d’une image sont définie en fonction d’une ou de plusieurs mesures, chacune d’elles spécifiant une propriété quantifiable d’un objet ou région détectée après segmentation, et calculée de manière à quantifier certaines caractéristiques significatives de notre zone pertinente. Toutes les fonctionnalités peuvent être grossièrement classées en fonctionnalités de bas niveau et en fonctionnalités de haut niveau. Les caractéristiques de bas niveau peuvent être extraites directement des images originales, tandis que l’extraction de caractéristiques de haut niveau doit être basée sur des caractéristiques de bas niveau. La texture est une propriété de surface. Elle est caractérisée par la distribution spatiale des niveaux de gris dans une région. Puisque la texture présente ses caractéristiques à la fois par les coordonnées des pixels et les valeurs des pixels, de nombreuses approches sont utilisées pour la classification des textures. La texture de l’image dépend de l’échelle ou de la résolution à laquelle elle est affichée. Une texture avec des caractéristiques spécifiques à une échelle suffisamment petite peut devenir une texture uniforme si elle est affichée à plus grande échelle. La matrice de cooccurrence au niveau de gris (GLCM) semble être une technique statistique bien connue pour l’extraction de caractéristiques. Le GLCM est une tabulation de la fréquence à laquelle différentes combinaisons de niveaux de gris peuvent apparaître dans une image. L’objectif est d’affecter une image échantillon inconnue à l’un des ensembles de classes de texture connus. Les caractéristiques de texture peuvent être des nombres scalaires, des histogrammes discrets ou des distributions empiriques. Ils caractérisent les propriétés de texture des images, telles que la structure spatiale, le contraste, la rugosité, l’orientation, etc. et ont une certaine corrélation avec la sortie désirée. Dans la reconnaissance de formes et le traitement d’images, l’extraction de caractéristiques est une forme particulière de réduction de la dimensionnalité. Lorsque les données d’entrée d’un algorithme sont trop volumineuses pour être traitées et qu’il est suspecté d’être notoirement redondant, les données d’entrée seront transformées en un ensemble de caractéristiques à représentation réduite. La transformation des données d’entrée en un ensemble de caractéristiques est appelée extraction de caractéristiques. Si les caractéristiques extraites sont choisies avec soin, on s’attend à ce que l’ensemble de caractéristiques extrait les informations pertinentes des données d’entrée afin d’effectuer la tâche souhaitée en utilisant la représentation réduite au lieu de l’entrée en taille réelle. Les fonctions contiennent souvent des informations relatives à la nuance de gris, à la texture, à la forme ou au contexte. Pour classer un objet dans une image, il faut d’abord en extraire les caractéristiques hors de l’image.

Paramètres d’Haralick basées sur le GLCM

La matrice de cooccurrence contient une masse très importante d’informations qui sont donc difficilement manipulables, de ce fait, quatorze paramètres (définis par Haralick) [4] correspondant à des caractères descriptifs des textures peuvent être calculés à partir de ces matrices. Les quatorze paramètres d’Haralick ont été utilisés pour extraire des informations de texture utiles à partir de la matrice de cooccurrence. Le calcul des paramètres d’Haralick est une étape importante pour le diagnostic automatique du cancer du sang (leucémie) en utilisant des images multispectrales. GLCM est l’un des outils les plus connus pour l’analyse de texture, estime les propriétés d’image liées aux statistiques de second ordre. Ces propriétés d’image communément appelées caractéristiques de texture d’Haralick [4], peuvent être utilisées pour la classification des images, la segmentation d’image et les applications de télédétection. Cependant, leurs calculs sont très intensifs en particulier après l’introduction des images multispectrales [132-137] comme le cas de nos images médicales microscopiques. Nous présentons les indices d’Haralick de texture extraits à partir de la matrice de cooccurrences au niveau de gris GLCM. Ces attributs sont les suivants : 1) L’énergie: ou second moment angulaire mesure l’uniformité de la texture. Elle atteint de fortes valeurs lorsque la distribution des niveaux de gris est constante ou de forme Chapitre 3 Classification par analyse texturale 67 périodique. Le déplacement correspond alors à la période. Ce paramètre est calculé comme suit: )* = + +((« , ) , ) (3.2) 2) Le contraste: est d’autant plus élevé qu’il y a des passages d’un pixel très clair à un pixel très foncé dans l’image (notion usuelle de contraste). Il est fortement non-corrélé à l’énergie. Ce paramètre est spécifié par l’équation suivante: ), = + +( » − ) ,(« , ) (3.3) 3) L’entropie: mesure le désordre dans l’image. Elle atteint de fortes valeurs pour une texture aléatoire. Elle est fortement corrélée (à l’inverse) à l’énergie. Ce coefficient est défini par l’expression suivante: ). = − + + /log
(« , )
(« , )3 (3.4) 4) La corrélation: mesure la dépendance linéaire (relativement à d) des niveaux de gris dans l’image. Elle n’est corrélée ni à l’énergie, ni à l’entropie. Ce paramètre est spécifié par l’équation suivante: )4 = +
(« , ) 5 6 6 7 ( » − 8 ) − 8 9: ,: , ; < < > = ,?* (3.5) Avec : @ A B A C 8 = + » (« , ) > ,?* 8 = + (« , ) > ,?* (3.6) Et : Chapitre 3 Classification par analyse texturale 68 @ A B A C : , = + (« , )( » − 8 ) , > ?* : , = + (« , ) − 8 , > ,?* (3.7) 5) Homogénéité: traduit le fait que l’on rencontre souvent ou non le même couple de pixels séparé par la translation. Elle est élevée si l’image est un niveau de gris uniforme ou quand l’image a un motif de période suivant une direction. )G = + +(« , ) 1 + ( » − ) , (3.8) 6) Variance : La variance mesure la répartition des niveaux de gris autour de la valeur moyenne. Plus ce paramètre est élevé et plus importants sont les écarts entre les valeurs et la moyenne.

Moment différentiel inverse

Ce paramètre a un comportement inverse de celui du contraste. En effet, plus la texture possède de régions homogènes et plus le moment différentiel inverse est élevé. ).Tous ces attributs sont définis pour une valeur de déplacement, le choix de ce paramètre est très important, quant à l’obtention d’un résultat de qualité. Pour chaque pixel nous définissons un vecteur d’attribut h (énergie, entropie…). Étant donné que nous avons 14 paramètres d’Haralick pour chaque matrice de cooccurrences au niveau de gris GLCM, nous disposons de 112 attributs de texture pour le choix de 8 matrice par exemple (14 × 8), et ce, pour chaque niveau de gris. Le nombre Chapitre 3 Classification par analyse texturale 70 total d’attributs étant très important, il convient d’effectuer une sélection d’attributs afin de réduire la taille de l’image traitée par la représentation des attributs les plus pertinents sur le résultat des travaux déjà traiter dans la littérature [4-6] et [117-124].

Conclusion

Tout au cours de ce chapitre, nous avons vu une description théorique concernant la classification par analyse texturale avec un état d’art bien détaillé durant les quarantaines d’années précédentes, puis nous avons exposé. L’objectif de ces travaux qui caractérisent les textures présentes dans des images multispectrales en utilisant les attributs d’Haralick extraits de la matrice de cooccurrence au niveau de gris GLCM. Il s’agit en particulier de calculs automatiques. Cette étude théorique des travaux des chercheurs nous permet à sélectionner les indices de texture les mieux adaptés à la classification des images par l’analyse de textures. Les attributs de texture retenus pour ce projet sont les matrices de cooccurrences et plus précisément les indices d’Haralick extraits de ces matrices qui sont l’énergie, le contraste, l’entropie, la corrélation et l’homogénéité. Les résultats obtenus par application du GLCM seront abordés dans le chapitre suivant où nous démontrons la possibilité d’effectuer une détection et une classification automatique efficace à partir de l’extraction de seulement cinq paramètres d’Haralick [125-131]. Dans l’implémenterons de la partie expérimentale, nous présenterons une mise en œuvre des algorithmes développés (segmentation et classification) sur un outil logiciel destiné à l’aide au diagnostic biomédical pour la détection des cellules sanguines anormales.

Table des matières

Introduction générale
1. Cadre général
2. Problématique de la thèse
3. Objectif de la thèse
4. Structure de la thèse
5. Perspectives de la thèse
Chapitre 1 : Etude bibliographique dans un contexte médical
1.1 Introduction
1.2 Compositions du sang
1.2.1 Globules rouges ou hématies ou érythrocytes
1.2.2 Globules blancs ou leucocytes
1.2.2.1 Polynucléaires ou granulocytes
1.2.2.2 Lymphocytes
1.2.2.3 Monocytes
1.2.3 Les plaquettes
1.3 Cancer du sang
1.3.1 La leucémie
1.3.2 Types de la leucémie
1.4 Processus d’acquisition de bio-images
1.4.1 Prélèvement de sang et préparation d’un frottis sanguin
1.4.1.1 Obtention d’un échantillon de sang
1.4.1.2 Propagation manuelle dans une lame de verre
1.4.1.3 Coloration du frottis sanguin
1.5 Conclusion
Chapitre 2 : Segmentation de bio-images couleur
2.1 Introduction
2.2 Les espaces couleur
2.2.1 Systèmes de primaires
2.2.1.1 L’espace couleur réel RVB
2.2.1.2 L’espace couleur virtuel XYZ
2.2.2 Systèmes luminance-chrominance
2.2.2.1 L’espace couleur L*u*v
2.2.2.2 L’espace couleur L*a*b
2.2.3 Systèmes perceptuel
2.3 Qu’est-ce que la segmentation ?
2.3.1 Définition littéraire de la segmentation
2.3.2 Définition formelle de la segmentation
2.4 Approches de segmentation de bio-images couleur : état de l’art
2.4.1 Les algorithmes de clustering
2.4.1.1 K-means
2.4.1.1.1 Principe de fonctionnemen
2.4.1.1.2 Algorithme k-means
2.4.1.2 Fuzzy c-means (FCM)
2.4.1.2.1 Principe de fonctionnement
2.4.1.2.2 Algorithme fuzzy c-means
2.4.1.3 Avantages et inconvénients de clustering
2.4.2 Croissance de région (region growing)
2.4.2.1 Principe de fonctionnement
2.4.2.2 Algorithme region growing
2.4.3 Eléments de la morphologie mathématique
2.4.3.1 Principe de fonctionnement
2.5 Conclusion
Chapitre 3 : Classification par analyse texturale
3.1 Introduction
3.2 Qu’est-ce qu’une texture ?
3.3 Classification par analyse texturale : état de l’art
3.4 La matrice de cooccurrence au niveau de gris (GLCM)
3.4.1 Extraction des caractéristiques de textures
3.4.1.1 Paramètres d’Haralick basées sur le GLCM
3.5 Conclusion
Chapitre 4 : Résultats expérimentaux et discussions
4.1 Introduction
4.2 Environnement de programmation
4.3 Description des bases d’images
4.3.1 Base d’images Hematocell
4.3.2 Base d’images ALL-IDB
4.4 Méthodologies
4.4.1 La méthode de segmentation et classification développé
4.4.1.1 Phase d’acquisition
4.4.1.2 Phase de prétraitement
4.4.1.2.1 Etape de redimensionnemen
4.4.1.2.2 Etape de filtrage
4.4.1.2.3 Conversion RVB en L*a*b
4.4.1.3 Phase de segmentation
4.4.1.4 Phase de post traitement
4.4.1.4.1 Comptage des cellules cancéreuses
4.4.1.4.2 Extraction des paramètres de forme
4.4.1.4.2.1 Le centre de gravité
4.4.1.4.2.2 La surface
4.4.1.4.2.3 Le périmètre
4.4.1.5 Evaluation de la méthode développée
4.4.2 Analyse texturale par GLCM
4.4.2.1 Prétraitement
4.4.2.2 Extraction des attributs de texture
4.5 Conclusion