Prétraitement d’image pour la reconnaissance de caractère

Introduction sur l’image numérique

On désigne sous le terme d’image numérique toute image (dessin, icône, photographie…) acquise, créée, traitée ou stockée sous forme binaire (c’est-à-dire composé 0 et de 1).
Acquise par des convertisseurs analogique numérique situés dans des dispositifs comme les scanners, les appareils photo ou caméscopes numériques, les cartes d’acquisition vidéo (qui numérisent directement une source comme la télévision).
Créée directement par des programmes informatiques, via la souris, les tablettes graphiques ou par la modélisation 3D (ce que l’on appelle par abus de langage les « images de synthèse »). Traitée grâce à des outils informatiques. Il est facile de la transformer, modifier en taille, en couleur, d’ajouter ou supprimer des éléments, d’appliquer des filtres variés, etc. Stockée sur un support informatique (disquette, disque dur, CD-ROM…)
Historique : En 1672, Isaac Newton démontre à l’aide du prisme que la lumière blanche procède de l’addition de toutes les couleurs (Newton dénombrera sept couleurs, nombre arbitraire et culturellement marqué).
En 1839, l’année de la naissance de la photographie, Michel Eugène Chevreul publie un livre expliquant les effets optiques produits par les couleurs et leur juxtaposition, c’est-à-dire non pas la superposition de couches colorées (filtres) ou le mélange de couleurs, mais l’effet produit par des couleurs différentes mises côte à côte et vues de loin.
En 1869 (le 7 mai précisément), sans se connaître et sans avoir travaillé ensemble, Louis Ducos du Hauron et Charles Cros proposent à la Société française de photographie un procédé de leur invention qui permet d’obtenir des clichés en couleurs. Tous ces travaux marquent Georges Seurat, le créateur du pointillisme (ou néo-impressionnisme), et sont à l’origine de l’impression en couleurs ou encore de la télévision en couleurs.

Les applications liées à l’imagerie

L’imagerie est un domaine très vaste parmi lequel, on peut distinguer plusieurs catégories: Traitements et interprétation des images : Codage/compression, Amélioration d’images, Vision par ordinateur ou vision artificielle: Métrologie, Contrôle, Identification, Interprétation.
Image calculée : Graphisme 2D et 3D, Infographie, Réalité virtuelle
Capteurs d’images : Vidéo thermique, Imagerie X, Imagerie d’écho, Imagerie de comptage. C’est aussi un domaine pluridisciplinaire qui fait appel à : Traitement du signal, Analyse numérique, Informatique, Théorie de l’information, Etude statistique, Optique, Electronique.
Les applications sont aussi très variées et s’étendent de jour en jour : Imagerie biomédicale: compter des cellules dans des images microscopiques, Identification de personnes : reconnaître des empreintes digitales, des visages, Authentification (de billets de banque par exemple…), Aide à la conduite : guidage latéral de véhicule, Surveillance de la qualité d’une chaîne de production, Reconnaissance de l’écriture, Indexation d’images : organiser automatiquement des grandes bases d’images en fonction de leur contenu.

Images matricielles (ou images bitmap)

Les images bitmap sont constituées par un ensemble de petits carrés appelés ‘pixels’.Une image matricielle (ou image en mode point, ou en anglais une « bitmap » ou « raster ») est une image numérique dans un format de données qui se compose d’un tableau de pixels ou de points de couleur, généralement rectangulaire, qui peut se visualiser sur un moniteur d’ordinateur, tout autre dispositif d’affichage, ou simplement sur une feuille de papier.
Un pixel (abréviation de picture element : élément d’image) est le plus petit élément constituant une image bitmap, et chacun d’entre eux possède une couleur quelconque de valeur entre 0 et 255, et en rassemblant ces pixels on obtient notre image matricielle. Ces derniers ne sont pas visibles à l’œil nu, sauf si l’image est agrandie.
Images 2D : Dans le cas des images à deux dimensions (qu’on trouve le plus souvent), les points sont appelés pixels. D’un point de vue mathématique, on considère l’image comme une fonction de.. dans. où le couplet d’entrée est considéré comme une position spatiale, le singleton de sortie comme un codage. Ce type d’image s’adapte bien à l’affichage sur écran informatique (lui aussi orienté pixel) ; il est en revanche peu adapté pour l’impression, car la résolution des écrans informatiques, généralement de 72 à 96 ppp (« points par pouce », en anglais dpi) est bien inférieure à celle atteinte par les imprimantes, au moins 600 ppp aujourd’hui. L’image imprimée, si elle n’a pas une haute résolution, sera donc plus ou moins floue ou laissera apparaître des pixels carrés visibles.
Images 2D + t (vidéo), images 3D, images multi-résolution : Lorsqu’une image possède une composante temporelle, on parle d’animation. Dans le cas des images à trois dimensions les points sont appelés des voxels. Ils représentent un volume.
Ces cas sont une généralisation du cas 2D, la dimension supplémentaire représentant respectivement le temps, une dimension spatiale ou une échelle de résolution. D’un point de vue mathématique, il s’agit d’une fonction de . . . dans.
Images vectorielles : Une image vectorielle (ou image en mode trait), en informatique, est une image numérique composée d’objets géométriques individuels (segments de droite, polygones, arcs de cercle, etc.) définis chacun par divers attributs de forme, de position, de couleur, etc. Elle se différencie de cette manière des images matricielles (ou « bitmap »), sur lesquelles on travaille au niveau des pixels.
Le principe est de représenter les données de l’image par des formules géométriques qui vont pouvoir être décrites d’un point de vue mathématique. Cela signifie qu’au lieu de mémoriser une mosaïque de points élémentaires, on stocke la succession d’opérations conduisant au tracé.

Propriétés d’une image numérique

Résolution et dimension : Une image est définie par le nombre de points la composant. En image numérique, cela correspond au nombre de pixels qui compose l’image en hauteur (axe vertical) et en largeur (axe horizontal) : 206 pixel par 345 pixel par exemple, abrégé en « 206 346 ».
résolution : La résolution d’une image est définie par un nombre de pixels par unité de longueur de la structure à numériser (classiquement en ppp). Ce paramètre est défini lors de la numérisation (passage de l’image sous forme binaire), et dépend principalement des caractéristiques du matériel utilisé lors de la numérisation. La résolution d’une image numérique définit le degré de détail de l’image. Ainsi, plus la résolution est élevée, meilleure est la restitution.
Cependant, pour une même dimension d’image, plus la résolution est élevée, plus le nombre de pixels composant l’image est grand. Le nombre de pixels est proportionnel au carré de la résolution, étant donné le caractère bidimensionnel de l’image : si la résolution est multipliée par deux, le nombre de pixels est multiplié par quatre.
Représentation des couleurs : Il existe plusieurs modes de codage informatique des couleurs, le plus utilisé pour le maniement des images est l’espace colorimétrique RVB ou RGB. Cet espace est basé sur une synthèse additive des couleurs, c’est-à-dire que le mélange des trois composantes R, V, et B à leur valeur maximum donne du blanc, à l’instar de la lumière. Le mélange de ces trois couleurs à des proportions diverses permet de reproduire à l’écran une part importante du spectre visible, sans avoir à spécifier une multitude de fréquences lumineuses.
Il existe d’autres modes de représentation des couleurs : CMJN ou CMYK utilisé principalement pour l’impression, et basé sur une synthèse soustractive des couleurs ; TSL ou HSL, où la couleur est codée suivant le cercle des couleurs ; base de couleur optimale YUV, Y représentant la luminance, U et V deux chrominances orthogonales.
Formats d’image : Un format d’image est une représentation informatique de l’image, associée à des informations sur la façon dont l’image est codée et fournissant éventuellement des indications sur la manière de la décoder et de la manipuler. Un format d’image comprend en général un en-tête qui contient des données sur l’image (taille de l’image en pixels par exemple) suivie des données de l’image. La structuration des données est différente pour chaque format d’image.

Table des matières

INTRODUCTION
CHAPITRE I. Introduction sur l’image numérique
I 1. Introduction
I 2. Définitions
I.2.1. Historique
I.2.2. Les applications liées à l’imagerie
I.2.3. Images matricielles (ou images bitmap)
I.2.4. Images vectorielles
I 3. Propriétés d’une image numérique
I.3.1. Résolution et dimension (ou définition)
I.3.2. Représentation des couleurs
I.3.3. Formats d’image
I 4. Histogramme
I.4.1. Définition
I.4.2. Propriétés
I.4.3. Histogramme Image niveau de gris
I 5. Traitements par histogramme
I.5.1. Rehaussement d’image
I.5.2. Mesures de similarité
CHAPITRE II. Traitement d’image matricielle
II.1. Introduction
II.2. Filtrage d’image
II.2.1. Le filtrage d’histogramme
II.2.2. Application de filtre sur une image
II.3. Binarisation
II.3.1. Définition et principe
II.3.2. Critère d’Otsu
II.4. Segmentation d’image
II.4.1. Introduction et définition
II.4.2. Segmentation par croissance de région
CHAPITRE III. SIMULATION
III.1. Outils de développement
III.1.1. DevC++
III.1.2. Open CV
III.2. Le logiciel EN-ROC
III.3. Les étapes de la reconnaissance optique de caractère avec EN-ROC
III.3.1. L’acquisition
III.3.2. Binarisation
III.3.3. Le filtrage
III.3.4. La segmentation en lignes du texte par histogramme horizontal
III.3.5. La segmentation en caractères
III.3.6. La reconnaissance proprement dite des caractères
III.4. Présentation du logiciel EN-ROC
CONCLUSION ET PERSPECTIVE
ANNEXE 1 La méthode de Otsu
ANNEXE 2 La squelettisation
ANNEXE 2 Le produit de convoluition
REFERENCE