La reconnaissance des caractères est souvent considérée comme l’un des principaux problèmes d’apprentissage du réseau neuronal. Ce chapitre sera totalement consacré à la présentation de la reconnaissance des chiffres qui est la base de notre travail.
Comme nous n’avons pas pu trouver des travaux identiques à notre problématique, de reconnaissance des chiffres des compteurs électroniques de tours présents dans les administrations algériennes, nous nous focaliserons sur des travaux similaires comme la reconnaissance des chiffres des plaques minéralogiques.
Détection et reconnaissance des plaques minéralogiques
La lecture automatique de plaques minéralogiques ou Lecture automatisée de plaques d’immatriculation, consiste à mettre en place une combinaison de moyens électroniques et informatiques, en utilisant des techniques de traitement d’images et de vision par ordinateur, pour extraire le numéro d’identification d’après l’image de la plaque, sous format de caractères. La figure (3:1) illustre un exemple d’un système de reconnaissance 1.
Éléments d’un système typique de lecture automatique de plaques minéralogiques
Camera
Elle sert à prendre une image du véhicule [29].
Éclairage
C’est une lumière projetée sur la scène, pour éclairer la plaque. Ce système permet une utilisation du jour comme de la nuit du système de reconnaissance [29].
Ordinateur
Un ordinateur qui exécute le système de reconnaissance, lit l’image, identifie et détecte la plaque dans l’image [29].
Domaines d’application du système de lecture automatique de plaques minéralogiques Il existe de nombreuses applications qui utilisent de tels systèmes de reconnaissance, dont certaines sont décrites ci-dessous .
Contrôle de vitesse
Le numéro d’immatriculation est utilisé pour imposer une amende aux véhicules qui roulent à grande vitesse, à l’utilisation illégale des voies et à la détection de véhicules volées ou recherchées [30]. La figure (3:2) montre un exemple de voiture capturée .
Contrôle d’accès au parking
Le système est utilisé pour l’entrée automatique au parking, pour les membres déjà enregistrés, ou dans certains cas, pour le calcul des frais de stationnement des voitures.
Lorsque une voiture entre, la plaque d’immatriculation est reconnue et marquée. A la sortie, elle est relue et la durée de stationnement est facturée pour le conducteur [30]. La figure (3:3) illustre un parking contrôlé par une application.
Contrôle Passage aux frontières
Cette application aide le registre des entrées ou des sorties dans un pays et peut être utilisée, pour surveiller les postes frontières [30]. Cette installation est illustrée à la figure (3:4). Chaque information de véhicule est enregistrée dans une base de données.
Acquisition de l’image
La première étape consiste à acquérir l’image ou tout simplement, à capturer des images et des vidéos du véhicule lors de son passage.
Pré-traitement d’image
Cette étape consiste à traiter l’image, principalement, la convertir en niveau de gris pour que la phase du Deep Learning soit plus rapide. Une image en niveaux de gris de M pixels de hauteur et de N pixels de largeur est représentée par une matrice de type de données double de taille M * N, dont les valeurs ont été mises à l’échelle pour représenter les intensités. Chaque valeur de pixel des images en niveaux de gris, est comprise entre 0 (noir) et 255 (blanc), Voici deux méthodes pour convertir une image en niveau de gris .
Extraction de la plaque d’immatriculation
L’étape suivante consiste à extraire la plaque d’immatriculation de l’image. Pour cela, il existe différentes méthodes, qui se basent sur la recherche des caractéristiques de la plaque dans l’image comme la couleur, la forme etc [32]. Pour détecter la position de la plaque dans l’image, il existe différentes méthodes pour l’extraction de la plaque qui peuvent être classées en différentes catégories .
Extraction basée sur le détecteur YOLO
YOLO (You Only Look Once ) est l’un des algorithmes les plus rapides pour la détection d’objet qui est basé sur un réseau de neurone profond [33], son principe est simple : il faut entraîner ce réseau sur un ensemble d’images annotées à la main, c’est-à-dire déterminer la position de l’objet à extraire, puis après l’entraînement l’algorithme va détecter automatiquement la position de l’objet. Un exemple est illustré dans la figure (3:7) :
Extraction basée sur le contour
Étant donné, que la plaque d’immatriculation a normalement une forme rectangulaire avec un rapport d’aspect connu, elle peut être extraite en trouvant tous les rectangles possibles dans l’image.
Les méthodes de détection des contours sont couramment utilisées pour trouver ces rectangles. Le filtre Sobel est utilisé pour détecter les bords. En raison de la transition de couleur entre la plaque d’immatriculation et la carrosserie, la limite de la plaque d’immatriculation est représentée par des bords dans l’image. Les bords des plaques d’immatriculation doivent être continus [35].
Extraction basée sur les caractéristiques globales de l’image
L’analyse des composants connectés (CCA) est une technique importante dans le traitement d’images binaires. Elle scanne une image binaire et étiquette ses pixels en composants, en fonction de la connectivité des pixels (Mesures spatiales), telles que l’aire et le rapport d’aspect, sont l’utilisant couramment pour l’extraction de plaques d’immatriculation.
Les objets connectés, qui ont les mêmes caractéristiques géométriques que la plaque, sont choisis pour être candidats.
Cet algorithme peut échouer dans le cas d’images de mauvaise qualité, ce qui entraîne des contours déformés.
La corrélation croisée 2D est utilisée pour trouver les plaques d’immatriculation.
La corrélation croisée 2D avec un modèle de plaque d’immatriculation pré-enregistrée est effectuée sur toute l’image pour localiser la zone de plaque d’immatriculation la plus probable.
L’extraction de plaques d’immatriculation à l’aide de la corrélation avec un modèle est indépendante de la position de la plaque d’immatriculation dans l’image. Cependant, la corrélation croisée 2D prend du temps [35].
Extraction basée sur la texture
Ce type de méthode dépend de la présence des caractères dans la plaque d’immatriculation, ce qui entraîne un changement dans le niveau de gris entre la couleur des caractères et la couleur de fond de plaque. Il en résulte également, une zone de densité de bord élevée en raison de la transition de couleur.
Les filtres de Gabor sont l’un des principaux outils de l’analyse de texture. Cette technique a l’avantage d’analyser la texture dans des orientations et des échelles illimitées.
Cependant, cette méthode prend du temps.
La fréquence spatiale est identifiée en utilisant la transformée de Fourier discrète (DFT) et la transformée en ondelettes (DWT), car elles produisent des harmoniques qui sont détectées dans l’analyse du spectre. La DFT et la DWT sont utilisées, de manière rangée, pour détecter la position horizontale de la plaque et de manière colonne pour détecter la position verticale.
Toutes les méthodes basées sur la texture ont l’avantage de détecter la plaque d’immatriculation même si sa limite est déformée. Cependant, ces méthodes sont complexes sur le plan informatique, en particulier lorsqu’il y a de nombreux bords, comme dans le cas d’un fond complexe ou dans des conditions d’éclairage différentes [35].
Extraction basée sur les caractéristiques de la couleur
Étant donné que certains pays ont des couleurs spécifiques pour leurs plaques d’immatriculation, certains travaux impliquent l’extraction de plaques d’immatriculation en localisant leurs couleurs dans l’image.
L’idée de base est que la combinaison de couleurs d’une plaque est unique, et cette combinaison se produit presque uniquement dans une région de plaque [35].
Reconnaissance des caractères
Après l’extraction de la plaque d’immatriculation, la dernière étape du processus de la lecture automatique des plaques minéralogiques est la reconnaissance des chiffres de la plaque minéralogique. Pour cela, nous allons présenter quelques modèles de la littérature concernant cette problématique.
Modèle de Selmi et al Configuration du modèle
Le tableau (3.2) illustre l’architecture du modèle proposé [36].