Les thechniques de reconnaissance 3D
Dans cette section, nous classons les approches de reconnaissance d’objets γD décrites dans la littérature. Cependant, cette liste n’a pas but d’être exhaustive. Afin de répondre à l’attente du sujet de notre thèse, nous détaillons plus particulièrement les approches basées sur les points d’intérêt. deux étapes: la première est l’apprentissage qui consiste à apprendre la description des objets à partir d’une base d’exemples (galerie) pour construire des classes, la seconde est la classification qui reconnait un objet inconnu (requête ou probe) à partir de sa description en lui assignant une classe. La détermination de la similitude entre les objets 3D consiste à définir une signature et une mesure de similarité. Outre la reconnaissance 3D, la recherche par le contenu ou « l’indexation 3D » s’intéresse à cette notion. L’analyse de la littérature des approches de ces deux domaines montre qu’il existe une variété de descripteurs qui dérivent de différents aspects des objets 3D. Nous avons choisi comme première répartition d’adopter celle évoquée par Zaharia et Prêteux (Zaharia, et al., 2002). Si certaines méthodes caractérisent les modèles 3D par leurs propriétés géométriques, d’autres se fondent sur les projections 2D des modèles. Ces projections 2D encodent une information tridimensionnelle. De ce fait, une distinction des descripteurs en deux familles est possible: famille des approches 3D et famille des approches 2D/3D. Une deuxième répartition, proposée par Campbell et al. (Campbell, et al., 2001), répertorie les méthodes de reconnaissance selon la nature de la représentation de la forme 3D et Dans cette partie, nous présentons dans un premier temps quelques approches 2D/3D en les subdivisant en locales et globales et dans un deuxième temps les approches 3D avec la même sous- classification de localité et globalité.
Approches 2D/3D
Parti du constat que deux modèles γD sont similaires s’ils ont le même aspect de la forme sous tous les angles de vues, le traitement direct de la forme 3D est remplacé par des projections 2D sous formes d’images de profondeur, des silhouettes ou encore de cartes de courbures (Diego, et al., 2010). En effet, les images de profondeur permettent de déduire les propriétés topologiques et structurales de l’objet et offrent ainsi une description riche de la forme 3D. Les approches globales couvrent l’information de tous les pixels de l’image. L’idée est de projeter les données initiales dans un sous-espace qui représente les données de manière optimale selon un critère précis : par exemple, dans le cas de l’ACP (analyse en composantes principales) la variance est minimisée, dans l’ACI (Analyse en Composantes Indépendantes), l’indépendance des composantes est visée, etc. L’un des avantages de ces méthodes est qu’à partir des descripteurs calculés une reconstruction du modèle original est possible. Cependant, ces approches sont sensibles aux occultations, aux variations d’illumination et de l’échelle, et aux déformations géométriques locales (expressions du visage par exemple), ce qui nécessite une étape de normalisation lors du prétraitement. Souvent, cette normalisation automatique ou manuelle (choix de points références) détériore la performance de la reconnaissance.
• Chaouch et Verroust-Blondet (Chaouch, et al., 2007) proposent de représenter un modèle 3D par 20 images de profondeur. A chaque image est associé un descripteur de lignes de profondeurs. Ces lignes sont obtenues par une méthode de mise en séquences qui part de l’espace des points pour former une séquence d’éléments. Son principe est de coder une ligne de profondeur en N états d’une séquence d’observations. Chaque observation est représentée par un état parmi 5 défini en correspondance avec 5 types de région (fond intérieur, fond extérieur, profondeur croissante, profondeur décroissante, profondeur stable). Finalement, la distance de programmation dynamique (DPD) est utilisée pour le calcul de similarité entre les descripteurs des lignes de profondeurs. • Les travaux de Vranic et Saupe (Vranic, et al., 2000) présentent le premier descripteur basé sur les images de profondeur, le « Depth Buffer-based Descriptor » (DBD). Pour assurer un comportement invariant géométriquement, chaque objet 3D est normalisé avec une ACP par rapport à un cube d’axes parallèles à ceux du repère intrinsèque à l’objet 3D. En projetant le modèle sur les six faces de ce cube, des images de profondeur sont calculées et transformées dans l’espace de Fourier en utilisant la 2D- FFT (Fast Fourier Transform). La signature de l’objet 3D est extraite en gardant les coefficients basse- fréquence pour chaque image de Fourier traitée.