L’intelligence artificielle est sans doute l’un des domaines de recherches scientifiques qui a connu une forte avancée ces dernières années. Souvent abrégée par IA. Marvin Lee Minsky a défini l’IA comme « la construction de programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisante par des êtres humains, car elles demandent des processus mentaux de haut niveau tels que : l’apprentissageperceptuelle, l’organisation de la mémoire et le raisonnement critique ». L’IA utilise des ordinateurs (avec des programmes informatiques adéquats) ou de processus électroniques élaborés afin d’imiter le comportement humain. Donc, il s’agit de reproduire l’intelligence humaine mais avec l’utilisation des machines, d’où la qualification artificielle. Les domaines traités par l’IA en général couvrent les sciences cognitives, la représentation et l’acquisition des connaissances, la robotique, la classification, la vision par ordinateur, la reconnaissance de formes, la modélisation des raisonnements .
La classification qui est l’un des axes de recherche de l’IA, consiste à trouver une application de l’ensemble des objets à classer, décrits par les variables descriptives choisies, dans l’ensemble des classes. L’algorithme ou la procédure qui réalise cette application est appelé classifieur et il doit passer par deux phases : une phase d’apprentissage et une phase de test.
Phase d’apprentissage
L’apprentissage, c’est un processus calculatoire qui doit être capable d’amener à une certaine prédiction et à une certaine généralisation. Cornuéjols, L. Miclet ont définit L’apprentissage comme : » un programme possède des capacités d’apprentissage si ses potentialités de comportement sur les données se modifient en fonction de ses performances au fur et à mesure qu’il traite les données ».
Types d’apprentissage
Il existe différents types d’apprentissages :
Apprentissage supervisé
L’apprentissage supervisé « supervised learning » est vue comme : « un programme informatique où il peut apprendre à partir de l’expérience E relativement à une classe de tâches T et à une mesure de performance P, si sa performance à traiter les tâches de T, comme mesurée par P, augmente avec l’expérience E. » [2].
Ce type est une technique d’apprentissage automatique où l’on cherche à produire automatiquement des règles à partir d’une base de données d’apprentissage contenant des « exemples ». Où L’apprentissage automatique désigne l’ensemble des changements dans un système qui lui permettent de réaliser une même tâche, ou des tâches similaires, de manière plus efficace ou plus efficiente au cours du temps [2].
Le principe d’apprentissage supervisé consiste à déterminer une nouvelle sortie 𝑌 à partir d’une nouvelle entrée 𝑋 , connaissant un ensemble de données{(𝑋1, 𝑌1), … (𝑋𝑛 , 𝑌𝑛 )}.Lorsque les 𝑌𝑖 prennent des valeurs discrètes, donc il s’agit d’un problème de classification. Par exemple en classification binaire, on cherche à attribuer à 𝑋 une étiquette 0 ou 1, tandis que des 𝑌𝑖 ont des valeurs réelles, nous plaçons dans le cadre de la régression.
On trouve deux grandes familles d’apprentissage supervisé en fonction du langage des hypothèses manipulé : les approches symboliques et les approches numériques. Les approches symboliques construisent des hypothèses dans des langages directement compréhensibles par les experts du domaine traité, comme les arbres de décision ou les bases de règles. Les approches numériques utilisent des langages de représentation moins directement interprétables comme les réseaux de neurones ou les réseaux bayesiens.
L’apprentissage supervisé est utile soit pour prédire, soit pour expliquer. Il est utile pour prédire quand l’hypothèse apprise a pour but de servir à classer correctement de nouveaux exemples non encore classés. Il est utile pour expliquer quand on s’intéresse au contenu de l’hypothèse apprise pour comprendre ce qui relie les exemples à leur classe .
Plusieurs méthodes de classification supervisée sont utilisées dans la littérature comme : Réseau de neurones, Méthode des k plus proches voisins, Arbre de décision, Machine à vecteurs de support…Etc .
Apprentissage non supervisé
Dans le domaine informatique, l’apprentissage non supervisé « clustering » est une méthode d’apprentissage automatique. Il s’agit pour un classifieur de diviser un groupe hétérogène de données, en sous-groupes de manière que les données considérées comme les plus similaires soient associées au sein d’un groupe homogène et qu’au contraire les données considérées comme différentes se retrouvent dans d’autres groupes distincts ; l’objectif étant de permettre une extraction de connaissance organisée à partir de ces données .
Ce type d’apprentissage cherche des régularités parmi un ensemble d’exemples, sans être nécessairement guidé par l’utilisation qui sera faite des connaissances apprises. Par exemple, le clustering cherche à grouper des exemples de manière à ce que les exemples au sein d’un même groupe se ressemblent suffisamment, et que les exemples de groupes différents soient suffisamment différents [2].
L’idée principale de la classification non supervisée est de classer les données en k groupes satisfaisant les deux conditions suivantes :
➤ Chaque groupe contient au moins une donnée et chaque donnée appartient à un et un seul groupe.
➤ La seconde condition impose que deux groupes ne peuvent avoir de données en commun et que les k groupes contiennent toutes les données.
Plusieurs techniques qui s’occupent de ce genre d’apprentissage on site : le K_means, carte de kohenen, classification hiérarchique ascendante et descendante…
Introduction générale |