MACHINE LEARNING
Le Machine learning (ML) (en fran¸cais apprentissage automatique) est un sousensemble de l’intelligence artificielle (IA), qui permet aux ordinateurs d’apprendre, de s’adapter, d’extrapoler des modèles et de communiquer entre eux sans être explicitement programmés pour le faire. L’intelligence artificielle est un terme large qui désigne des systèmes ou des machines imitant l’intelligence humaine. Son but est de permettre à des ordinateurs de penser et d’agir comme des êtres humains. Le ML et l’IA sont souvent abordés ensemble, et les termes sont parfois utilisés de manière interchangeable, mais ils ne veulent pas dire la même chose. Une distinction importante est que, même si l’intégralité du machine learning repose sur l’intelligence artificielle, cette dernière ne se limite pas au machine learning.
Principes
La machine utilise des algorithmes pour pouvoir procéder à toutes ces solutions en un temps limité. L’ordinateur 1 va donc analyser les données disponibles et adapter ce qu’il y a en réponses. Ainsi, le machine learning permettra d’analyser, voir, reconnaˆıtre et comprendre toutes les données qu’on lui transmet. L’apprentissage automatique ne se résume pas à un ensemble d’algorithmes mais suit une succession d’étapes. 1. Un système de traitement de l’information programmable et qui fonctionne par la lecture séquentielle d’un ensemble d’instructions, organisées en programmes, qui lui font exécuter des opérations logiques et arithmétiques. Figure 3.1 – Etapes d’un projet d’apprentissage automatique
Les avantages • La quantité : il est possible de traiter un très grand nombre de données. Certains programmes permettent même d’estimer la réussite ou l’échec d’un programme ou d’un projet. • La rapidité : Traite les données en un temps record ! Et ainsi, ¸ca nous permet de mieux gérer les changements. • L’automatisation : il est possible de gérer des méga processus très facilement grˆace au machine learning car il permet de faire fonctionner les programmes de fa¸con autonome. • L’individualité : lors de l’utilisation de programmes avec le machine learning, il est possible d’entrer des milliers de données et de laisser la machine les traiter. Chose qui est difficile lorsqu’on travaille avec les anciennes méthodes. • La performance : qui correspond à la véracité des résultats. L’optimisation de la performance se fait en améliorant le modèle.
Afin d’enseigner aux machines comment résoudre un grand nombre de problèmes par eux-mêmes, nous devons considérer les différents modèles d’apprentissage automatique.Les techniques d’apprentissage machine sont utilisés pour les aidez à faire des prédictions basées sur des expériences et des données. Il existe différents types d’apprentissage automatique qui sont entre autres :
LES TYPES D’APPRENTISSAGE ET ALGORITHMES
Apprentissage supervis
é L’apprentissage supervisé est l’endroit o`u un ensemble de données connu est utilisé pour classer ou prédire avec des données en main. Elles apprennent à partir des données étiquetées, puis utilisent les informations pour prendre des décisions sur les données de test. Pour chaque donnée, le résultat est connu. Voici quelques-uns des plus utilisés algorithmes d’apprentissage automatique supervisés. Classificateurs bayésiens Naive Bayes, couramment utilisé dans l’apprentissage automatique, est une collection d’algorithmes de classification basés sur le théorème de Bayes. Le théorème de Bayes est un résultat de base en théorie des probabilités 2 . Etant ´ donné deux événements A et B, le théorème de Bayes permet de déterminer la probabilité de A sachant B, si l’on connaˆıt les probabilités P(A), P(B) avec P(B) supérieure strict à 0 et P(B|A). (Formule de Bayes [41]) p(A|B) = p(A ∩ B) p(B) = p(A)p(B|A) p(B) . Pour Naive Bayes, chaque caractéristique classée est indépendante de la valeur de toute autre caractéristique. Cependant, les
caractéristiques ne sont pas toujours indépendantes, ce qui est souvent per¸cu comme un inconvénient de l’algorithme Naive Bayes et c’est pourquoi il est appelé «na¨ıf». Il peut souvent surperformer les algorithmes les plus complexes et est extrêmement utile dans les applications courantes telles que la détection de spam et la classification de documents.