Projet Kidlearn
optimisation de séquences d’apprentissage avec le Machine Learning
Il y a plusieurs approches pour optimiser les séquences d’apprentissage. On peut notamment le faire à la main à l’aide de connaissances didactiques et de l’expé rience de l’enseignement du domaine concerné. Ici, il s’agit d’une optimisation la plus automatique possible, avec le minimum d’hypothèses sur les étudiants et de connaissances du domaine. C’est un domaine actif de recherche et les propositions y sont variées, on peut en juger avec (K. KOEDINGER et al., 1997; K. R. KOEDINGER et al., 2013; NKAMBOU et al., 2010).
Le Processus de Décision de Markov Partiellement Observable (POMDP) a été envi sagé comme cadre de référence pour sélectionner les activités optimales à proposer aux étudiants en fonction de l’estimation de leur niveau d’acquisition de chaque compétence (RAFFERTY et al., 2011).
En général, la solution à un POMDP est un problème difficile à résoudre et des solutions approchées sont proposées en utili sant le concept d’ »envelope states » (Emma BRUNSKILL et RUSSELL, 2012) qui, au lieu de chercher à identifier précisément les unités de connaissances complètes, ne considèrent que des groupements de ces unités.
Dans la plupart des cas, le modèle tuteur intègre le modèle apprenant. Par exemple, dans les approches fondées sur les POMDP, l’optimisation des séquences d’apprentissage est faite en utilisant un modèle apprenant interne, donc en considérant que tous les élèves apprennent de la même manière.
Ces approches sont potentiellement optimales mais nécessitent un bon modèle cog nitif et apprenant, POMDP décrivant alors la trajectoire optimale basée sur ce mo dèle des étudiants. Pour ce modèle, de nombreuses approches utilisent des mé thodes de Knowledge Tracing (CORBETT et J. ANDERSON, 1994), ou des variantes, certaines de celles-ci cherchant à estimer les paramètres concernés
Typiquement, ces modèles ont de nombreux paramètres, et l’identification de tous ces paramètres pour un seul étudiant est un problème très complexe à résoudre en raison du manque de données disponibles et de la difficulté d’identifier de nom breux paramètres (Joseph E BECK et Kai-min CHANG, 2007; Joseph E BECK et XIONG, 2013). Dans la pratique, il en résulte souvent des modèles incorrects ou imprécis.
Une autre difficulté est que ces méthodes de planification sont prévues pour une population d’étudiants et non pour un étudiant en particulier, ce qui en dégrade fortement l’intérêt (J. LEE et E. BRUNSKILL, 2012). D’autres approches font appel à l’apprentissage par renforcement pour fournir des conseils au cours des activités (BARNES et al., 2011),
et améliorer l’adaptation des stratégies pédagogiques (CHI et al., 2011), ou utilise des réseaux bayésiens pour modéliser et décider comment aider les élèves (GERTNER et al., 1998). D’autres ap proches considèrent une optimisation globale de la séquence d’apprentissage basée sur les données de tous les étudiants, en utilisant des algorithmes d’optimisation de colonies de fourmis (SEMET et al., 2003), mais ne peuvent fournir une séquence personnalisée. Plusieurs chercheurs ont déjà utilisé le concept de Zone Proximale de Développe ment (ZPD)pourconcevoir des stratégies d’apprentissage de STI,
fondé sur les prin cipes fondamentaux de la pédagogie (LUCKIN, 2001), ou ont utilisé des méthodes d’exploration des données (SCHATTEN et al., 2014). Notre travail se distingue de ces approches en ce que la ZPD est initialement et approximativement définie par un expert puis gérée dynamiquement et automatiquement par le système. 3.5 Scénario d’apprentissage Dans cette section, nous présentons le scénario d’apprentissage utilisé et le pro tocole expérimental des expérimentations menées. Afin d’évaluer nos algorithmes,
Scénario d’apprentissage nous utilisons comme base pour l’expérimentation une séquence pédagogique op timisée, dont la fiabilité didactique a été validée par plusieurs études, voir (ROY, 2012). Le scénario vise l’apprentissage de l’utilisation de la monnaie, généralement ciblé sur les enfants de 6 à 9 ans. Le thème de la monnaie a été choisi parce qu’il est à la fois simple tout en étant suffisamment riche en procédures de calcul pour per mettre une personnalisation pertinente des activités proposées aux élèves.
De plus, ce thèmecombinant la décomposition de nombres et des opérations sur ceux-ci avec l’usage concret de la monnaie et son application pratique dans la vie quotidienne. Le logiciel intégrant le scénario est construit pour être utilisé dans l’environnement d’un navigateur web, où les étudiants se voient proposés des exercices de compo sition de sommes d’argent, de paiement et de rendu de monnaie (voir la figure 3.2)