Langage et Apprentissage en Interaction pour des Assistants Numériques Autonomes

Langage et Apprentissage en Interaction pour des Assistants Numériques Autonomes

L’essor des assistants numériques ouvre la voie à de nouveaux modes d’interaction. Les assistants apprenant par interaction offrent ainsi la possibilité aux utilisateurs de personnaliser la manière dont ils répondent aux requêtes, notamment en leur enseignant de nouvelles procédures. Ces travaux proposent de s’appuyer sur des méthodes d’apprentissage automatique pour enrichir les capacités de généralisation linguistique et procédurale de ces systèmes. L’enjeu consiste à concilier des facultés d’apprentissage rapide, nécessaire à une expérience utilisateur fluide, avec une capa- cité de généralisation suffisamment large. Naturels pour les humains, ces qualités restent encore hors de portée pour les systèmes artificiels. Cela nous conduit à appro- cher ces problématiques sous l’angle de l’Intelligence Artificielle développementale. Ces travaux sont ainsi inspirés par les processus cognitifs à l’œuvre chez l’enfant lors de l’apprentissage du langage. On propose tout d’abord un module de traitement du langage, qui s’appuie sur des méthodes de comparaison sémantique pour interpréter les requêtes en langage naturel de l’utilisateur. La variabilité avec laquelle un locuteur s’exprime constitue en effet l’une des difficultés centrales de ces assistants apprenants. Notre module leur permet de disposer d’un outil de généralisation sur le langage qui s’adapte en continu à l’utilisateur. Un autre enjeu pour ces agents apprenants est leur capacité à transférer leur connaissance à de nouveaux objets et contextes. On propose alors une série d’architectures d’agents de Deep Reinforcement Learning apprenant à exécuter des tâches exprimées en langage naturel dans des environnements variés. En exploitant le langage comme outil d’abstraction pour représenter les tâches, on montre que lorsque l’environnement est suffisamment structuré, ces agents sont capables de transférer les compétences acquises sur certains objets à de nouveaux.

Dans un monde toujours plus connecté, même les objets les plus banals sont maintenant capables de communiquer entre eux. Allumer une ampoule, contrôler la température de sa maison, ou vérifier que la porte d’entrée est bien fermée, tout cela devient possible à partir de son smartphone, même depuis l’autre bout du monde. Si ces technologies sont encore en voie de démocratisation, elles ouvrent un champ de tous nouveaux usages. Les enceintes connectées d’Amazon et Google fleurissent dans les salons pour permettre à leurs propriétaires de commander par une simple demande vocale les différents objets connectés de la maison. Plus généralement, ce sont nos modes d’interaction avec les objets qui évoluent. Alors que nos interactions ont longtemps été contraintes par la machine (et les boutons de la télécommande), c’est dorénavant la machine qui s’adapte à notre langage. On a ainsi observé le développement rapide ces dernières années des chatbots qui proposent d’assister un utilisateur (ou un consommateur) dans l’utilisation d’un service numérique. Ces transformations touchent tous les domaines : de la médecine à l’éducation (Underwood, 2017) en passant par les plateformes d’e-commerce (Goksel-Canbek et Mutlu, 2016). Ces assistants numériques prennent des formes très diverses et l’on retiendra pour la suite la définition qu’en donne Hauswald et al. (2015) : « une application qui fournit une assistance en répondant à des questions en langage naturel, en proposant des recommandations ou en effectuant des actions à partir de données comme la voix de l’utilisateur, des images ou des informations contextuelles ».

..réponse obtenue soit sans rapport avec la question posée par l’utilisateur créant un certain sentiment de frustration. De manière générale, ces assistants échouent à remplir une mission dès qu’elle s’écarte des cas d’usages prévus par le fabricant. Il est ainsi très difficile de personnaliser son assistant personnel (une enceinte connectée par exemple) au-delà de la prise en compte de certaines préférences des utilisateurs. Hormis pour des utilisateurs à l’aise avec les outils de programmation, il est notamment impossible de leur enseigner de nouvelles capacités. Cette rigidité dans l’usage nuit à l’adoption de ces systèmes et constitue un domaine d’évolution encore peu exploré. C’est dans ce contexte que l’entre- prise Cloud Temple entame en 2015 une collaboration avec l’équipe du Robot Cognition Laboratory (RCL) de l’unité Inserm U1208. L’objectif est de développer un assistant intelligent personnalisable qui puisse apprendre en fonction des besoins de l’utilisateur. Cette collaboration conduit à une première thèse CIFRE : Apprentissage basé sur l’usage en interaction humaine avec un assistant adaptatif (Delgrange, 2018). Dans l’objectif de poursuivre ces travaux, Cloud Temple propose alors une seconde thèse CIFRE, toujours avec l’équipe du RCL (maintenant intégrée à l’unité Inserm U1093) et en partenariat avec l’équipe Flowers de l’INRIA.

 

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *