Interaction décisionnelle homme-robot

Interaction décisionnelle homme-robot

Robotique interactive et planication

La conception de robots autonomes est un problème complexe en soi mais cette complexité est d’autant plus marquée pour les robots interactifs. En eet, un robot partageant son espace avec des humains se doit d’agir en préservant leur sécurité physique mais il doit également se comporter de manière socialement acceptable. Ces contraintes doivent être prises en compte à tous les niveaux de la conception du robot : de la perception jusqu’aux systèmes décisionnels de haut-niveau. Depuis maintenant de nombreuses années, les architectures de contrôle trois niveaux ont été largement utilisées pour le contrôle des robots autonomes (voir [Alami 98] pour un exemple). Le schéma de principe d’une architecture trois niveaux est illustré par la gure 1.1. Une telle architecture est composée de : ✓ un niveau fonctionnel constitué de toutes les routines de contrôle des capteurs et des actionneurs du robot, ✓ un niveau intermédiaire dédié au contrôle d’exécution, ce niveau est chargé de vérier à tout moment la validité des requêtes destinées au niveau fonctionnel, ✓ un niveau délibératif qui contient les systèmes décisionnels de haut-niveau. Le niveau délibératif est souvent concrétisé par un couple superviseur-planicateur. Le superviseur (aussi appelé exécutif ) permet de contrôler le bien fondé des actions en cours et de déterminer les buts à réaliser selon l’état courant du monde. Le planicateur est utilisé pour conférer un haut degré d’autonomie décisionnelle au robot, il permet à ce dernier d’établir une succession d’actions à réaliser permettant de satisfaire les buts courants. Le planicateur est un outil puissant mais n’est pas toujours nécessaire, cela dépend de l’application nale visée. Les applications étudiées dans ce manuscrit sont celles où le robot agit en collaboration avec l’homme de manière à être perçu comme un compagnon par ses partenaires humains. Il convient de s’interroger sur l’utilité de l’outil de planication pour ces applications. Cette utilité sera directement liée au degré d’autonomie décisionnelle qui devra être conféré au robot. Nous nous proposons d’étudier cela en nous intéressant aux diérentes formes que peut prendre la collaboration entre l’homme et le robot.

Les différentes formes de collaboration homme-robot

Les avancées réalisées ces dernières années dans tous les domaines de la robotique (perception, décision, etc.) ont permis d’apporter une nouvelle dimension à certains types d’applications robotiques. Ainsi, les premiers travaux sur la collaboration homme-robot ont porté sur l’aptitude d’un robot à être aisément contrôlé par un opérateur humain. Les progrès qui ont été eectués ces dernières années permettent d’envisager une modication du rôle de l’humain pour en faire un collaborateur et non plus un opérateur. Cela signie que l’humain agit en partenaire et non plus en donneur d’ordres vis-à-vis du robot. Les outils décisionnels mis en oeuvre dans ces deux types d’applications robotiques sont très diérents, nous nous proposons maintenant de mettre en évidence ces diérences en tentant d’établir une classication des applications collaboratives homme-robot. La classication proposée est basée sur deux critères : (1) le degré de partage de l’espace d’action entre l’homme et le robot et (2) la durée de la collaboration entre ces deux agents. Grâce à ces deux critères nous avons identié trois grandes familles comme l’illustre la gure 1.2.

La téléopération

Nous allons maintenant préciser les caractéristiques propres à la téléopération selon notre classication. Il est important de noter qu’il ne s’agit pas ici de faire un état de l’art complet des applications téléopératives, nous nous focaliserons uniquement sur les aspects interactifs liés à la téléopération. La téléopération est caractérisée par un faible degré de partage de l’environnement d’action entre l’homme et le robot. En eet, les applications de téléopération proposent bien souvent des situations où le robot est amené à évoluer dans un environnement totalement distinct de celui de son opérateur humain. Dans un tel cadre, la collaboration entre l’homme et le robot est alors réduite à une interface (parfois très sophistiquée) pouvant prendre des formes très variées. Cette interface a deux rôles : (1) transmettre/traduire les requêtes de l’homme en ordres compréhensibles par le robot et (2) centraliser/expliciter pour l’opérateur humain les informations collectées par le robot sur son environnement. L’interface est alors le seul moyen de communication existant entre le robot et son opérateur humain. Dans de telles situations, la qualité de la collaboration peut alors être quantiée en se basant sur trois caractéristiques : l’ergonomie de l’interface entre l’homme et le robot, les fonctionnalités interactives permettant la communication entre l’homme et le robot, le degré d’autonomie du robot. L’ergonomie de l’interface homme-robot. Dans le cadre de la téléopération il est clair que l’ergonomie de l’interface est un point clef puisque l’interface est le seul moyen pour l’opérateur humain de percevoir l’environnement dans lequel évolue le robot. De nombreux travaux se sont donc naturellement portés sur la conception d’interfaces sophistiquées facilitant au maximum la prise de décision de l’opérateur humain. On peut, par exemple, citer des travaux tels que [Kawamura 03] qui proposent une interface basée sur un ensemble d’agents logiciels. Chacun de ces agents est responsable d’une partie des informations provenant du robot et doit adapter l’achage produit en fonction des préférences de l’utilisateur et des données courantes. Enn, il existe un agent particulier dont le rôle est d’organiser graphiquement les diérents achages issus des autres agents. Dans de tels cas, l’amélioration de la qualité de la collaboration homme-robot tient à la conception d’une interface adaptant son ergonomie en fonction des données perçues par le robot. Les fonctionnalités interactives. Cette caractéristique rejoint partiellement celle de l’ergonomie de l’interface. En eet, l’ajout de fonctionnalités interactives dans une application de téléopération a pour but de permettre à l’opérateur humain de contrôler le robot de manière plus intuitive. La combinaison de l’interface graphique et des fonctionnalités interactives telles que la reconnaissance vocale et la reconnaissance gestuelle permettent de créer des interfaces dîtes multimodales (voir [Fong 01a] et [Fong 01b] pour un exemple). L’autonomie du robot. Dans le cadre de la téléopération, il est clair que le degré d’autonomie du robot joue également un rôle sur la qualité de la collaboration entre le robot et son opérateur humain. La collaboration gagne en qualité lorsque le robot a un degré d’autonomie susamment avancé permettant à l’opérateur de se consacrer uniquement aux décisions de haut-niveau. C’est dans cet esprit que des travaux sur l’Autonomie Ajustable ont été menés (voir [Dorais 98] et [Goodrich 01] pour des exemples). Le principe de l’Autonomie Ajustable est de doter le robot d’une autonomie décisionnelle à degré variable an de permettre à son opérateur humain de choisir à quel niveau de décision il souhaite intervenir. Ainsi l’opérateur est libre de choisir entre un robot à piloter intégralement ou un robot exécutant intelligent , il existe également des niveaux intermédiaires entre ces deux extrêmes où le robot prend des décisions dans un nombre de cas limités et fait appel à l’opérateur humain dans les autres cas. La téléopération est un cadre d’application permettant une collaboration homme-robot où le robot joue un rôle d’exécutant plus ou moins intelligent et l’homme un rôle d’opérateur prenant les décisions de plus ou moins haut-niveau. La planication de tâches peut-être utilisée en téléopération pour doter le robot d’un mode de fonctionnement avec un haut degré d’autonomie. Toutefois, cette planication ne concernera que les actions du robot puisqu’il ne partage pas l’espace d’actions avec l’homme. L’impact social des actions du robot sur l’opérateur humain reste donc limité.

L’interaction de courte durée

Nous allons maintenant détailler les caractéristiques propres à l’interaction de courte durée selon notre classication. De même que pour la téléopération, nous n’aborderons ici que l’aspect interactif de ce type d’applications. Les applications interactives de courte durée sont caractérisées par un partage de l’espace d’actions entre l’homme et le robot et par une interaction entre les deux agents d’une durée limitée dans le temps. Le partage de l’espace est un point très important puisqu’il oblige le système décisionnel du robot à prendre explicitement en compte le partenaire humain à tout moment étant donné que ce dernier peut inuencer leur environnement commun et donc agir par ce biais sur le bien fondé des actions du robot. Parmi les applications robotiques interactives de courte durée existantes, on peut citer : ➢ les robots guides de musée : le robot Sage [Nourbakhsh 99] au musée de l’Histoire Naturelle de Carnegie ou le robot Rackham [Clodic 06] à la Cité de l’Espace à Toulouse, ➢ les robots cherchant leur chemin au milieu d’une foule : les robots Grace et Georges ([Simmons 03], [Gockley 04]) lors du challenge AAAI, ➢ les robots réceptionnistes : le robot Valérie ([Gockley 05], [Gockley 06]) qui a accueilli des visiteurs à l’Université de Carnegie Mellon. ➢ les robots de transport d’objets : le robot CERO [Huttenrauch 02] servant d’assistant de transport dans un institut de recherche. Le critère de brièveté de l’interaction entre le robot et son partenaire humain joue un rôle très important dans la conception de ce type d’applications. En eet, la collaboration entre l’homme et le robot ne durant que quelques instants il est très souvent inutile de doter le robot de capacités décisionnelles très évoluées. Ce type d’applications se prête naturellement à un contrôle du robot par un automate à états ni de haut-niveau. En eet, ce formalisme est tout à fait adapté aux robots dédiés à des interactions de courte durée puisqu’il permet une exécution systématique de recettes garantissant une réponse ecace et rapide aux besoins du partenaire humain. Cet automate à états ni est très souvent associé à un système d’apprentissage permettant d’adapter légèrement le comportement du robot en fonction du vécu existant entre le robot et son partenaire humain courant. Toutefois, cette approche atteint rapidement ses limites lorsque l’interaction entre le robot et son(ses) partenaire(s) humain(s) se prolonge. En eet, il existe des études de cas [Dauthenhahn 05] qui montrent la nécessité pour le robot d’agir de manière prédictible (i.e. éventuellement répétitive) mais des travaux tels que [Lund 03] révèlent une perte d’intérêt rapide des partenaires humains du robot lorsque ce dernier répète trop souvent les mêmes comportements. Le comportement du robot est alors perçu comme non-intelligent et provoque un sentiment d’étouement chez son partenaire humain qui se sent bloqué dans un cycle d’exécution. Il est possible de contourner cette diculté en modiant légèrement le comportement du robot à chaque exécution ou en débloquant de nouveaux comportements au fur et à mesure que l’interaction se prolonge . Cependant, une fois que le partenaire humain aura expérimenté l’ensemble des comportements du robot, il risque de s’en désintéresser. Il apparaît donc que ces méthodes permettent seulement de prolonger la durée de vie de l’interaction sans apporter une solution pérenne dans le temps.

Table des matières

Introduction
Liste des publications liées à cette thèse
1 Robotique interactive et planification
1.1 Les diérentes formes de collaboration homme-robot
1.1.1 La téléopération
1.1.2 L’interaction de courte durée
1.1.3 L’interaction à long terme
1.2 Interaction homme-robot à long terme et planification : état de l’art
1.2.1 La planification de projet
1.2.2 L’ordonnancement et l’allocation de ressources
1.2.3 La synthèse de plans
1.3 Autres sources d’inspiration
1.4 Conclusion
2 Comportement social d’un robot
2.1 définition d’un comportement social
2.1.1 Les caractéristiques du comportement social
2.1.2 Production de comportements sociaux
2.2 Prise en compte de l’homme dans la réalisation des actions
2.3 Utilisation de modèles cognitifs
2.4 Reproduction du raisonnement humain
2.5 Contribution de la planification de tâches au comportement social d’un robot
2.6 Conclusion
3 Mesure de la qualité sociale d’un plan
3.1 Exemple support
3.1.1 Situation de départ et buts
3.1.2 Plans solutions
3.2 Identication des critères de qualité sociale d’un plan
3.2.1 Critère de gestion des efforts
3.2.2 Critère des états indésirables
3.2.3 Critère des séquences indésirables
3.2.4 Critère des temps d’inactivité .
3.2.5 Critère des liens croisés (dépendance intrinsèque du plan)
3.2.6 Critère des mauvaises décompositions
3.3 définitions pour la planification avec contraintes sociales
3.3.1 définition d’un domaine de planfication .
3.3.2 Extension de la définition d’un domaine de planification
3.3.3 définition d’un problème de planification
3.3.4 Extension de la définition d’un problème de planification
3.4 Processus d’agrégation des critères
3.4.1 Analyse multi-critère
3.4.2 Processus d’Analyse Hiérarchique (AHP)
3.5 Métrique de qualité sociale d’un plan
3.5.1 La méthode AHP avec deux alternatives
3.5.2 Utilisation de la méthode AHP pour la comparaison de deux plans
3.5.3 Évaluation partielle
3.6 Conclusion
4 Le planicateur HATP
4.1 Choix du formalisme de planification
4.2 Structure et description de la base de faits
4.3 Structure et description du domaine de planification
4.3.1 Description d’une action HATP
4.3.2 Description d’une méthode HATP
4.3.3 Description des critères sociaux
4.4 Transcription des règles sociales
4.5 Structure d’un plan HATP
4.6 Problème de planification HATP
4.7 Choix techniques pour l’utilisation en ligne
4.7.1 Principe de compilation
4.7.2 Structure multi-thread
4.8 Algorithme de planification HATP
4.8.1 Procédure principale de SHOP2
4.8.2 Algorithme HATP
4.9 Limites des algorithmes SHOP2 et HATP
4.10 Conclusion
5 Résultats
5.1 Résultats en simulation
5.1.1 Scénario de simulation
5.1.2 Plans produits par HATP
5.2 Utilisation de HATP sur un robot réel
5.2.1 Architecture logicielle de contrôle
5.2.2 Scénario de l’expérimentation
5.2.3 Résultats obtenus
5.3 Conclusion
Conclusion et perspectives
Bibliographie