Exploitation du Retour de Force pour l’Estimation et le Contrôle des Robots Marcheurs

Exploitation du Retour de Force pour l’Estimation et le Contrôle des Robots Marcheurs

Introduction

Les robots marcheurs tels que les quadrupèdes ou les humanoïdes sont en théorie capables d’évoluer dans des environnements quelconques, sans aménagement spécial. En effet, leurs jambes leur permettent de se déplacer sur divers terrains inaccessibles aux robots à roues. Certains robots sont par exemple déjà capables d’emprunter un escalier ou de se déplacer en milieu naturel [Kudruss 2015, Raibert 2008]. De manière contre-intuitive, contrôler le mouvement artificiel de tels robots est une tâche des plus compliquées. C’est d’autant plus difficile à comprendre que nous sommes des créatures bipèdes, qui maîtrisons la marche avec une évidence naturelle. L’engouement pour la recherche sur les robots marcheurs peut autant s’expliquer par les possibles applications concrètes   que par la motivation d’étudier un fonctionnement biologique que nous n’arrivons pas encore à reproduire complètement [Ijspeert 2008]. Comment caractériser ce qui distingue les robots marcheurs des robots à roue ? Pour se mouvoir, les marcheurs doivent interagir avec l’environnement en appliquant des forces de contact de façon intermittente. Dans cette thèse, nous nous attachons à comprendre ce que cette caractéristique fondamentale entraîne comme difficultés, et quelles solutions il est possible de proposer pour contrôler l’équilibre et la marche de telles machines.Comme tout robot, les robots marcheurs sont des systèmes mécatroniques composés d’un ensemble de capteurs, d’actionneurs et d’un calculateur. Pour opérer, les informations émanant des capteurs nourrissent un algorithme appelé contrôleur, qui, selon un ensemble d’objectifs ou de consignes, calcule une commande à destination des actionneurs. C’est le schéma de contrôle de tout système asservi. Dans le cas des robots marcheurs, implémenter cette structure de contrôle représente plusieurs défis. D’abord, ces systèmes sont équipés d’un grand nombre de degrés de liberté. Un humanoïde compte une trentaine de degrés de liberté contre une douzaine pour un quadrupède. L’exploration numérique de tels espaces est coûteuse en temps de calcul. Ensuite, c’est un système naturellement instable. Pendant la marche, un bipède n’est en appui que par la semelle de son pied, surface relativement faible en comparaison de la hauteur de son centre de gravité. Un quadrupède au trot n’est lui en contact qu’avec deux points, il est aussi stable qu’une table à deux pieds. Du fait de cette instabilité intrinsèque, une commande doit être constamment calculée et appliquée pour stabiliser activement le robot [Wieber 2000]. Finalement, la dynamique de tels robots marcheurs est non convexe à cause des multiples articulations, non régulière du fait des changements de contacts, et non holonome à cause des effets dus aux moments angulaires [Chevallereau 2007, Wieber 2000, Wieber 2006a]. Une dynamique non convexe et dépendante des modes de contact rend l’exploration des solutions au problème de la commande difficile. À ce jour, il n’existe aucun algorithme garantissant une solution optimale en temps fini. 

Contributions

 À cause d’un contrôle articulaire imparfait, d’erreur de modélisation de l’environnement ou de la dynamique du robot, une trajectoire prétendument viable ne l’est pas toujours en pratique. Pour pallier ce défaut, il est nécessaire introduire une rétroaction à un autre niveau qu’au niveau articulaire. Il se pose alors la question du niveau de rétroaction et de la grandeur de mesure utilisée. Deux options s’offrent à nous. Introduire un retour d’état dans le calcul de la commande du corps complet ou encore à l’étape de planification. La figure 3 référence les principales contributions de cette thèse, qui ont toutes pour objectif la mise en pratique de telles rétroactions. 

Contributions 

Estimation 

L’estimation de l’état est un premier composant nécessaire aux deux rétroactions envisagées, qu’elle se fasse au niveau de la planification, ou du contrôle du corps complet. L’absence d’estimateur performant et compatible avec les fréquences de contrôle envisagées dans cette thèse ont motivé l’implémentation et l’évaluation d’un estimateur de l’état de la base du robot HRP-2 ➊. L’état du robot est défini par ses configurations articulaires et leur dérivées ainsi que par la position et la vitesse de l’un des corps appelés base du robot. Bien que cette dernière grandeur soit primordiale pour assurer sa stabilité, on ne dispose généralement pas de capteurs permettant de mesurer directement l’état de la base du robot par rapport à son environnement. Le chapitre 2 présente les capteurs usuellement embarqués dans un robot marcheur ainsi qu’une comparaison expérimentale de deux estimateurs de l’état de la base du robot HRP-2 fusionnant les données issues des capteurs de forces de contact et d’une centrale inertielle.

 Contrôle en force

 Le besoin d’un retour en force se justifie par plusieurs aspects. Premièrement, si le contrôle ne se fait qu’en position, dans un cas de multi contact, il peut exister des forces internes qui s’annulent et n’ont pas d’effets visibles. Ces forces n’ont pas de conséquences visibles sur le mouvement, mais peuvent devenir trop importantes au point de dépasser les limites en couple du robot et d’endommager des composants physiques tels qu’un moteur. Deuxièmement, pour assurer un contact stable, il faut que la force appliquée soit dans un cône de frottement déterminé par les matériaux en contact. Asservir la force de contact à une référence inclue dans le cône de frottement permet de respecter les contraintes de contact sans glissement. Ensuite, la résultante des forces de contact impacte directement l’accélération du centre de masse. C’est donc la grandeur naturelle pour stabiliser le robot et asservir la position de son centre de masse. 6 Dans le schéma de contrôle découplé présenté en figure 2, une rétroaction limitée est assurée par un stabilisateur. Son rôle est d’adapter les consignes articulaires pour suivre des forces de contact de référence. Une telle structure de stabilisation faisant correspondre une erreur en force à une adaptation des positions s’appelle correcteur en admittance. Il se superpose au contrôleur du corps complet et permet de travailler avec un contrôle en position articulaire tout en intégrant un retour en force. C’est le schéma de contrôle de la plupart des robots humanoïdes contrôlés en position. Une autre option pour implémenter ce retour en force est de l’intégrer directement au contrôleur du corps complet . Si la variable de contrôle articulaire est le couple, on peut utiliser un contrôleur du type dynamique inverse qui optimisera la commande du couple articulaire selon des tâches de forces de contact et de suivi des trajectoires planifiées. L’avantage de travailler avec une commande en couple plutôt qu’en admittance réside dans la possibilité d’introduire un terme de feed-forward, correspondant à la commande a priori, basée sur le modèle dynamique du robot et de son actionnement. Grâce à ce terme, et à condition de disposer d’un modèle représentatif de l’actionnement, il est possible de diminuer les gains des retours en positions en gardant la même qualité de suivi en position. Cela se traduit par la possibilité d’obtenir un compromis entre précision et souplesse 1 toujours supérieur à ce que peut permettre une commande en admittance. Pour un robot marcheur, introduire une certaine souplesse est intéressant pour corriger des erreurs effectuées sur la modélisation de l’environnement au contact ou dans le modèle cinématique du robot. En même temps, la précision est importante pour suivre correctement les trajectoires planifiées. Le chapitre 3 présente les principaux constituants de l’actionnement des robots marcheurs et les développements techniques qui ont permis, dans le cadre de cette thèse, de mettre en œuvre une commande en couple du robot HRP-2 initialement commandé en position. 

Table des matières

Positionnement de la thèse
0.1 Introduction
0.2 État de l’art
0.3 Contributions
0.3.1 Estimation
0.3.2 Contrôle en force
0.3.3 Contrôle en force sur contact flexible
0.3.4 Génération de consignes
1 Modèles mathématiques et génération de consigne
1.1 Introduction
1.2 Dynamique d’un robot marcheur
1.2.1 Mise en équation
1.2.2 Critère d’équilibre
1.2.3 La dynamique centroïdale
1.2.4 Pendule inverse linéarisé: un modèle simplifié du robot
1.3 Objectifs de haut niveau
1.3.1 Tâches
1.4 Génération de consignes articulaires en couple
1.4.1 Dynamique inverse dans l’espace des tâches
1.5 Conclusion
2 Perception et estimation
2.1 Introduction
2.2 Capteurs
2.2.1 Codeurs des liaisons
2.2.2 IMU
2.2.3 Capteur de force de contact
2.2.4 Couples articulaires
2.3 Filtrages
2.3.1 Dérivation
2.3.2 Intégration
2.4 Estimateurs d’état
2.5 Méthode 1: Moyennes pondérées en deux étapes
2.5.1 Estimation 6d basée sur la cinématique
2.5.2 Estimation de l’orientation via l’IMU
2.5.3 Fonctions de pondération
2.5.4 Fusionner les estimations
2.5.5 Compensation des glissements des pieds
2.6 Méthode 2: Un filtre de Kalman linéaire
2.6.1 Modèle de processus
2.6.2 Modèle de mesure
2.6.3 Pondération du bruit de modèle
2.7 Résultats
2.7.1 Vérité terrain
2.7.2 Expérience 1: Bousculement
2.7.3 Expérience 2: CoM Sinusoïdal
2.7.4 Expérience 3: Marche
2.7.5 Identification des flexibilités aux chevilles
2.7.6 Politique de mise à jour des pieds
2.7.7 Métriques
2.7.8 Temps de calcul
2.7.9 Discussion
2.8 Conclusion
3 Actionnement et asservissement articulaire
3.1 Introduction
3.2 Principaux types d’actionnement
3.3 Asservissement articulaire
3.3.1 Contrôle en position
3.3.2 Contrôle en couple
3.3.3 Contrôle en admittance
3.4 Modélisation et identification des motoréducteurs d’HRP-2
3.4.1 Modélisation
3.4.2 Identification
3.5 Commande en couple d’HRP-2
3.5.1 Compensation des frottements de coulomb
3.5.2 Amélioration de la boucle en courant
3.5.3 Résultats
3.5.4 Limitations
3.6 Conclusion
4 Contrôle d’un robot sur contacts flexibles
4.1 Introduction
4.1.1 Présentation du problème
4.1.2 État de l’art
4.1.3 Contributions
4.1.4 Structure du chapitre
4.2 Dynamique centroïdale et Contacts Flexibles
4.2.1 Modèle des Contacts Élastiques
4.2.2 Importance de la Raideur ou de l’Amortissement
4.2.3 Dynamique Centroïdale
4.3 Formulation d’un nouveau contrôleur (TSID-Flex-K)
4.3.1 Linéarisation du retour d’état
4.3.2 Régulateur par retour d’état linéaire
4.3.3 Contraintes sur les cônes de frottement
4.3.4 Résumé
4.4 Contrôle sur des contacts rigides (TSID-Rigid)
4.4.1 Présentation du contrôleur
4.4.2 Dynamique en boucle fermée
4.4.3 Dynamique en boucle fermée avec retour de force
4.5 Contrôle sur des contacts flexibles via l’amortissement (TSID-Flex-B)
4.5.1 Présentation du contrôleur
4.5.2 Dynamique en boucle fermée
4.6 Contrôle en Admittance (TSID-Adm)
4.6.1 Présentation du contrôleur
4.6.2 Dynamique en boucle fermée
4.6.3 Contrôle en admittance classique
4.7 Estimation
4.8 Résultats
4.8.1 Environnement de simulation
4.8.2 Présentation des expériences
4.8.3 TSID-Rigid
4.8.4 TSID-Adm
4.8.5 TSID-Flex-B
4.8.6 TSID-Flex-K
4.9 Discussions et Conclusions
5 Formulation d’un générateur de marche réactive
5.1 Introduction
5.1.1 Locomotion
5.2 Contrôle prédictif
5.3 Formulation couplée pour un générateur de marche
5.3.1 Évolution du pendule inverse
5.3.2 Formulation d’un coût quadratique
5.3.3 Couplage corps complet et variable MPC
5.3.4 Trajectoire adaptative du pied de vol
5.3.5 Formulation du problème couplé
5.4 Résultats
5.5 Conclusion
Conclusion
Bibliographie

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *