Par Huu Phuc NGUYEN Développement d’une commande à modèle partiel appris : analyse théorique et étude pratique Thèse présentée pour l’obtention du grade de Docteur de l’UTC Soutenue le 16 décembre 2016 Spécialité : Technologies de l’Information et des Systèmes D2323 niversité de echnologie de ompiègne U T C eudiasyc 7253 H UMR CNRS/UTC hèse T présentée pour l’obtention du grade de Docteur de l’UTC par Huu Phuc NGUYEN éveloppement d une commande à D ’ modèle partiel appris . nalyse théorique et tude pratique A É 16 2016 Thèse soutenue le Décembre devant le jury composé de : uc ugard M. L D DR CNRS, Gipsa-lab, Grenoble (Rapporteur) ascal orin M. P M Professeur, ISIR, UMPC (Rapporteur) ominique eizel M. D M Professeur Émérite, Univ. de Limoges (Examinateur) sabelle antoni Mme. I F DR CNRS, Heudiasyc, UTC (Examinatrice) li harara M. A C Professeur, Heudiasyc, UTC (Co-Directeur de thèse) érôme e iras M. J D M Maître de Conférences, Heudiasyc, UTC (Directeur de thèse) À mon fils... able des matières T able des matières T v iste des figures L ix otations N xiii emerciements R xv ésumé R xvii 1 onception de la commande C 3 11 ommande par modèle tabulé de comportement 5 . C . . . . . . . . . . . . 1.1.1 Conceptdecommande . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1.2 Algorithmed’interpolation. . . . . . . . . . . . . . . . . . . . . . . . . 8 1.1.3 Algorithmed’optimisation . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.1.4 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 12 ommande en mode entrée sortie 16 . C - . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Modèledeprédictionenmodeentrée-sortie . . . . . . . . . . . . . . . 16 1.2.2 Schémad’unecommandeenmodeentrée-sortie . . . . . . . . . . . . . 17 onclusion 18 C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 tratégie d apprentissage S ’ 19 21 pprentissage de modèle 21 . A . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 RéseauxàfonctionsdebaseradialesRBF . . . . . . . . . . . . . . . . . 21 2.1.2 Méthodeànoyaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1.3 Processusgaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 22 ommande par apprentissage 26 . C . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Processusdedécisionmarkovien . . . . . . . . . . . . . . . . . . . . . 26 2.2.2 Commandeparapprentissagesansmodèle . . . . . . . . . . . . . . . . 28 2.2.3 Commandeparapprentissagebaséesurlemodèle . . . . . . . . . . . . 31 23 ne commande par apprentissage de modèle 32 . U . . . . . . . . . . . . . . . 2.3.1 Correctionitérativebaséesurlafonctiongaussienne . . . . . . . . . . . 32 2.3.2 Évolutiondelacommandebaséesurlemodèletabulédecomportement 35 2.3.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 v onclusion 44 C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 pplication au véhicule aérien A 45 31 ommande d un 47 . C ’ PVTOL . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Equationdynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.1.2 Miseenœuvredel’algorithmedecommande . . . . . . . . . . . . . . 48 3.1.3 Résultatdesimulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.1.4 Tempsdegénérationdestables . . . . . . . . . . . . . . . . . . . . . . 55 32 ssais sur un 4 en mode le 4 56 . E X PVTOL : PVTOL-X . . . . . . . . . . . . . 3.2.1 Passaged’unquadricoptèreàunPVTOL . . . . . . . . . . . . . . . . . 56 3.2.2 ApprentissageensimulationsurlePVTOL-X4 . . . . . . . . . . . . . . 61 3.2.3 EssairéelsurlePVTOL-X4. . . . . . . . . . . . . . . . . . . . . . . . . 62 33 ommande d attitude pour le quadricoptère 63 . C ’ . . . . . . . . . . . . . . 3.3.1 Modélisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.3.2 Modèlecomplet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.3.3 Résultatensimulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 onclusion 74 C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 pplication au véhicule intelligent A 75 41 ommande d un véhicule autonome 77 . C ’ . . . . . . . . . . . . . . . . . . . . 4.1.1 Pneumatiqueetdynamique . . . . . . . . . . . . . . . . . . . . . . . . 77 4.1.2 Equationdynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 4.1.3 Modèlevéhiculecomplet . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4.1.4 Suivid’unetrajectoire . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4.1.5 Miseenœuvredel’algorithmedecommande . . . . . . . . . . . . . . 83 4.1.6 Résultatdesimulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 42 ommande d une voiture en drift 90 . C ’ . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Equationdynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 4.2.2 Miseenœuvredel’algorithmedecommande . . . . . . . . . . . . . . 91 4.2.3 Résultatdesimulation . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 43 ssais sur le véhicule réel 98 . E . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Planificationdelatrajectoireetlocalisation . . . . . . . . . . . . . . . . 99 4.3.2 Estimationd’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 4.3.3 Résultatetcommentaire . . . . . . . . . . . . . . . . . . . . . . . . . . 105 onclusion 107 C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 pplication à la machine asynchrone A 109 51 odélisation mathématique 111 . M . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Modèletriphasé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.1.2 Modèlebiphasé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 5.1.3 Miseenéquationd’état . . . . . . . . . . . . . . . . . . . . . . . . . . 115 vi 52 bservation de la vitesse mécanique 117 . O . . . . . . . . . . . . . . . . . . . . 5.2.1 Étatdel’art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.2.2 Algorithmesd’observation . . . . . . . . . . . . . . . . . . . . . . . . . 118 53 pproche par formalisme d état pour extraire la vitesse mécanique 121 . A ’ 5.3.1 Formulationduproblème . . . . . . . . . . . . . . . . . . . . . . . . . 121 5.3.2 Résultatsensimulation. . . . . . . . . . . . . . . . . . . . . . . . . . . 122 54 basée sur les flux 123 . MRAS . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Formulationduproblème . . . . . . . . . . . . . . . . . . . . . . . . . 123 5.4.2 Résultatsensimulation. . . . . . . . . . . . . . . . . . . . . . . . . . . 126 55 basé sur le modèle en courants 128 . MRAS . . . . . . . . . . . . . . . . . . . onclusion 132 C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . onclusion générale et erspectives C P 133 nnexes A A 135 1 iltre de alman étendu 137 A. F K . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 dentification des paramètres d une machine asynchrone 137 A. I ’ . . . . . . ibliographie B 139 vii iste des figures L 11 8 . Le schéma de la commande . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Discrétisation régulière dans l’espace S ×U de dimension d . . . . . . . . 9 13 2 9 . Coordonnée barycentrique dans l’espace D . . . . . . . . . . . . . . . . . 14 10 . Triangulation de COXETER-FREUDENTHAL-KUHN . . . . . . . . . . . . 15 11 . Triangulation de COXETER-FREUDENTHAL-KUHN d’un cube . . . . . 16 13 . Les opérations du simplex utilisées par la méthode de Nelder-Mead . . . 1.7 La minimisation de la fonction f(x ,x ) = (x −0.5)2 +x2 avec la mé- 1 2 1 2 14 thode de Nelder-Mead . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 16 . Le modèle de prédiction en mode entrée-sortie . . . . . . . . . . . . . . . . 19 17 . Le schéma de la commande en mode entrée-sortie . . . . . . . . . . . . . . 21 22 . Réseau RBF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 RégressionparRBFavecy = xsinx.Lescentressont x = i,i = 0,10,λ = ci 0.02 et σ = 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 23 26 . Le schéma d’un processus de décision markovien . . . . . . . . . . . . . . 24 28 . Le schéma d’un algorithme d’itération de la politique PI . . . . . . . . . . 25 31 . La relation entre l’apprentissage, la plannification et la commande . . . . 26 32 . Commande par apprentissage basée sur modèle ou DYNA-Q . . . . . . . 27 33 . Le schéma d’apprentissage . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 36 . Apprentissage d’une fonction, la première itération . . . . . . . . . . . . . 29 36 . Apprentissage d’une fonction après 400 itérations . . . . . . . . . . . . . . 210 37 . L’évoluation d’erreur de la fonction apprise . . . . . . . . . . . . . . . . . . 211 37 . Le schéma d’une commande par apprentissage de modèle . . . . . . . . . 212 38 . Comparaison entre table de prédiction apprise et simulée . . . . . . . . . 2.13 La sortie utilisant la table apprise, le système réel avec a = 1.2 . . . . . . . 39 2.14 L’entrée utilisant la table apprise, le système réel avec a = 1.2 . . . . . . . 39 215 41 . Apprentissage de modèle pour un pendule . . . . . . . . . . . . . . . . . . 216 41 . Entrée appliquée avec apprentissage de modèle pour un pendule . . . . . 2.17 La position stabilisée sur l’axe x . . . . . . . . . . . . . . . . . . . . . . . . 42 2.18 La position stabilisée sur l’axe z . . . . . . . . . . . . . . . . . . . . . . . . . 43 219 43 . La valeur de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix
Description: