ebook img

Moment-sum-of-squares hierarchies for set approximation and optimal control PDF

191 Pages·2016·6.74 MB·English
by  KordaMilan
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Moment-sum-of-squares hierarchies for set approximation and optimal control

Moment-sum-of-squares hierarchies for set approximation and optimal control THÈSE NO 7012 (2016) PRÉSENTÉE LE 10 JUIN 2016 À LA FACULTÉ DES SCIENCES ET TECHNIQUES DE L'INGÉNIEUR LABORATOIRE D'AUTOMATIQUE 3 PROGRAMME DOCTORAL EN SYSTÈMES DE PRODUCTION ET ROBOTIQUE ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE POUR L'OBTENTION DU GRADE DE DOCTEUR ÈS SCIENCES PAR Milan KORDA acceptée sur proposition du jury: Dr A. Karimi, président du jury Prof. C. N. Jones, directeur de thèse Prof. J. B. Lasserre, rapporteur Prof. A. Rantzer, rapporteur Prof. A. Billard, rapporteuse Suisse 2016 Acknowledgements First of all, my greatest thanks goes to Colin Jones for giving me a great deal of freedom in research and in organizing my personal time, for plethora of travel opportunities, as well as for his invaluable creative input during our long discussions in front of a whiteboard. I especially appreciate Colin’s friendly, positive and unpretentious attitude during these discussion that always left me with new ideas and optimism. A great thanks goes also to Didier Henrion whose visit of EPFL a few months after the start of my thesis put my research on a completely different path than originally intended by me or Colin. What had been a side-topic of interest for me became the core of my research and the subsequent collaboration with Didier proved to be incredibly fruitful and enjoyable. LA is a special place; everybody says that. And it is true. It has attracted special, exceptionally colorful characters that made me laugh even on the rainiest of days. I will never forget those long (pseudo)-philosophical discussions and gossip-packed pub outings as well as those countless little pranks that spiced up the everyday lab life. A special thanks goes to the LA’s rock climbing gang for showing me that there exist other things almost as cool as solving large SDPs. Finally, a big thanks goes to my family for treating me to great Czech food during my visits and for finally giving up on asking about what it is that I actually do, as well as to all my friends for their willingness to always share a good laugh. i Abstract This thesis uses the idea of lifting (or embedding) a nonlinear controlled dynamical system into an infinite-dimensional space of measures where this system is equiva- lently described by a linear equation. This equation and problems involving it are subsequently approximated using well-known moment-sum-of-squares hierarchies. First, we address the problems of region of attraction, reachable set and maxi- mum controlled invariant set computation, where we provide a characterization of these sets in terms of an infinite-dimensional linear program in the cone of nonnegative measures and we describe a hierarchy of finite-dimensional semidefinite- programming (SDP) hierarchies providing a converging sequence of outer approxi- mations to these sets. Next, we treat the problem of optimal feedback controller design under state and input constraints. We provide a hierarchy of SDPs yielding an asymptotically optimal sequence of rational feedback controllers. In addition, we describe hier- archies of SDPs yielding approximations to the value function attained by any given rational controller, from below and from above, as well as a hierarchy of SDPs providing approximations from below to the optimal value function, hence obtaining performance certificates for the designed controllers as well as for any given rational controller. Finally, we describe a method to verify properties of a closed loop interconnection of a nonlinear dynamical system and an optimization-based controller (e.g., a model predictive controller) for deterministic and stochastic nonlinear dynamical systems. Properties such as global stability, the (cid:2) gain or performance with respect to a 2 given infinite-horizon cost function can be certified. The methods presented are easy to implement using freely available software packages and are documented by a number of numerical examples. Key words: region of attraction, reachable set, maximum controlled invariant set, optimal control, moment hierarchy, sum-of-squares, semidefinite programming, controller verification, lifting, embedding iii Résumé Cette thèse utilise l’idée de lifting (ou embedding) d’un système dynamique non linéaire contrôlé dans un espace de dimension infinie de mesures où ce système est décrit de façon équivalente par une équation linéaire. Cette équation et les problèmes l’impliquant sont ensuite approximés à l’aide des hiérarchies bien connues moment-somme de carrés. Tout d’abord, nous abordons les problèmes de calcul de la région d’attraction, de l’ensemble atteignable et de l’ensemble invariant contrôlé maximal, où nous fournissons une caractérisation de ces ensembles par un problème d’optimisation linéaire de dimension infinie dans le cône de mesures non négatifs et nous décrivons une hiérarchie de hierarchies de problèmes d’optimisation semi-définis (SDP) en dimension finie fournissant une séquence d’approximations extérieures convergentes de ces ensembles. Ensuite, nous traitons le problème de la conception de contrôleur optimal sous contraintes d’état et d’entrée. Nous fournissons une hiérarchie de SDP qui donne une séquence asymptotiquement optimale de contrôleurs rationnels. En outre, nous décrivons des hiérarchie de SDP produisant des approximations de la fonction objectif atteinte par un contrôleur rationnel donné, lune par valeur supérieure, l’autre inférieure, ainsi qu’une hiérarchie de SDP donnant une approximation inférieure à la fonction objectif optimale, en obtenant donc des certificats de performance pour la contrôleurs conçus ainsi que pour tout contrôleur rationnel donné. Enfin, nous décrivons une méthode pour vérifier les propriétés d’une boucle fermée formée par l’interconnexion d’un système dynamique non linéaire et un contrôleur résolvant un problème d’optimisation (par exemple, un contrôleur prédictif) pour les systèmes dynamiques non linéaires déterministes et stochastiques. Les propriétés telles que la stabilité globale, le gain (cid:2) ou la performance par rapport à une fonction 2 de coût à horizon infini peuvent être certifiés. Les méthodes présentées sont faciles à mettre en œuvre en utilisant des logiciels disponibles gratuitement et sont documentées par un certain nombre d’exemples numériques. v Mots clefs : région d’attraction, ensemble atteignable, ensemble invariant contrôlé maximal, commande optimale, hiérarchie des moment, somme des carrés, program- mation semi-définie, vérification de contrôleur, lifting, embedding Contents Acknowledgements i Abstract (English/Français) iii List of figures xi List of tables xv Nomenclature xviii 1 Introduction 1 2 Preliminaries 7 2.1 Duality between C(K) and M(K) . . . . . . . . . . . . . . . . . . . 7 2.1.1 Weak-(cid:2) topology . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2 Sub- and super-cones of C(K) and M(K) . . . . . . . . . . . . . 9 + + 2.2.1 Sub-cones of C(K) . . . . . . . . . . . . . . . . . . . . . . 9 + 2.2.2 Super-cones of M(K) . . . . . . . . . . . . . . . . . . . . . 12 + 2.2.3 Sub-cones of M(K) . . . . . . . . . . . . . . . . . . . . . . 14 + 2.2.4 Super-cones of C(K) . . . . . . . . . . . . . . . . . . . . . 15 + 2.3 Lifting nonlinear dynamics . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.1 Relaxed controls . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.2 Continuous-time, finite-horizon . . . . . . . . . . . . . . . . 19 2.3.3 Continuous-time infinite horizon . . . . . . . . . . . . . . . . 22 2.3.4 Continuous-time infinite-horizon with stopping . . . . . . . . 24 2.3.5 Continuous-time input-affine systems – special case . . . . . 27 2.3.6 Discrete-time infinite-horizon . . . . . . . . . . . . . . . . . 29 3 Set approximation 33 3.1 Region of attraction & Reachable set . . . . . . . . . . . . . . . . . 34 3.1.1 ROA via optimization . . . . . . . . . . . . . . . . . . . . . 36 3.1.2 Lifting: first attempt . . . . . . . . . . . . . . . . . . . . . . 36 vii 3.1.3 Primal infinite-dimensional LP on measures . . . . . . . . . 38 3.1.4 Dual infinite-dimensional LP on functions . . . . . . . . . . 40 3.1.5 SDP approximations . . . . . . . . . . . . . . . . . . . . . . 43 3.1.6 Outer approximations and convergence results . . . . . . . . 46 3.1.7 Free final time . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.1.8 Numerical examples . . . . . . . . . . . . . . . . . . . . . . 49 3.1.9 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.2 Maximum controlled invariant set . . . . . . . . . . . . . . . . . . . 59 3.2.1 Lifting: Primal LP . . . . . . . . . . . . . . . . . . . . . . . 60 3.2.2 Lifting: Dual LP . . . . . . . . . . . . . . . . . . . . . . . . 63 3.2.3 SDP approximations . . . . . . . . . . . . . . . . . . . . . . 66 3.2.4 Convergence results . . . . . . . . . . . . . . . . . . . . . . . 69 3.2.5 Numerical examples . . . . . . . . . . . . . . . . . . . . . . 72 4 Optimal control 81 4.1 Problem statement . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 4.2 Lifting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 4.3 Tightening . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 4.3.1 Tightening with continuous densities . . . . . . . . . . . . . 88 4.3.2 Tightening with polynomial densities . . . . . . . . . . . . . 89 4.4 Proof of Theorem 4.3.1 . . . . . . . . . . . . . . . . . . . . . . . . . 90 4.5 Value function approximations . . . . . . . . . . . . . . . . . . . . . 96 4.6 Numerical examples . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 4.6.1 Nonlinear double integrator . . . . . . . . . . . . . . . . . . 98 4.6.2 Controlled Lotka-Volterra . . . . . . . . . . . . . . . . . . . 100 4.7 Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 5 Verification of optimization-based controllers 105 5.1 Problem statement . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 5.2 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 5.2.1 Polynomial dynamical controller + input saturation . . . . . 108 5.2.2 Output feedback nonlinear MPC with model mismatch and soft constraints . . . . . . . . . . . . . . . . . . . . . . . . . 110 5.2.3 General optimization-based controller . . . . . . . . . . . . . 112 5.2.4 Optimization-based controller solved using a fixed number of iterations of a first order method . . . . . . . . . . . . . . 113 5.3 Closed-loop analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 114 5.3.1 Stability analysis – global . . . . . . . . . . . . . . . . . . . 115 5.3.2 Stability analysis – on a given subset . . . . . . . . . . . . . 117 5.3.3 Performance analysis – deterministic setting . . . . . . . . . 118

Description:
A great thanks goes also to Didier Henrion whose visit of EPFL a few months after the start of my .. fC(X). The supremum norm of f over X, i.e., fC(X) = sup x∈X|f(x)|. fC0. The same as fC(X) when the set X is clear from the context. fCk. The same as fCk(X) when the set X is clear from the context
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.