Contrôle optimal en temps réel des flux de puissance dans les micro-réseaux électriques : Formalisation sous forme de processus décisionnel markovien et résolution par méthodes à gradient de politique
Date : 28/01/2025
Heure : 14h
Lieu : ENSAM Campus Aix-en-Provence - Amphi J001
Disponible également en visio : https://teams.microsoft.com/l/meetup-join/19%3ameeting_ZGYyZWJlMDgtY2FjNi00YWMwLTk5NWYtNjRiZTkwNTFkODJh%40thread.v2/0?context=%7b%22Tid%22%3a%22e034b9b0-7768-4b96-91b2-d8f039816ac1%22%2c%22Oid%22%3a%2217e001a1-53b8-4459-974e-9f4e6adb9fc4%22%7d
ID de réunion : 334 966 835 73
Code secret : YW92mP9c
Membre du jury :
NOM et Prénom | Fonction et établissement | Examinateur / Rapporteur / Invité |
M. Rachid OUTBIB | Professeur des universités, LIS-LAB, CNRS, Université de Aix-Marseille | Rapporteur
|
M. Antoine GRALL
| Professeur des universités, LIST3N, Université de Technologie de Troyes
| Rapporteur
|
Mme Moufida MAIMOUR
| Professeure associée, CRAN, Université de Lorraine
| Examinatrice
|
M. Lionel ROUCOULES
| Professeur des universités, LISPEN, École Nationale Supérieure d'Arts et Métiers
| Examinateur
|
M. Pierre GARAMBOIS | Maître de conférences, LISPEN, École Nationale Supérieure d'Arts et Métiers | Examinateur |
Résumé : Dans le cadre de la décarbonation du secteur énergétique et du besoin de flexibilité du réseau électrique européen, les micro-réseaux électriques se distinguent comme une solution innovante pour intégrer des ressources énergétiques renouvelables intermittentes et répondre à de nouveaux modes de consommation. Toutefois, le contrôle en temps-réel des flux de puissance dans ces systèmes, formalisé comme un problème de décision séquentielle stochastique dans la littérature, souffre d’un manque de cadre de modélisation unifié. Cette thèse propose une formalisation basée sur les processus décisionnels markoviens (MDPs) comme cadre de modélisation. Une distinction claire est faite entre les contraintes technologiques ou contraintes de faisabilité et les contraintes décrivant la non-souhaitabilité de certaines actions, permettant ainsi une meilleure interprétabilité des résultats. L'impact de la configuration de la fonction de récompense est étudié pour la formalisation sous MDP à horizon infini et la politique optimale obtenue à travers celle-ci est comparée, en termes de performance, à celle obtenue à travers la formalisation sous MDP à horizon fini. Un MDP à horizon fini contraint est formalisé ; la contrainte n'étant pas technologique. Enfin, plusieurs méthodes de résolution à gradient de politique sont implémentées et évaluées en termes de vitesse de convergence, de performance et de fiabilité.
Mots-clés : Micro-réseau électrique, décision séquentielle stochastique, processus décisionnel markovien, horizon fini, horizon infini, contraintes de faisabilité, méthodes à gradient de politique, méthode primale-duale pour les MDPs contraints
Thèse dirigée par : M. Lionel ROUCOULES et M. Pierre GARAMBOIS
English version :
Real-Time Optimal Control of Power Flows in Electric Microgrids: A Markov Decision Process Framework and Policy Gradient-Based Solution Methods
Date : 28/01/2025
Time : 14h
Location : ENSAM Campus Aix-en-Provence - Amphi J001
ID de réunion : 334 966 835 73
Code secret : YW92mP9c
Jury Members :
NAME and First Name | Position and Institution |
|
Prof. Rachid OUTBIB | Professor , LIS-LAB, CNRS, Université de Aix-Marseille | Reviewer
|
Prof. Antoine GRALL
| Professor, LIST3N, Université de Technologie de Troyes
| Reviewer
|
Dr. Moufida MAIMOUR
| Associate Professor, CRAN, Université de Lorraine
| Examiner
|
Prof. Lionel ROUCOULES
| Professor, LISPEN, École Nationale Supérieure d'Arts et Métiers
| Examiner
|
Dr. Pierre GARAMBOIS | Lecturer, LISPEN, École Nationale Supérieure d'Arts et Métiers | Examiner |
Abstract : In the context of the energy sector decarbonization and the need for flexibility in the European power grid, microgrids have emerged as an innovative solution for integrating intermittent renewable energy resources and addressing new consumption modes. However, real-time power flow control in these systems, formalized in the literature as a stochastic sequential decision problem, suffers from the lack of a unified modeling framework. This thesis proposes a Markov Decision Process (MDP) based formalization framework. A clear distinction is made between technological (or unfeasibility-related) constraints and constraints describing the undesirability of certain actions, thereby improving the interpretability of the results. The impact of the reward function configuration is studied for the infinite-horizon MDP formalization. The optimal policy obtained through this framework is compared, in terms of performance, to that derived from the finite-horizon MDP formalization. A constrained finite-horizon MDP is also formalized, where the constraint is not technological. Finally, several policy gradient methods are implemented and evaluated in terms of convergence speed, performance, and reliability.
Keywords : Electric microgrid, sequential stochastic decision problems, Markov decision process, finite horizon, infinite horizon, feasibility constraints, policy gradient methods, primal-dual method for constrained MDPs.
Thesis supervised by : Mr Lionel ROUCOULES et Mr Pierre GARAMBOIS