Soutenance de thèse Rima OULHAJ - Mardi 28 Janvier 2025 à 14h00

Rima OULHAJ

Contrôle optimal en temps réel des flux de puissance dans les micro-réseaux électriques : Formalisation sous forme de processus décisionnel markovien et résolution par méthodes à gradient de politique

Date : 28/01/2025

Heure : 14h

Lieu : ENSAM Campus Aix-en-Provence - Amphi J001

Disponible également en visio : https://teams.microsoft.com/l/meetup-join/19%3ameeting_ZGYyZWJlMDgtY2FjNi00YWMwLTk5NWYtNjRiZTkwNTFkODJh%40thread.v2/0?context=%7b%22Tid%22%3a%22e034b9b0-7768-4b96-91b2-d8f039816ac1%22%2c%22Oid%22%3a%2217e001a1-53b8-4459-974e-9f4e6adb9fc4%22%7d

 

ID de réunion : 334 966 835 73

Code secret : YW92mP9c

 

Membre du jury :

NOM et Prénom

Fonction et établissement

Examinateur / Rapporteur / Invité

M. Rachid OUTBIB 

Professeur des universités, LIS-LAB, CNRS, Université de Aix-Marseille

Rapporteur

 

 

 

M. Antoine GRALL   

 

 

Professeur des universités, LIST3N, Université de Technologie de Troyes

 

Rapporteur

 

Mme Moufida MAIMOUR   

 

Professeure associée, CRAN, Université de Lorraine

 

Examinatrice 

 

M. Lionel ROUCOULES   

 

Professeur des universités, LISPEN, École Nationale Supérieure d'Arts et Métiers

 

Examinateur

 

M. Pierre GARAMBOIS

Maître de conférences, LISPEN, École Nationale Supérieure d'Arts et Métiers

Examinateur

Résumé : Dans le cadre de la décarbonation du secteur énergétique et du besoin de flexibilité du réseau électrique européen, les micro-réseaux électriques se distinguent comme une solution innovante pour intégrer des ressources énergétiques renouvelables intermittentes et répondre à de nouveaux modes de consommation. Toutefois, le contrôle en temps-réel des flux de puissance dans ces systèmes, formalisé comme un problème de décision séquentielle stochastique dans la littérature, souffre d’un manque de cadre de modélisation unifié. Cette thèse propose une formalisation basée sur les processus décisionnels markoviens (MDPs) comme cadre de modélisation. Une distinction claire est faite entre les contraintes technologiques ou contraintes de faisabilité et les contraintes décrivant la non-souhaitabilité de certaines actions, permettant ainsi une meilleure interprétabilité des résultats. L'impact de la configuration de la fonction de récompense est étudié pour la formalisation sous MDP à horizon infini et la politique optimale obtenue à travers celle-ci est comparée, en termes de performance, à celle obtenue à travers la formalisation sous MDP à horizon fini. Un MDP à horizon fini contraint est formalisé ; la contrainte n'étant pas technologique. Enfin, plusieurs méthodes de résolution à gradient de politique sont implémentées et évaluées en termes de vitesse de convergence, de performance et de fiabilité.

Mots-clés :  Micro-réseau électrique, décision séquentielle stochastique, processus décisionnel markovien, horizon fini, horizon infini, contraintes de faisabilité, méthodes à gradient de politique, méthode primale-duale pour les MDPs contraints

 

Thèse dirigée par : M. Lionel ROUCOULES et M. Pierre GARAMBOIS

 

English version : 

Real-Time Optimal Control of Power Flows in Electric Microgrids: A Markov Decision Process Framework and Policy Gradient-Based Solution Methods

Date : 28/01/2025

Time : 14h

Location :  ENSAM Campus Aix-en-Provence - Amphi J001

Also on Teams :  https://teams.microsoft.com/l/meetup-join/19%3ameeting_ZGYyZWJlMDgtY2FjNi00YWMwLTk5NWYtNjRiZTkwNTFkODJh%40thread.v2/0?context=%7b%22Tid%22%3a%22e034b9b0-7768-4b96-91b2-d8f039816ac1%22%2c%22Oid%22%3a%2217e001a1-53b8-4459-974e-9f4e6adb9fc4%22%7d

 

ID de réunion : 334 966 835 73

Code secret : YW92mP9c

Jury Members : 

NAME and First Name

Position and Institution

 

Prof. Rachid OUTBIB 

Professor , LIS-LAB, CNRS, Université de Aix-Marseille

Reviewer

 

 

 

Prof. Antoine GRALL   

 

 

Professor, LIST3N, Université de Technologie de Troyes

 

Reviewer

 

Dr. Moufida MAIMOUR   

 

Associate Professor, CRAN, Université de Lorraine

 

Examiner

 

Prof. Lionel ROUCOULES   

 

Professor, LISPEN, École Nationale Supérieure d'Arts et Métiers

 

Examiner

 

Dr. Pierre GARAMBOIS

Lecturer, LISPEN, École Nationale Supérieure d'Arts et Métiers

Examiner

 

 

Abstract : In the context of the energy sector decarbonization and the need for flexibility in the European power grid, microgrids have emerged as an innovative solution for integrating intermittent renewable energy resources and addressing new consumption modes. However, real-time power flow control in these systems, formalized in the literature as a stochastic sequential decision problem, suffers from the lack of a unified modeling framework. This thesis proposes a Markov Decision Process (MDP) based formalization framework. A clear distinction is made between technological (or unfeasibility-related) constraints and constraints describing the undesirability of certain actions, thereby improving the interpretability of the results. The impact of the reward function configuration is studied for the infinite-horizon MDP formalization. The optimal policy obtained through this framework is compared, in terms of performance, to that derived from the finite-horizon MDP formalization. A constrained finite-horizon MDP is also formalized, where the constraint is not technological. Finally, several policy gradient methods are implemented and evaluated in terms of convergence speed, performance, and reliability.

Keywords : Electric microgrid, sequential stochastic decision problems, Markov decision process, finite horizon, infinite horizon, feasibility constraints, policy gradient methods, primal-dual method for constrained MDPs.

 

 

Thesis supervised by : Mr Lionel ROUCOULES et Mr Pierre GARAMBOIS