Sujet de Thèse
Titre :
Apprentissage fédéré pour le Prognostics and Health Management (PHM)
Dates :
2023/04/07 - 2026/04/06
Etudiant :
Encadrant(s) : 
Autre(s) encadrant(s) :
CR Christophe CERISARA (christophe.cerisara@loria.fr)
Description :
Contexte :

Le futur doctorant sera recruté au CRAN pour développer sa thèse dans le cadre du projet Horizon Europe MODAPTO. Le projet MODAPTO a pour objectif de développer et déployer les systèmes de production modulaires et reconfigurables (Modular Manufacturing Systems et Reconfigurable Manufacturing Systems) en s'appuyant sur des modules de production augmentés par des Jumeaux Numériques interopérables. De plus, MODAPTO cherche à développer également une vue globale du système de production à travers de l'intelligence collective entre les modules afin d'optimiser le design de ligne de production et de modules, leur reconfiguration ainsi qu'un support à l'aide à la décision notamment pout la maintenance prédcitive.

Dans le cadre du projet MODAPTO, l'objectif cette thèse est d'adapter de développer un algorithme d'apprentissage fédéré (Federated Learning) pour la maintenance prédictive de module avec des applications au diagnostic et au pronostic distribué sur les modules . En effet, le Federated Learning permet de lever certains verrous propres au milieu industriel (voir plus bas). Dans ce cadre, l'algorithme proposé sera validé sur des use cases industrielles associées au projet.


Contexte scientifique :

L'un de ces nouveaux paradigmes de l'usine du futur (FoF) est les systèmes cyber-physiques (CPS) et leur déclinaison à la fabrication en tant que systèmes de production cyber-physiques (CPPS). Les CPPS visent à permettre le changement vers les principes du FoF, comme la personnalisation de masse et la flexibilité/adaptabilité, tout en maintenant une performance optimale des points de vues économique et durabilité. L'une des principales caractéristiques des CPPS pour atteindre cet objectif est l'autonomie (self-X). Le Machine Learning et l'intelligence artificielle (AI) sont les premiers candidats pour fournir une telle capacité. Leur succès dans les applications liées au monde numérique (voir les GAFAM) est incontestable. Outre les progrès de la théorie de l'apprentissage automatique et de l'intelligence artificielle, ce succès est également dû à la disponibilité d'une énorme quantité de données. Cette disponibilité a profondément changé la façon dont les réseaux de neurones profonds (DNN) sont entraînés grâce à la révolution ImageNet pour la vision par ordinateur et encore plus dans le traitement du langage naturel avec GPT3. En effet, aujourd'hui, la plupart des DNN utilisés dans ces applications sont pré-entraînés.

Néanmoins, une telle révolution n'a pas encore eu lieu dans l'industrie. La cause principale est le manque de grands ensembles de données pour permettre le pré-entraînement des modèles DNN. La première limite réside dans la réticence des entreprises à partager leurs données avec des tiers. Cette situation s'accentue lorsqu'il s'agit de domaines d'activité tels que la maintenance prédictive, où l'occurrence d'un événement pertinent et étiqueté est rare (de nos jours, les machines industrielles sont fiables et les pratiques de maintenance permettent d'atteindre de bons objectifs de disponibilité).

Pour lever ces deux limites limites, une voie originale, dans le domaine du manufacturing, est le Federated Learning (FL). Le FL est une méthode d'apprentissage décentralisée où plusieurs noeuds apprennent leurs propres modèles en périphérie et envoient leurs paramètres à un serveur central qui construit un modèle agrégé. (McMahan et al., 2017) ont proposé le vanilla FL et obtiennent un modèle central en agrégeant, avec une moyenne, de manière itérative, les paramètres des modèles des noeuds locaux. En retour, le modèle central est envoyé, lors des mises à jour, aux noeuds afin que ces derniers puissent bénéficier de l'ensemble des connaissances acquises par tous les noeuds. Cette approche permet de répondre en partie aux deux limitations mentionnées ci-dessus:

-La confidentialité des données : en effet, seuls les paramètres ou le gradient des modèles locaux sont envoyés au serveur central, les données restent dans les noeuds.

-La rareté des données : en tirant parti de l'apprentissage décentralisé, le FL bénéficie de la flotte de systèmes déployés comme on peut voir dans l'industrie.

Néanmoins, en ce qui concerne l'application des FL au à la maintenance prédictive des CPPS (en considérant les CPPS comme des noeuds), deux des principaux défis à relever, qui ne sont que partiellement considérés dans le monde virtuel, sont d'une part la variabilité contextuelle inhérente aux CPPS et d'autre part le Few Shot, voire one-shot, Learning (FSL) dans les noeuds pour le FL. En effet, même si l'on considère des CPPS identiques, par exemple des machines-outils, leur comportement ne peut pas être considéré comme identique en raison de leur environnement, de leur vieillissement, de la mission qu'ils accomplissent (par exemple, un matériau ou un produit différent à traiter), de la maintenance effectuée... Ce phénomène peut être modélisé comme si les données au niveau des noeuds étaient issues d'un processus dynamique dont la distribution générative évolue dans le temps. De plus, même si, en cumulant les évènements d'un ensemble de noeuds, leur nombre devient significatif pour entrainer un DNN, l'apprentissage local dans le FL ne comportera qu'un nombre faible de données. Il convient alors de montrer la convergence du FL avec du FSL dans les noeuds.

Ainsi, l'objectif de la thèse sera de concevoir une stratégie de FL permettant de prendre en compte ces deux challenges. A cette fin, trois questions de recherche spécifiques en relation avec le FL seront abordées :

1. Comment concevoir un modèle central et une stratégie d'agrégation permettant de stocker l'ensemble des informations du processus et d'éviter le « catastrophic forgetting » ?

2. Comment concevoir une stratégie de distillation du modèle central aux modèles de noeuds permettant la distillation de la connaissance appropriée à chaque noeud ?

3. Quelle est la convergence des méthodes de FL dans le cas de FSL dans les noeuds ?

Le résultat attendu fournira de nouvelles capacités au FL, ce qui conduira à proposer un nouvel algorithme de FL. La thèse explorera deux processus de maintenance prédictive : la détection et le pronostic. Les modèles de noeuds à considérer seront des DNN comme les modèles à une classe pour la détection et des MLP-LSTM-MLP pour le pronostic
Mots clés :
Maintenance prédictive, PHM, apprentissage profond, apprentissage fédéré
Département(s) : 
Modélisation Pilotage des Systèmes Industriels