Sujet de Thèse
Titre :
Apprentissage de représentations par deep learning pour l'industrie 4.0
Dates :
2020/11/21 - 2024/04/30
Etudiant :
Encadrant(s) : 
Autre(s) encadrant(s) :
CR Christophe CERISARA (christophe.cerisara@loria.fr)
Description :
Contexte :
Le futur doctorant sera recruté aux laboratoires CRAN et LORIA pour développer sa thèse dans le cadre du projet européen H2020-ICT AI-PROFICIENT
(Artificial Intelligence for improved PROduction efFICIEncy, quality and maiNTenance). Le projet AI-PROFICIENT cherche à développer et déployer des
techniques issues de l'IA, au sens large, pour fournir des capacités avancées aux processus et aux moyens de production, tout en considérant les scénarios
incluant l'humain tels que human-in-the-loop, human-in-control et human-in-command.
L'objectif de cette thèse est d'adapter et développer des modèles de Deep Learning pour la maintenance prédictive et plus particulièrement le pronostic. Le
cadre applicatif de la thèse est le domaine industriel et plus spécifiquement les sites pilotes du projet, i.e. l'usine de fabrication de pneumatiques de
CONTINENTAL de Sarreguemines et les Sites de production de polymères d'INEOS Olefins & Polymers de Geel (Belgique) et Cologne (Allemagne).
Le doctorant fera partie intégrante du projet et à ce titre, participera aux réunions, à la rédaction de livrables, à la présentation d'avancement et de résultats, à
l'organisation de réunion...
Sujet de thèse :
Le contexte de cette thèse est l'industrie du futur et plus particulièrement l'apport de la digitalisation et de l'Intelligence Artificielle à la maintenance
prédictive. La maintenance prédictive est une stratégie dont l'objectif est d'anticiper la panne (plutôt que de la subir) en regard de l'état réel d'un système de
production et des prévisions sur son exploitation. Cette anticipation permet ainsi de minimiser les inconvénients des maintenances classiques telles que les
pannes inattendues interrompant la production, les ruptures de pièce de rechange pour la réparation pour n'en citer que quelques uns. Cette approche de la
maintenance s'appuyant sur la digitalisation des entreprises exploite sur les données recueillies afin de prédire et pronostiquer l'évolution des dégradations
et proposer les actions de maintenance les plus adaptées à la situation actuelle du système de production afin d'anticiper les défaillances en limitant les
opérations inutiles.
Ainsi, le pronostic consiste à évaluer la durée de vie résiduelle (Remaining Useful Lifetime-RUL) d'un système, par exemple un composant, une machine
voire une ligne de production. Pour cela, il cherche à prédire l'état de santé futur du système jusqu'à sa défaillance à partir des informations disponibles
passé/présent/futur, telles que les historiques, données actuelles de fonctionnement mais également le planning futur de production et les actions de
maintenance planifiées.
L'objectif de cette thèse est donc de proposer des modèles de deep learning d'analyse et de représentation des données disponibles afin de réaliser un
pronostic. L'analyse des données est essentielle, car bien que la quantité de données disponible dans ce contexte d'industrie du futur soit souvent important,
les données pertinentes pour un pronostic peuvent être rares (évènement peu fréquent), de qualité incertaine, non labellisées, partielles... Pour aborder cette
problématique, l'originalité de l'approche à suivre dans cette thèse repose sur le pré-apprentissage des réseaux. En effet, dans le domaine du deep learning,
l'apprentissage non supervisé de représentations permet d'exploiter l'ensemble de toutes les données disponibles, annotées ou non, et d'en extraire des
informations génériques transférables à toutes les tâches cibles de classification et de pronostic. Ceci permet de réduire considérablement la taille du dataset
d'apprentissage pour la tâche à réaliser.
Alors que de telles représentations ont déjà été explorées avec succès dans les domaines de la reconnaissance d'image en 2014, avec des architectures
convolutionnelles entraînées sur ImageNet, puis du traitement automatique du langage naturel en 2018, avec des modèles d'attention entraînés notamment
sur des tâches de prédiction de mots sur internet, il n'en existe pas encore dans le domaine industriel, ce qui explique sans doute au moins en partie pourquoi
"the imagenet moment" de l'industrie du futur n'a pas encore eu lieu.
L'objectif de cette thèse est de contribuer à la construction d'un tel modèle de représentation des données industrielles, en concevant des modèles et des
tâches qui ne sont pas nécessairement directement liées à une application cible, mais qui permettent d'encoder efficacement une information la plus riche et
la plus générique possible sur certains processus industriels sous-jacents, comme la dégradation de pièces mécaniques avec le temps. Trois catégories de
tâches seront ainsi explorées:
• Des tâches non supervisées, comme les modèles génératifs (y compris les GAN) ou les approches de deep clustering; nous nous intéresserons en
particulier aux modèles de type "one-class", qui sont bien adaptés aux corpus très déséquilibrés fréquents dans le monde industriel, et au développement de
nouvelles approximations au risque de classification théorique qui permettent d'entraîner sans aucune supervision des classifieurs discriminants, dont les
réseaux de neurones profonds, vers une tâche représentative d'un ensemble de classifieurs infini.
• Des tâches sans annotations manuelles, mais avec tout de même une supervision explicite; l'exemple le plus connu de cette catégorie est l'auto-
encodeur ou l'encodeur-décodeur, qui peuvent être étendus par des approches variationelles afin de modéliser les incertitudes.
• Des tâches supervisées, qui apportent une information plus précises sur une ou plusieurs tâches cibles; de telles approches peuvent être combinées avec
de l'apprentissage multi-tâches afin d'augmenter la généralisation et le pouvoir de transfert des représentations obtenues.
Mots clés :
Deep Learning, Maintenance prévisionnelle, Industrie du futur, Pronostic
Département(s) : 
Modélisation Pilotage des Systèmes Industriels