Actualité
Mercredi 31 mai 2023

Chaire DSAIDIS : la data science et l’IA au service de l’industrie

Carnot-TNS.jpg

Le secteur industriel a tout intérêt à tirer parti de la montagne de données qu’il génère quotidiennement. Cependant, comment les exploiter et les analyser efficacement, quand celles-ci peuvent être incomplètes, hétérogènes ou polluées par du bruit ou des valeurs extrêmes ? La chaire DSAIDIS, soutenue par le Carnot Télécom & Société numérique et portée par deux enseignants-chercheurs de Télécom Paris, cherche à répondre à ces enjeux, en étroite collaboration avec des acteurs de l’industrie et des services.

L’essor du big data et de l’intelligence artificielle (IA) a ouvert de nouvelles perspectives pour les entreprises. Pouvoir analyser rapidement un grand volume de données, aider à la prise de décision en temps réel, établir des prévisions fiables… Les récents progrès technologiques offrent des possibilités inédites à de nombreux secteurs professionnels.

Néanmoins, parmi ceux-ci, l’industrie et les services affichent des spécificités auxquelles les systèmes doivent s’adapter. En effet, au sein de ces secteurs, l’analyse des données recueillies (en quantité considérable) se heurte à de nombreuses difficultés, notamment :

  • La présence de données contaminées, de bruit, de valeurs extrêmes ou manquantes
  • Des conditions qui évoluent dans le temps
  • Des données pas ou partiellement étiquetées, c’est-à-dire auxquelles peu d’informations sont associées
  • Une hétérogénéité due, entre autres, à la diversité des sources employées
  • Une quantité parfois insuffisante de données, qui contraint le système à en générer de nouvelles ou à devoir fonctionner à partir d’un faible volume

De plus, ces écueils s’inscrivent dans un contexte où, particulièrement pour l’industrie, les systèmes doivent prouver qu’ils sont « dignes de confiance » afin d’être pleinement adoptés. Ce qui s’accompagne d’exigences élevées en matière de fiabilité, de robustesse ou d’explicabilité.

Des outils d’IA capables de se confronter à la réalité du terrain

C’est pour répondre à ces enjeux qu’a été créée la chaire DSAIDIS (Data science & artificial intelligence for digitalized industry & services), avec le soutien du Carnot Télécom & Société numérique. Celle-ci implique une vingtaine d’enseignants-chercheurs de Télécom Paris, qui collaborent avec les cinq partenaires industriels : Airbus Defence and Space, Engie, IDEMIA, Safran et Valeo. « Nos liens avec les entreprises sont forts et chacun se nourrit de l’autre », témoigne Pavlo Mozharovskyi, enseignant-chercheur à Télécom Paris et co-animateur de la chaire. « De notre côté, nous nous inspirons de leurs problématiques réelles pour nos travaux. Et quand nous y répondons, nous leur proposons des systèmes capables de leur apporter une valeur ajoutée concrète. »

L’ambition de la chaire DSAIDIS est ainsi d’élaborer des outils méthodologiques applicables dans des conditions réalistes. Une approche qui nécessite, pour chaque projet, une phase théorique de modélisation, suivie du développement d’algorithmes, qui exploitent concrètement les résultats précédemment obtenus. À cet effet, les chercheurs s’appuient sur des méthodes de machine learning, ou apprentissage automatique, une branche de l’intelligence artificielle.

« L’adaptation de nos systèmes à des conditions d’usage réalistes constitue le cœur de notre approche », souligne Florence d’Alché, enseignante-chercheuse à Télécom Paris et titulaire de la chaire. « Nous n’appliquons pas nos modèles à des cas idéaux, éloignés de la réalité. Ils sont au contraire conçus pour s’adapter à des environnements bruités, à des données contaminées, à des valeurs extrêmes, etc. Et ce, tout en satisfaisant des critères élevés de fiabilité et en offrant un maximum de garanties théoriques. »

De plus, les outils développés s’inscrivent dans une problématique générale actuelle : la sobriété. « Nous faisons en sorte que nos modèles et nos algorithmes nécessitent le moins possible de mémoire, de puissance de calcul, mais aussi de données », affirme la chercheuse. Une préoccupation encore récente au sein de la communauté de l’IA.

4 axes pour une plus grande confiance en l’IA

Dans le détail, la recherche s’articule autour de quatre axes, définis en collaboration avec les cinq partenaires industriels.

  1. Analyse et prévision de séries temporelles

    Si ce premier axe peut paraître classique, les chercheurs entendent l’aborder sous un nouveau prisme, notamment en croisant des méthodes classiques de statistiques et des outils de machine learning. « L’originalité de notre étude consiste aussi à s’intéresser non pas à une série de mesures à un instant T, mais à considérer une portion de signal sur un intervalle de temps », explique Florence d’Alché. « Une approche qui offre des outils supplémentaires pour identifier des propriétés pertinentes dans le cadre d’une prise de décision. »
     
  2. Exploitation à grande échelle de données partiellement étiquetées et hétérogènes

    Cet axe, qui couvre un large périmètre, vise à répondre aux problématiques associées au big data dans l’industrie et les services. En particulier, comment exploiter efficacement un grand volume de données, en dépit d’un étiquetage incomplet et d’une grande diversité au niveau des sources ?
     
  3. Machine learning au service d’une prise de décision fiable et robuste

    Ici, l’objectif est de renforcer la confiance des utilisateurs dans les outils d’IA. Comment les algorithmes de machine learning peuvent-ils tenir compte des imperfections des données (bruit, contamination, valeurs extrêmes…), tout en faisant preuve de fiabilité ? Comment peuvent-ils aider à corriger des biais et à garantir davantage d’équité ? Des enjeux qui vont au-delà des problématiques techniques et qui impliquent des chercheurs en sciences économiques et sociales.

    Il est également question d’explicabilité. « Les modèles actuels d’apprentissage automatique sont complexes et fonctionnent à la manière d’une « boîte noire » », note Pavlo Mozharovskyi. « Nous cherchons donc à donner des explications aux décisions prises par la machine, de sorte que la « boîte noire » devienne, peut-être pas blanche, mais grise. » Un souhait vivement exprimé par les partenaires industriels de la chaire, et par la société en général.

  4. Apprentissage en interaction avec l’environnement

    En pratique, les systèmes d’intelligence artificielle sont amenés à s’intégrer au sein d’environnements changeants. Ils doivent donc être capables de prendre en compte ces évolutions et d’adapter leur fonctionnement en conséquence. L’équipe de recherche œuvre ainsi à doter les outils d’une faculté d’apprentissage autonome et continue.

Une collaboration fructueuse entre les mondes industriel et académique

Plusieurs projets ont déjà été menés, en collaboration avec les partenaires industriels de la chaire. Par exemple, Valeo a fait appel aux chercheurs pour améliorer une de ses lignes de production. En effet, comme tout fabricant, l’entreprise cherche continuellement à réduire son taux de pièces défectueuses, afin d’optimiser son rendement. « Nous avons commencé par une large phase de compréhension des données et des processus en jeu, avant de procéder à leur analyse », détaille le co-animateur de la chaire DSAIDIS. « Ensuite, grâce à un travail important de visualisation des données, nous avons pu identifier les paramètres déterminants pour éviter les défauts lors de la fabrication. Puis, nous avons utilisé des outils statistiques afin d’établir des recommandations. » Celles-ci ont alors été appliquées sur la ligne de production, avec des résultats immédiats : le taux de pièces défectueuses a été quasiment divisé par deux !

Ce succès a conduit au lancement d’une thèse CIFRE, encore en cours, auprès du même partenaire, sur une autre ligne de production. Ici, le but est d’expliquer les anomalies survenant pendant la fabrication et d’en identifier les sources les plus probables. « Notre analyse statistique permet de déterminer quels postes, sur la ligne de production, sont les plus susceptibles d’entraîner des défauts sur les pièces », résume Pavlo Mozharovskyi. « Ce qui permet à l’industriel de savoir où concentrer ses efforts pour améliorer son processus. » Un outil que les équipes de Valeo ont déjà commencé à utiliser, sur le terrain.

Par ailleurs, les chercheurs ont travaillé avec IDEMIA, qui développe des solutions de biométrie, notamment des systèmes de reconnaissance faciale. Une technologie qui a souvent été critiquée pour son manque d’équité. « Notre objectif est précisément de corriger les biais de sélection », indique la titulaire de la chaire. « Concrètement, notre système vise soit à repondérer les données d’apprentissage, afin d’estomper les effets d’une sous-représentation de certaines populations, soit à ignorer certains attributs (genre, couleur de peau…). »

À travers ces exemples, la chaire DSAIDIS illustre parfaitement la synergie possible entre les mondes industriel et académique. Et malgré une clôture officielle prévue fin 2023, l’aventure ne devrait pas s’achever cette année. « Nous travaillons actuellement au renouvellement de la chaire », annonce Florence d’Alché. « Nous rencontrons chacun des partenaires, afin de déterminer les sujets déjà étudiés qui méritent d’être prolongés, d’identifier de nouvelles problématiques et de leur proposer d’autres axes d’études. » Une réflexion également alimentée par la rencontre de nouveaux partenaires industriels, qui pourraient rejoindre la chaire dès 2024.