Analyse d’images par IA : du biomédical à la protection de la biodiversité - Carnot M.I.N.E.S
Au sein de Mines Paris – PSL, école membre du Carnot M.I.N.E.S, le CMM s’appuie notamment sur des modèles de deep learning pour développer des méthodes d’analyse automatique d’images. Ces outils, qui revêtent un intérêt manifeste pour de nombreuses industries, ont également un rôle à jouer en faveur de la transition écologique.
Étienne Decencière dirige le Centre de Morphologie Mathématique (CMM), le laboratoire de Mines Paris – PSL consacré à l’analyse d’images et, plus généralement, de données spatiales. Mais qu’est-ce que la « morphologie mathématique » ? « Il s’agit d’une discipline inventée à Mines Paris – PSL dans les années 1960 », expose le chercheur. « Cette théorie mathématique a rencontré un grand succès, particulièrement en raison de ses applications en analyse d’images, bien avant l’essor des outils d’intelligence artificielle. » Cependant, ces dernières années, le laboratoire a embrassé l’avènement de techniques telles que le deep learning, reposant sur des réseaux de neurones artificiels, en leur associant parfois son savoir-faire en morphologie mathématique. Il a toutefois conservé son nom pour des raisons historiques.
Faciliter la détection d’une maladie rétinienne
L’analyse d’images est un champ d’études qui intéresse de nombreux secteurs, du médical à l’industrie, en passant par l’astronomie. Et le CMM a choisi de s’ouvrir à de multiples domaines d’application. « À l’origine, le laboratoire travaillait sur des images de roches provenant de mines, par exemple en vue d’étudier leur perméabilité », retrace Étienne Decencière. « Puis nous nous sommes rapidement ouverts à d’autres applications. Ce qui nous importe depuis toujours, dans un projet, c’est qu’il nous apporte de nouveaux défis théoriques à relever et réponde à un besoin socio-économique. »
Ainsi, depuis quinze ans, Étienne Decencière consacre une partie de ses travaux de recherche au domaine biomédical, en particulier à l’imagerie de la rétine. « Le premier projet, qui a débuté avant la révolution apportée par le deep learning, consistait à aider au dépistage de la rétinopathie diabétique, une maladie courante chez les individus souffrant de diabète », présente le chercheur. En partenariat avec des médecins de l’hôpital Lariboisière, l’équipe de recherche a alors mis au point des méthodes permettant de détecter, sur des images de rétine, des signes pouvant traduire le développement d’une rétinopathie diabétique. Cette analyse avait pour but de détecter les cas suspects afin de les adresser à un praticien, pour établir un diagnostic.
Détection d’anomalies
À la fin du projet, les outils développés affichaient des résultats satisfaisants sur le dépistage de la maladie ciblée. « En revanche, il arrivait que nous passions à côté de cas graves relevant d’une autre pathologie », concède Étienne Decencière. « Nos modèles étaient donc performants, mais spécifiques. Or, il est très difficile d’apprendre toutes les maladies, d’autant que certaines peuvent être rares, donc documentées par trop peu d’images. » Ce constat a motivé la création d’un nouvel axe de recherche au sein du CMM : la détection d’images anormales. Au lieu de se concentrer sur les marqueurs relevant d’une pathologie particulière, l’idée était d’identifier la présence éventuelle d’anomalies sur une image de rétine, comme un médecin pourrait le faire.
C’est d’ailleurs un des objectifs d’une thèse sur le point de s’achever, conduite par Thomas Langrognet, doctorant au CMM, sous la direction d’Étienne Decencière. « Notre but est d’utiliser des réseaux de neurones artificiels pour détecter, comme l’œil humain, la présence d’éléments anormaux sur une image de rétine », décrit ce dernier. « Lors de la phase d’apprentissage, notre modèle est ainsi nourri d’images saines, de sorte à pouvoir, par la suite, identifier des écarts à ce qu’il aura déterminé comme étant normal. » Ces travaux, menés en partenariat avec la start-up AiScreenings, ont abouti au dépôt de deux brevets et feront prochainement l’objet de publications scientifiques témoignant d’une amélioration de l’état de l’art.
L’IA face au manque de données annotées
La phase d’apprentissage – étape clé pour tout modèle de deep learning – nécessite de disposer d’un jeu de données suffisant afin que l’algorithme puisse représenter correctement le phénomène qu’il doit observer. Un impératif souvent difficile à satisfaire, comme dans le cas du projet RetinOptic, mené par le CMM à partir de 2014. « Il s’agissait d’un des premiers projets pour lesquels nous utilisions le deep learning », se souvient Étienne Decencière. « Notre rôle était de fournir un outil permettant d’estimer la qualité d’images de rétine. Or, s’il existait quelques bases de données disponibles, peu d’entre elles contenaient des annotations suffisantes. Par conséquent, un des objectifs du projet consistait précisément à mettre en place une base de données annotées. »
Étienne Decencière et Robin Alais, alors doctorant au CMM, ont conduit des entretiens avec des praticiens dans le but de définir les critères de qualité d’une image rétinienne. Des échanges qui leur ont ensuite permis d’annoter eux-mêmes une base de données constituée d’environ 3 000 images.
Analyse des couches de la peau
Parmi les autres secteurs intéressés par les travaux du CMM figure l’industrie cosmétique. Le laboratoire travaille ainsi depuis 2008 avec L’Oréal sur des applications autour de la peau. L’entreprise avait alors besoin d’outils pour analyser automatiquement les images 3D fournies par le microscope multiphotonique qu’elle venait d’acquérir. Depuis ces premiers travaux, le partenariat ne s’est jamais interrompu et a évolué vers d’autres types d’images et de nouvelles problématiques.
« Nous avons, par exemple, abordé un problème de segmentation pour lequel L’Oréal, avec des méthodes classiques, n’obtenait pas de résultats suffisamment satisfaisants », cite Étienne Decencière. « À cet effet, nous avons combiné des modèles de deep learning avec des outils de morphologie mathématique, une association qui a donné des résultats très probants. » Pour l’entreprise, l’objectif était d’obtenir une segmentation des différentes couches de la peau, afin notamment de mesurer les effets de produits appliqués sur des échantillons de tissus humains reconstruits in vitro. L’analyse automatique des images devait aussi contribuer à la mesure de la concentration et de la distribution de mélanine au sein des différentes couches.
« Néanmoins, nous ne connaissons pas toutes les applications envisagées par L’Oréal à l’aide des outils d’analyse d’images générés », souligne le chercheur. « En revanche, nous ressentons la satisfaction de savoir que nos travaux sont véritablement utilisés par notre partenaire industriel. » Pour cela, l’équipe de recherche fournit généralement son code, écrit en Python, qui est ensuite encapsulé dans une application ergonomique, un travail réalisé par un partenaire de l’entreprise. Une démarche qui profite à tous, dans le respect de la propriété intellectuelle de chacun des acteurs.
L’IA au service de la transition écologique
« Nos discussions avec L’Oréal nous ont également conduits à évoquer les menaces pesant sur la biodiversité, dans la mesure où de nombreux ingrédients utilisés par l’entreprise proviennent de la nature », ajoute Étienne Decencière. Une problématique qui fait écho à l’actualité du CMM, puisqu’il oriente dorénavant une grande partie de ses travaux vers des questions autour de la transition écologique.
Par exemple, le laboratoire mène actuellement un projet avec EDF autour de l’analyse d’images de poissons. « L’activité d’EDF, à travers certains de ses ouvrages, comme des usines hydroélectriques, a une incidence sur les cours d’eau et les espèces animales qui y vivent », observe le chercheur. « Pour mesurer et minimiser cet impact, l’entreprise déploie des caméras acoustiques qui capturent régulièrement des images de la faune aquatique. Le défi consiste alors à identifier et à dénombrer, malgré la faible résolution des caméras, les espèces présentes sur les clichés. » Grâce aux outils d’analyse automatique d’images, EDF pourrait ainsi améliorer le suivi de l’évolution de la présence de poissons en fonction des heures, des jours ou des saisons et adapter le fonctionnement de ses équipements selon ces considérations.
En outre, le CMM va prochainement entamer une thèse dans le cadre de l’initiative « The Transition Institute 1.5 (TTI.5)» de Mines Paris – PSL. Son objectif : développer des outils d’analyse d’images pour identifier des espèces de plancton d’eau douce au sein de lacs expérimentaux et suivre l’évolution de leurs populations. « Cette étude s’accompagne de multiples défis », note Étienne Decencière. « Il faut en effet être capable de reconnaître toutes les espèces de plancton, y compris les plus rares qui ne sont que peu – voire pas – représentées dans les bases de données annotées. La détection d’anomalies peut donc jouer ici un rôle majeur. De plus, les planctons sont des organismes flottant dans l’eau. Par conséquent, les images capturées peuvent afficher des représentants d’une même espèce dans des positions très variables, ce qui ne doit toutefois pas entraver l’analyse. »
Ces travaux illustrent la volonté des chercheurs du CMM de s’impliquer sur les enjeux cruciaux liés à la transition écologique. Cette motivation pousse actuellement le laboratoire à réfléchir à la création d’une chaire sur le sujet, qui viserait à mettre au point des outils pour mesurer la biodiversité, la modéliser et établir des projections. Une chaire qui réunirait plusieurs centres de recherche de Mines Paris – PSL, dont le CMM, l’Institut Supérieur d’Ingénierie et de Gestion de l’Environnement (ISIGE) et l’équipe de géostatistique du centre de Géosciences.