En IA aussi, on pense global et on agit local - avec Jean-Bernard Lasserre

Partagez l'article

Maths・Ingénierie

En IA aussi, on pense global et on agit local - avec Jean-Bernard Lasserre

IA Lasserre Exploreur
© Clark Van der Beken, by Unsplash

Pour le mathématicien Jean-Bernard Lasserre, tout problème a une solution locale, imparfaite, et une solution globale, la meilleure de façon absolue. Le chercheur teste les méthodes d’optimisation globale en intelligence artificielle. Il promeut également l’utilisation de la fonction mathématique de Christoffel, pour certains problèmes en analyse de données. Explications.

Propos recueillis par Valérie Ravinet, journaliste.

 

Jean-Bernard Lasserre, quels sont les défis que vous avez relevés dans votre vie professionnelle ?

Dès le début de ma carrière de mathématicien, je me suis intéressé à l’optimisation polynomiale, c’est-à-dire que je cherche à trouver des solutions optimales à des problèmes globaux. Depuis 2019, avec mon équipe de la chaire de l’Institut interdisciplinaire d’intelligence artificielle de Toulouse, ANITI, nous travaillons également à affiner l’analyse de données. Je suis aujourd’hui directeur de recherche émérite au CNRS, je poursuis mes travaux au sein du laboratoire d'analyse et d'architecture des systèmes, le LAAS-CNRS, même si je suis en âge d’être à la retraite ! Je suis également membre de l’Institut de mathématiques de Toulouse.  

C’est quoi une solution « optimale » pour vous ?

Une solution « optimale » à un problème en mathématique peut se définir par des critères de performance. De tels problèmes se posent dans tous les domaines des sciences et de l’ingénierie : dans la gestion des réseaux d’énergie, en traitement d’image, en théorie de l’information quantique, et aussi, bien sûr, en intelligence artificielle où l’optimisation est au cœur de l’apprentissage profond.

Il existe deux types de solutions : les solutions locales, avec des propriétés imparfaites, et des solutions globales. Malheureusement, si ces dernières sont « globalement » les meilleures, elles sont aussi particulièrement difficiles à obtenir. C’est l’obtention de telles solutions qui est au cœur de mes recherches. Imaginez que vous êtes dans une région de vallées et de montagnes plus ou moins hautes et que le but est de trouver le point de plus basse altitude. Le fond de la vallée la plus profonde est la solution optimale globale du problème. Le fond de chaque vallée est un point localement optimal car dès qu’on bouge localement autour de ce point on « monte » - l’altitude augmente - mais il y a des vallées plus profondes que d’autres. Trouver le fond d’une vallée est facile car il suffit de descendre jusqu’à ce que qu’on ne puisse plus le faire. En revanche pouvoir certifier qu’on est au fond de la vallée la plus profonde de toute la région est très difficile.

Si vous deviez traduire les mystères de l’IA en termes mathématiques…

Nous proposons une méthode basée sur des résultats de géométrie algébrique, d’un type différent de celles qui sont généralement utilisées. Nous remplaçons le problème général par une série de problèmes plus simples qu’on sait résoudre de façon efficace. Dans cette série, leur taille grandit et rend leur résolution de plus en plus coûteuse (un problème à multiples variables est plus long à résoudre et occupe davantage la mémoire des ordinateurs), mais en général on a à résoudre peu de problèmes pour obtenir une solution satisfaisante. Cette méthode est utilisée par exemple pour améliorer la planification des réseaux d’énergie électrique, c’est l’objet d’un partenariat avec la compagnie RTE (Réseau de transport d'électricité).

Le miracle du deep learning – l’apprentissage profond, qu’on n’explique d’ailleurs pas totalement, réside dans le fait que l’algorithme associé semble toujours trouver une solution globale alors qu’il n’est pas nécessairement conçu pour le faire. Une des grandes questions actuelles en apprentissage consiste à comprendre pourquoi ce type d’algorithme fonctionne bien. Une autre consiste à certifier la robustesse et la stabilité de la solution obtenue. Prenons l’exemple de la classification de différents types d’images dans une base de données, l’algorithme apprend à reconnaitre des chats, des chiens ou des oiseaux. Parfois, si l’on modifie quelques pixels de l’image à classer, le résultat proposé par l’algorithme peut être erroné, on classe un chat au lieu d’un chien : on dit que la fonction de classification proposée par l’algorithme n’est pas stable. C’est un des problèmes des réseaux neuronaux, disons leur talon d’Achille.

Dans les travaux de l’équipe de la chaire ANITI, nous intervenons en aval, une fois que le réseau neuronal a fourni une solution, pour évaluer et certifier la robustesse de cette solution.

Vous cherchez l’intrus grâce à une fonction mathématique ?

Outre l’optimisation, une autre facette de nos travaux concerne aussi l’analyse de données. Par exemple le problème de détecter si, dans un jeu de données, certaines sont aberrantes. Il y a de multiples applications industrielles. Nous avons dans ce cadre identifié qu’un outil théorique mathématique issu de la théorie de l’approximation, appelé fonction de Christoffel, pouvait être utile pour certains problèmes en analyse de données. Et donc un autre des buts de la chaire est de populariser et promouvoir cet outil relativement simple à utiliser en analyse de données.

En quoi cette fonction mathématique, qui n’est pas nouvelle, peut-elle s’avérer pertinente pour l’analyse de données ?

La fonction de Christoffel peut être utilisée pour « coder » des données. Cette façon de coder permet la détermination d’un seuil qu’on utilise alors pour repérer les portions de données aberrantes - des valeurs distantes, qui contrastent grandement avec les valeurs « normalement » mesurées. On peut considérer qu’elle est un outil de diagnostic et d’aide à la décision. Cet outil, qui originellement n’a pas été défini pour ce type d’applications, fonctionne bien et s’avère moins couteux que d’autres outils. Nous l’avons par exemple utilisé dans des travaux portés par ma collègue Louise Travé-Massuyès dans le domaine aéronautique. Il s’agit de détecter des données aberrantes de capteurs dans un système d’approche aéroport. Cette méthode pourrait s’appliquer dans bien d’autres cas de figure, c’est ce que nous cherchons à populariser !

 

Bio express

Jean-Bernard Lasserre est mathématicien, diplômé de l’École Nationale Supérieure d’Informatique et Mathématiques Appliquées (ENSIMAG) de Grenoble. Il a soutenu sa thèse en 1978 et son doctorat en 1984 à l’Université Paul Sabatier de Toulouse. Il travaille au LAAS-CNRS à Toulouse depuis 1980. Il a effectué tout au long de sa carrière de nombreuses visites dans des universités du monde entier, publié dans des journaux internationaux et est l’auteur ou co-auteur de plusieurs ouvrages, dont le dernier est à paraitre aux Cambridge University Press au premier semestre 2022, et s’intitule The Christoffel-Darboux Kernel for Data Analysis, co-écrit avec les chercheurs Edouard Pauwels et Mihai Putinar.