IA : peut-on avoir confiance dans le désordre ?
Contre toute idée reçue, l’incertain ou l’à peu près ne sont pas des obstacles pour générer des simulations précises et justes de comportement d’objets complexes. Le mathématicien Fabrice Gamboa manie calcul, géométrie et apprentissage-machine pour réaliser des pronostics fiables. Explications.
Par Valérie Ravinet, journaliste.
Imaginez un sac de billes, rempli pour moitié de billes bleues, pour moitié de billes rouges. À gauche les bleues, à droite les rouges. Imaginez maintenant que ce sac se renverse. Quelle serait la probabilité pour que les billes, faisant machine arrière, se retrouvent chacune très exactement au même endroit dans le sac ? C’est cette image que le mathématicien Fabrice Gamboa utilise pour expliquer ses premiers travaux et éclairer ses recherches actuelles en intelligence artificielle.
Du désordre à la probabilité
À la fin des années 80, le chercheur explore, durant sa thèse de doctorat, la notion d’entropie, qui caractérise le niveau de désordre ou encore « l'imprédictibilité du contenu en information d'un système ». À la suite des travaux du cristallographe Jorge Navaza, Fabrice Gamboa se penche sur la structure des molécules et les dessine, à partir de la méthode utilisant des rayons X imaginée par l’éminent directeur de recherche CNRS.
« Durant ma thèse, j’ai découvert le lien entre cette méthode et la théorie de la probabilité dite « des grandes déviations », qui étudie les « événements rares », qu’on pourrait croire impossibles, à l’instar du sac de billes qui se réorganiserait parfaitement lorsqu’on le secoue une deuxième fois »
explique Fabrice Gamboa, enseignant-chercheur de l’Université Toulouse III – Paul Sabatier, à l’Institut de mathématiques de Toulouse.
Décoder les boites noires
Le mathématicien poursuit ses travaux, s’attachant à « se nourrir des problèmes qui viennent des applications, à écouter les ingénieurs qui ont compris la physique de leurs problèmes et à formaliser des hypothèses ». À chaque phénomène physique rencontré s’ajoutent des erreurs et du désordre, de l’entropie, qui est au cœur des préoccupations du chercheur.
Dans le même temps, au cours des années 2000, une problématique émerge chez les industriels : ils ne parviennent plus à « jouer de nouveaux scénarii » sur les programmes des simulateurs dont ils ne maitrisaient plus les codes. Plusieurs générations d’ingénieurs ont incrémenté des données dans des programmes devenus de véritables boites noires. Ainsi, comment évaluer avec un maximum de certitudes le potentiel d’un gisement de pétrole, le comportement d’un cœur nucléaire ou encore la pression d’un train entrant dans un tunnel, variant selon sa forme, sa vitesse, la longueur du tunnel… ? Quelles données définir en entrée pour estimer un résultat fiable en sortie, dans ces systèmes complexes et disparates ?
C’est alors que naissent les « computers code experiments », « statistiques pour des expériences simulées » en français, qui consistent à utiliser des techniques de mathématiques aléatoires pour étudier les codes des programmes de simulateurs. Ces programmes contiennent un grand nombre de variables, qui s’influencent mutuellement selon des lois physiques et statistiques parfois chaotiques, faisant émerger une grande variété de résultats selon les conditions initiales de la simulation. Une notion d’intelligence est nécessaire pour comprendre ces résultats, et pour comprendre l’influence des données initiales.
« Nous étudions la statistique du désordre »
souligne Fabrice Gamboa.
Réduire le temps et le coût des expérimentations
Il s’agit de mixer des statistiques avec des modèles physiques, dans un sens et dans l’autre, sous forme d’aller-retour. Pour ce faire, les contraintes sont de taille : les systèmes complexes sont coûteux et nécessite parfois plusieurs jours de calcul pour obtenir une prévision. « Typiquement, les météorologues ne peuvent pas jouer trop de scénarii, ils n’ont pas le temps d’attendre que les calculs se fassent pour prédire la météo de demain », illustre Fabrice Gamboa.
Il faut donc être efficace et procéder par choix de scénario et en jouant les plus probables. En clair : devant quelques milliers de variables, qui toutes n’auront pas la même importance pour répondre à l’objectif -le scénario- assigné, lesquelles choisir ? « Les codes numériques ont besoin d’aide et cette aide, paradoxalement, vient du hasard, de modèles aléatoires, pour des quantités données, construites avec des équations physiques ».
Les recherches du mathématicien parviendront, avant de jouer un scénario, à sélectionner les variables initiales les plus probables pour la simulation à venir.
Mathématiques = algèbre + géométrie !
Dans la chaire AI for physical models with geometric tools -Intelligence artificielle pour les modèles physiques avec des outils géométriques- de l’institut ANITI (Institut interdisciplinaire d’intelligence artificielle de Toulouse) dont il est titulaire, le chercheur a enrichi le point de vue des structures algébriques avec descriptions géométriques des objets traités, pour les comprendre de façon plus fine. Il s’est entouré de Thomas Pellegrini, informaticien spécialiste du développement de réseaux de neurones et du traitement de la parole -un sujet connu pour être chaotique et désordonné en termes mathématiques- et d’un mathématicien ingénieur de formation, Reda Chhaibi (tous les deux enseignants-chercheurs à l’Université Toulouse III – Paul Sabatier)
Les observations et expériences sont pour la plupart conduites en collaboration avec des industriels. Par exemple, les chercheurs partagent un projet avec l’équipementier aéronautique Safran, pour optimiser la forme, donc la performance, des turbines de moteurs d’avion. « Safran dispose de codes de simulation très voraces en calcul. Nous allons utiliser des méthodes statistiques d’apprentissage sur des scénarii déjà joués ou déjà expérimentés physiquement mais non numériquement, pour mettre à jour la simulation sans recalculer l’intégralité ».
Dans un autre domaine, l’équipe de la chaire envisage un travail avec une filiale de l’équipementier automobile Continental pour étudier la durée de vie des batteries à hydrogène. « Si la technologie hydrogène est prometteuse, elle est aussi complexe et méconnue. Nous devons trouver des bases de données pour coupler des apprentissages machine learning avec des équations physiques ». Troisième sujet à l’ordre du jour : une expérimentation avec l’entreprise spécialisée dans les semi-conducteurs NXP, qui dispose d’immenses simulateurs et souhaite optimiser le design de ses cartes.
Autant d’exemples, autant de pas franchis entre recherche fondamentale et applications grandeur nature, des aller-retours que le chercheur apprécie. « Les résolutions de problèmes appliqués sont source d’inspiration pour de nouvelles recherches », se réjouit le chercheur, pour lequel IA hybride signifie « prendre le meilleur du machine learning et des modèles physiques et les mettre ensemble ». Le meilleur semble la bonne option.
IMT : Institut de mathématiques de Toulouse - CNRS, Université Toulouse III - Paul Sabatier, INSA Toulouse, Université Toulouse 1 Capitole, Université Toulouse - Jean Jaurès.