Biologie et IA : le duo vertueux de Thomas Schiex

7 juin 2021

6 minutes

portrait Thomas Schiex — © Hélène Ressayres

L’IA doit servir l’humanité. Appliquée à la biologie, les algorithmes offrent de grandes opportunités d’applications. Rencontre avec Thomas Schiex, le bio informaticien qui relie la théorie à la pratique.

Par Valérie Ravinet, journaliste.

« J’adore la théorie, mais j’aime aussi la pratique », s’amuse Thomas Schiex, chercheur INRAE (Institut national de la recherche pour l'agriculture, l'alimentation et l'environnement) depuis presque trente ans. Bio informaticien, Thomas Schiex se consacre à l’écriture de logiciels puis à l’ajout de fonctionnalités pour améliorer les algorithmes d’intelligence artificielle (IA) basés sur le raisonnement automatique. Les machines prennent des décisions de manière autonome en appliquant des règles, une approche appelée IA symbolique ou déterministe.

« L’application de règles de déductions et la création d’hypothèses via des mécanismes qui sont intégrés aux machines et guident leurs prises de décision de manière autonome : telle est la voie que j’ai choisie et que j’ai appliquée au fil des années »
confie le chercheur.

La programmation en mode paresse

Ingénieur diplômé de l’École centrale Paris, Thomas Schiex a rejoint l’Université Toulouse III - Paul Sabatier en 1986 pour son travail de thèse en intelligence artificielle. Il développe alors un langage de programmation fonctionnel dit « paresseux » : c’est la machine qui décide seule, du moment où le travail qu’on lui demande est à réaliser. Il sourit : « la machine procrastine jusqu’au moment où elle juge que la tâche doit être faite ».

Thomas Schiex est ensuite recruté dans le département automatique du centre français de recherche aérospatiale, l’ONERA. Il y conçoit des outils d’IA pour les secteurs du spatial, avant de se voir confier un contrat pour le compte de l’armée. Pas tout à fait sa tasse de thé. Un poste à l’INRA (qui deviendra INRAE) attire son attention. « La biologie était peu porteuse dans ma spécialité, et pourtant, j’y ai trouvé ma place et je n’ai plus changé », sourit-il. « Même si la recherche, en France, n’est pas sur une pente favorable, je suis heureux dans mon laboratoire ». Il décline ainsi quelques offres « financièrement alléchantes » à l’étranger et continue avec enthousiasme de parler IA dans des conférences très spécialisées et de se servir de ses compétences pour résoudre des problèmes de biologie.

« C’est un cercle vertueux motivant : de la recherche fondamentale utile ! »

Des mètres linéaires de gènes, de calcul et des kg de chocolat

Au milieu des années 90, il développe un outil de cartographie génétique, baptisé CarthaGène, qui analyse les génomes de plantes puis s’enrichit pour s’adapter à l’analyse de la génétique animale. « Un procédé complémentaire et plus souple que le croisement de génomes réels, qui nécessite d’élever des sujets spécialement à cette intention. Grâce à l’IA, on s’affranchit de certaines étapes, notamment la culture de plantes. »

Il approfondit ensuite ses travaux en génomique, parce que « l’IA apparait fort utile dans ce domaine pour disséquer les séquences ADN des plantes ou des animaux ». Ses travaux lui valent des publications dans des revues comme Nature, ce qui est plutôt rare pour un informaticien. Il raconte d’ailleurs comment son équipe, impliquée dans l’analyse du génome d’une espèce de cacao, gagne de vitesse un projet américain, porté par Mars Chocolate, IBM et l’USDA, équivalent américain de l’INRA.

« Fair-play, les Américains nous ont envoyé un carton de plusieurs kilos d’un chocolat de grande qualité que nous avons partagé entre informaticiens et biologistes. J’ai vraiment réalisé à ce moment que le travail abstrait que nous menions pouvait avoir un impact direct sur la planète, sur la vie des hommes, sur leur capacité à se nourrir, donc à survivre »
se souvient le chercheur.

Ni vrai ni faux, mais probable

Thomas Schiex sait son objet d’études atypique. « Notre travail est abstrait, mathématique. Dans nos domaines, les connaissances sont vraies ou fausses. Or, la biologie est une science expérimentale, concrète, on n’y découvre que des exceptions : un vrai défi pour les informaticiens ! » Les outils des années 1990 n’étaient pas en mesure de faire face à l’imprécision et à l’erreur inhérents à la discipline.

« J’ai dû m’adapter à une situation de recherche où rien n’est vraiment vrai et rien n’est vraiment faux. Nous avons donc développé des outils de raisonnement automatique capables d’aller au-delà du raisonnement logique pure et développé des algorithmes qui raisonnent sur des nombres et des probabilités. »

Baptisé Toolbar, puis Toulbar2 dans sa dernière version, l’outil mis à disposition de l’ensemble de la communauté, en open source, sert à produire des raisonnements rigoureux. En 20 ans, grâce à des collaborations internationales, il est devenu rapide et efficace. Plus récemment, Toulbar2 a été connecté à des outils d’apprentissage automatique ou machine learning, l’autre approche de l’IA. « Nous avons abouti à des résultats amusants : par exemple, Toulbar2 a appris seul les règles de Sudoku et y joue avec une facilité déconcertante ! ». Thomas Schiex a été récompensé au niveau international du prix AAAI Fellows 2020 par l’Association for the Advancement of Artificial Intelligence (AAAI), « pour ses contributions significatives à la théorie et aux algorithmes du raisonnement basé sur les contraintes et à leurs applications en biologie computationnelle ».

Vive la protéine !

C’est le hasard qui a conduit le chercheur et son équipe vers le design moléculaire, un « ensemble de techniques permettant de représenter et de visualiser la forme des molécules dans l’espace, et de simuler leurs mouvements et leurs comportements » Une collaboration avec Toulouse Biology Institute (TBI), spécialisé dans le domaine de l’ingénierie protéique, s’amorce, avec des études dédiées à des molécules naturelles utilisées pour des applications multiples, en santé, dans l’industrie, et jusque dans les produits ménagers. Ces petits agents sont dotés d’un nombre de fonctions incroyable : dégrader des produits, les transporter, les assembler...

« Le computational protein design se classe parmi les conceptions les plus difficiles de la théorie informatique de la complexité. Toulbar2 arrive ici à contenir l’explosion exponentielle de la difficulté. L’outil optimise les compositions des protéines sur certains critères pour capturer la stabilité, avec des algorithmes et des modèles dédiés »
explique-t-il.

C’est ainsi que l’équipe met au point, avec des collègues biochimistes de la Katholieke Universiteit Leuven, une protéine symétrique, stable et solide, qui s’assemble seule dans l’eau et résiste aux produits chimiques. Elle sert aujourd’hui à calibrer certains instruments de microscopie électronique. Puis c’est au tour d’un squelette de nano-anticorps, en cours de dépôt de brevet, un projet financé par l’INSERM. « Le monde de la santé est organisé autour de la propriété industrielle, notre travail ne sera malheureusement pas mis en open source », regrette-t-il.

Bientôt une start-up ?

Recruté par l’institut interdisciplinaire d’intelligence artificielle de Toulouse ANITI (porté par la Communauté d'universités et établissements de Toulouse), Thomas Schiex porte la chaire « Intuition1 et logique2 pour le design ». Son objectif : enrichir et sophistiquer Toulbar2 en y optimisant les deux approches de l’intelligence artificielle, le raisonnement automatique, à l’origine des travaux du chercheur et le machine learning, qui se nourrit de données pour en extraire des probabilités. Le chercheur qui fourmille d’idées et de projets réfléchit à la création d’une start-up pour inventer des protéines de tout type grâce à Toulbar2.

« J’ai de plus en plus envie de servir les besoins de la planète. J’oriente mon travail vers des découvertes à fort impact social, utiles au quotidien, en environnement et en santé. C’est devenu ma priorité ! »
complète le chercheur.

Voix off

Quelle est la première chose que vous faites en vous levant ? Ce n’est pas très fun. J’ai eu un accident de voiture grave dans ma jeunesse, mon pronostic vital était engagé. En y songeant, je me dis que cela a sans doute stimulé mon envie de créer ! Mon organisme est depuis partiellement défaillant. Avant même de me lever, je dois enfiler mes bas de contention.
Quel est votre principal trait de caractère ? Une insatiable curiosité, qui me coûte cher car elle est très chronophage. A être trop curieux, on risque de se disperser et de s’épuiser. Mais j’apprends petit à petit à la contrôler en vieillissant !
A quelle époque auriez-vous aimé vivre ? Dans le futur ! Je suis frustré de savoir que je vais mourir et que je ne participerai pas à toutes les évolutions à venir. Le savoir est l’une de mes premières sources de plaisir. Si je devais retourner dans le passé, je choisirais le siècle des Lumières, un moment de découvertes impressionnant.
Quel est l'objet préféré de votre bureau ? Mon ordinateur, bien sûr ! C’est l’objet dont je dépends le plus, c’est donc aussi parfois une source de souffrance…
Ce que vous appréciez le plus chez vos collègues ? J’aime les gens dynamiques, qui me donnent envie d’aller de l’avant avec eux. J’apprécie aussi la gentillesse, une façon d’être intrinsèquement attentif aux autres.
Le don de la nature que vous voudriez avoir ? La capacité d’apprendre toujours plus. J’aurais bien aimé que la nature me dote d’un cerveau un peu plus capacitif et résilient à l’âge !
Quel rêve vous reste-t-il à accomplir ? Sans hésitation : concevoir plein de protéines utiles pour la santé et l’environnement.
La dernière fois que vous avez ri aux larmes ? Je ne suis pas forcément très sérieux, mais je mémorise surtout les instants douloureux. Avouons-le, je ne m’en souviens pas !
Quel chercheur.e vous a inspiré ? Les physiciens : Einstein, Fermi, de Broglie… J’ai commencé à lire des ouvrages sur leurs travaux dès le début de mon adolescence.
Quel est la dernière chose que vous faites avant de vous coucher ? J’enlève mes bas de contention. Un début et une fin symétriques, comme la protéine que nous avons conçue.

TBI : Toulouse Biology Institute – INSA, INRAE, CNRS.

biologie IA innovation numérique