Lorsqu’on aborde le sujet de l’intelligence artificielle, les sujets par défaut sont la génération d’images (DALL-E, Midjourney…) et les agents conversationnels (ChatGPT, Claude…).
Mais l’IA ne se limite pas seulement à ces sujets. Il existe certains modèles dont la popularité est moindre, mais dont l’objectif est très noble : accélérer la recherche scientifique.
Certaines découvertes n’auraient pas pu être réalisées aussi rapidement sans l’utilisation de l’IA. Ainsi, pour l’édition de cette semaine, nous allons présenter des modèles d’IA utiles pour la recherche, ainsi que des découvertes réalisées grâce à eux :
L'IA dans l'archéologie
En l’an 79 après J.C., le Vésuve est entré en éruption. Son éruption a entraîné la destruction de villes telles que Pompéi ou Herculaneum. C’est dans cette dernière ville que l’on peut trouver une villa ayant appartenu au beau-père de Jules César.
Cette villa, qui a été ensevelie sous une vingtaine de mètres de boue et de cendres, abrite une vaste bibliothèque de rouleaux de papyrus. Ces rouleaux ont été carbonisés par la chaleur des débris volcaniques, mais cette carbonisation leur a permis d’être préservés, à contrario des textes anciens qui se sont décomposés à l’air libre.
Cette bibliothèque nous permettrait de multiplier le corpus littéraire de cette période de l’histoire. Mais il y a un problème : ces parchemins carbonisés sont beaucoup trop fragiles pour être manipulés directement. Si on les déplie manuellement, ils se désagrègent et deviennent illisibles.
Le défi est donc le suivant : pouvoir lire les parchemins sans y toucher.
Plusieurs progrès ont été accomplis au cours des années 2010 :
- En 2015, on parvient à scanner un papyrus grâce aux rayons X
- En 2019, on commence à utiliser le Machine Learning pour scanner des papyrus, et deux d’entre eux ont été scannés via cette méthode
Mais c’est à partir de 2023 que ce défi va prendre une toute autre ampleur avec ce qui s’appelle le “Vesuvius Challenge” : un concours permettant à n’importe qui de contribuer à la lecture des parchemins via le machine learning.
Plusieurs dizaines d’objectifs différents ont été fixés, chacun d’entre eux représente une étape clé dans la compréhension des parchemins, et chacun de ses objectifs est mis à prix.
Au cours de l’année 2023, plus de 50 prix ont été distribués pour un total de plus d’un million de dollars, le prix le plus important ayant été attribué pour avoir pu lire 4 paragraphes de 144 lettres.
Grâce à ce challenge, les progrès ont été tels qu’il est désormais possible de lire des parchemins carbonisés via le machine learning, sans avoir besoin de les ouvrir.
Cela dit, le Vesuvius challenge est toujours en cours : maintenant que nous sommes en capacité de lire les parchemins, d’autres objectifs ont été fixés pour augmenter la scalabilité des scans. Par exemple, celui qui sera en capacité de scanner 90% de 4 parchemins différents gagnera 200 000 dollars.
L'IA pour construire de nouveaux matériaux
Depuis une dizaine d’années, les composants informatiques tels que les processeurs ou les cartes graphiques ont considérablement gagné en performance. Mais ce n’est pas le cas pour les batteries.
En effet, les matériaux utilisés pour les batteries n’ont pas vraiment évolué durant cette période, ce qui fait que pour avoir une batterie plus puissante ou plus performante, il faut une batterie plus lourde ou plus grande.
Microsoft s’est donc lancé dans la recherche et le développement de nouveaux matériaux ayant une densité énergétique supérieure, ce qui signifie qu’une batterie serait plus performante à poids et à taille égale.
Problème : 32 millions de matériaux sont envisagés, et la synthèse d’un matériau prend généralement un jour, ce qui ferait environ 100 000 ans de recherche si on synthétisait tous les matériaux possibles.
Il faut donc trouver un moyen d’accélérer les recherches, et les recherches ont été considérablement accélérées grâce à l’IA générative.
Le modèle d’IA qui a été utilisé est un “Distributional Graphormer”. Il s’agit d’un modèle de diffusion (comme DALL-E ou Stable Diffusion), mais au lieu d’utiliser des images d’art, on utilise des images d’atomes et de leurs structures.
En fonction des atomes et la proportion de ces atomes contenus dans un matériau, on peut obtenir une forme 3D de ce matériau. C’est à partir de cette forme 3D que l’on peut en déduire les propriétés des matériaux ainsi que leur comportement.
- Grâce à ce modèle d’IA, le nombre de matériaux potentiels est passé de 32 millions à 800 en seulement quelques jours.
- Les 800 matériaux restants ont été évalués via du calcul haute performance, 18 d’entre eux ont été validés
- Enfin, les 18 matériaux restants ont été évalués en fonction de différents critères tels que leur prix ou leur rareté, et un seul a validé tous ces critères.
Il se trouve que le matériau le plus prometteur pour construire des nouvelles batteries est une combinaison de sodium, lithium, yttrium et de chlore. Pour le moment, ce matériau est testé en laboratoire. Avant la moindre exploitation commerciale, il faudra tester des centaines de batteries fonctionnelles intégrant ce nouveau matériau, sur des milliers de cycles de charge et dans diverses conditions. Mais le plus important à retenir est que l’IA a considérablement accéléré les recherches de ce matériau, et cette méthodologie pourrait être utilisée dans la recherche et développement en général.L'IA pour construire de nouveaux matériauxSi le modèle d’IA de référence est GPT-4o à l’heure actuelle, le modèle de référence pour la recherche biologique et médicale est AlphaFold. AlphaFold est un modèle développé par Google DeepMind, dont la première version a été déployée en 2018. Ce modèle fournit une prédiction de la structure des protéines à partir de leur séquence en acides aminés. Pour cela, AlphaFold utilise des processeurs d’apprentissage automatique qui ont été entraînés sur 170 000 structures protéiques déjà connues. En 2021, AlphaFold a ouvert une base de données publique de modèles de structure prédits par l'IA. Aujourd’hui, cette base contient des prédictions de structure pour presque toutes les protéines connues, et les chercheurs utilisent cette base de données pour concevoir de nouveaux médicaments.
Cette recherche pourrait aller encore plus loin, car le 8 mai 2024, DeepMind et Isomorphic Labs ont annoncé AlphaFold 3. Ce modèle aura non seulement la capacité de prédire la structure des protéines, mais aussi de prédire la structure et les interactions avec l'ADN, l'ARN et certains ligands ou ions.
Ainsi, certaines découvertes de nouveaux médicaments devraient être significativement accélérées. Isomorphic Labs a également déclaré que d’autres modèles d’IA étaient utilisés en plus d’AlphaFold 3 pour améliorer le processus de découverte.
Masterclass gratuite
Nos experts répondent à vos questions sur l'intelligence artificielle !
S'inscrire au WebinaireMasterclass gratuite
Nos experts répondent à vos questions sur la blockchain !
S'inscrire au Webinaire