Depuis plus d’un siècle, les scientifiques utilisent la cristallographie aux rayons X pour déterminer la structure des matériaux cristallins comme les métaux, les roches et les céramiques.
Cette technique est plus efficace lorsque le cristal est intact, mais souvent, les chercheurs ne disposent que de versions en poudre du matériau, contenant des fragments aléatoires du cristal. Cela complique la reconstitution de la structure globale.
Les chimistes du MIT ont développé un nouveau modèle d’IA générative qui facilite la détermination des structures de ces cristaux en poudre. Ce modèle de prédiction pourrait aider les chercheurs à caractériser des matériaux utilisés dans les batteries, les aimants et de nombreuses autres applications.
« La structure est la première chose à connaître pour tout matériau. Elle est cruciale pour la supraconductivité, les aimants, et pour comprendre les systèmes photovoltaïques que vous avez créés. Elle est essentielle pour toute application centrée sur les matériaux », explique Danna Freedman, professeur de chimie Frederick George Keyes au MIT.
Freedman et Jure Leskovec, professeur d’informatique à l’Université de Stanford, sont les auteurs principaux de cette nouvelle étude, publiée aujourd’hui dans le Journal of the American Chemical Society. Eric Riesel, étudiant diplômé du MIT, et Tsach Mackey, étudiant de premier cycle à l’Université de Yale, sont les principaux auteurs de l’article.
Des motifs distinctifs
Les matériaux cristallins, incluant les métaux et la plupart des autres solides inorganiques, sont constitués de réseaux de nombreuses unités identiques et répétitives. Ces unités peuvent être vues comme des « boîtes » de formes et tailles distinctes, où les atomes sont arrangés précisément.
Lorsque les rayons X traversent ces réseaux, ils diffractent les atomes à différents angles et intensités, révélant des informations sur la position des atomes et les liaisons entre eux. Cette technique est utilisée depuis le début des années 1900 pour analyser des matériaux, y compris des molécules biologiques avec une structure cristalline, comme l’ADN et certaines protéines.
Pour les matériaux qui n’existent que sous forme de poudre cristalline, la résolution de ces structures est beaucoup plus difficile car les fragments ne contiennent pas la structure 3D complète du cristal d’origine.
« Le réseau précis existe toujours, car ce que nous appelons une poudre est en réalité un ensemble de microcristaux. Vous avez donc le même réseau qu’un grand cristal, mais leur orientation est entièrement aléatoire », explique Freedman.
Pour des milliers de ces matériaux, des diagrammes de diffraction des rayons X existent mais restent non résolus. Pour tenter de déchiffrer les structures de ces matériaux, Freedman et ses collègues ont formé un modèle d’apprentissage automatique sur les données d’une base de données appelée Materials Project, qui contient plus de 150 000 matériaux. Ils ont d’abord introduit des dizaines de milliers de ces matériaux dans un modèle existant capable de simuler les diagrammes de diffraction des rayons X. Ensuite, ils ont utilisé ces modèles pour entraîner leur IA, qu’ils appellent Crystalyze, afin de prédire les structures basées sur les modèles de rayons X.
Le modèle divise le processus de prédiction des structures en plusieurs sous-tâches. Il détermine d’abord la taille et la forme de la « boîte » du réseau ainsi que les atomes qui y entreront. Ensuite, il prédit la disposition des atomes dans la boîte. Pour chaque diagramme de diffraction, le modèle génère plusieurs structures possibles, qui peuvent être testées en introduisant les structures dans un modèle qui détermine les diagrammes de diffraction pour une structure donnée.
« Notre modèle est une IA générative, ce qui signifie qu’il génère quelque chose qu’il n’a jamais vu auparavant, ce qui nous permet de générer plusieurs suppositions différentes », explique Riesel. « Nous pouvons faire une centaine de suppositions, puis prédire à quoi devrait ressembler le modèle de poudre pour nos suppositions. Si l’entrée ressemble exactement à la sortie, alors nous savons que nous avons bien fait les choses.
Résoudre des structures inconnues
Les chercheurs ont testé le modèle sur plusieurs milliers de modèles de diffraction simulés du Materials Project. Ils l’ont également testé sur plus de 100 diagrammes de diffraction expérimentaux de la base de données RRUFF, qui contient des données de diffraction des rayons X sur poudre pour près de 14 000 minéraux cristallins naturels, qu’ils avaient exclus des données d’entraînement. Sur ces données, le modèle était précis environ 67 % du temps. Ensuite, ils ont commencé à tester le modèle sur des modèles de diffraction qui n’avaient pas été résolus auparavant. Ces données proviennent du Powder Diffraction File, qui contient des données de diffraction pour plus de 400 000 matériaux résolus et non résolus.
À l’aide de leur modèle, les chercheurs ont mis au point des structures pour plus de 100 de ces modèles jusqu’alors non résolus. Ils ont également utilisé leur modèle pour découvrir les structures de trois matériaux créés par le laboratoire de Freedman en forçant des éléments qui ne réagissent pas à la pression atmosphérique à former des composés sous haute pression. Cette approche peut être utilisée pour générer de nouveaux matériaux ayant des structures cristallines et des propriétés physiques radicalement différentes, même si leur composition chimique est la même.
Le graphite et le diamant, tous deux constitués de carbone pur, sont des exemples de tels matériaux. Les matériaux développés par Freedman, qui contiennent chacun du bismuth et un autre élément, pourraient être utiles dans la conception de nouveaux matériaux pour aimants permanents.
« Nous avons découvert de nombreux nouveaux matériaux à partir de données existantes et, plus important encore, avons résolu trois structures inconnues de notre laboratoire qui constituent les premières nouvelles phases binaires de ces combinaisons d’éléments », explique Freedman.
Être capable de déterminer les structures de matériaux cristallins en poudre pourrait aider les chercheurs travaillant dans presque tous les domaines liés aux matériaux, selon l’équipe du MIT, qui a publié une interface Web pour le modèle sur crystalize.org.
La recherche a été financée par le Département américain de l’Énergie et la National Science Foundation.