Les scientifiques utilisent l’IA générative pour répondre à des questions complexes de physique

Lorsque l’eau gèle, elle passe d’une phase liquide à une phase solide, ce qui entraîne un changement radical de propriétés telles que la densité et le volume. Les transitions de phase dans l’eau sont si courantes que la plupart d’entre nous n’y pensent probablement même pas, mais les transitions de phase dans les nouveaux matériaux ou les systèmes physiques complexes constituent un domaine d’étude important.

Pour bien comprendre ces systèmes, les scientifiques doivent être capables de reconnaître les phases et de détecter les transitions entre elles. Mais la manière de quantifier les changements de phase dans un système inconnu reste souvent floue, surtout lorsque les données sont rares.

Des chercheurs du MIT et de l’Université de Bâle en Suisse ont appliqué des modèles d’intelligence artificielle générative à ce problème, développant un nouveau cadre d’apprentissage automatique capable de tracer automatiquement des diagrammes de phases pour de nouveaux systèmes physiques.

Leur approche d’apprentissage automatique basée sur la physique est plus efficace que les techniques manuelles laborieuses qui reposent sur une expertise théorique. Il est important de noter que leur approche s’appuyant sur des modèles génératifs, elle ne nécessite pas d’énormes ensembles de données de formation étiquetés utilisés dans d’autres techniques d’apprentissage automatique.

Un tel cadre pourrait aider les scientifiques à étudier les propriétés thermodynamiques de nouveaux matériaux ou à détecter l’intrication dans les systèmes quantiques, par exemple. A terme, cette technique pourrait permettre aux scientifiques de découvrir de manière autonome des phases inconnues de la matière.

« Si vous disposiez d’un nouveau système aux propriétés totalement inconnues, comment choisiriez-vous la quantité observable à étudier ? L’espoir, au moins avec les outils basés sur les données, est que vous puissiez analyser de nouveaux systèmes de grande taille de manière automatisée, ce qui vous indiquera des changements importants dans le système. Cela pourrait être un outil dans le processus de découverte scientifique automatisée de nouvelles propriétés exotiques des phases », déclare Frank Schäfer, postdoctorant au Julia Lab du Laboratoire d’informatique et d’intelligence artificielle (CSAIL) et co-auteur d’un article sur cette approche.

Schäfer est accompagné du premier auteur Julian Arnold, étudiant diplômé à l’Université de Bâle ; Alan Edelman, professeur de mathématiques appliquées au Département de mathématiques et responsable du Julia Lab ; et l’auteur principal Christoph Bruder, professeur au Département de physique de l’Université de Bâle. La recherche est publié aujourd’hui dans Lettres d’examen physique.

Détection des transitions de phase à l’aide de l’IA

Bien que la transition de l’eau vers la glace puisse être l’un des exemples les plus évidents de changement de phase, des changements de phase plus exotiques, comme lorsqu’un matériau passe du statut de conducteur normal à celui de supraconducteur, intéressent vivement les scientifiques.

Ces transitions peuvent être détectées en identifiant un « paramètre de commande », une quantité importante et susceptible de changer. Par exemple, l’eau gèle et passe à une phase solide (glace) lorsque sa température descend en dessous de 0 degré Celsius. Dans ce cas, un paramètre d’ordre approprié pourrait être défini en termes de proportion de molécules d’eau faisant partie du réseau cristallin par rapport à celles restant dans un état désordonné.

Dans le passé, les chercheurs s’appuyaient sur l’expertise en physique pour construire manuellement des diagrammes de phases, en s’appuyant sur une compréhension théorique pour savoir quels paramètres d’ordre étaient importants. Non seulement cela est fastidieux pour les systèmes complexes, et peut-être impossible pour les systèmes inconnus dotés de nouveaux comportements, mais cela introduit également des préjugés humains dans la solution.

Plus récemment, des chercheurs ont commencé à utiliser l’apprentissage automatique pour créer des classificateurs discriminants capables de résoudre ce problème en apprenant à classer une statistique de mesure comme provenant d’une phase particulière du système physique, de la même manière que de tels modèles classent une image comme un chat ou un chien.

Les chercheurs du MIT ont démontré comment des modèles génératifs peuvent être utilisés pour résoudre cette tâche de classification de manière beaucoup plus efficace et fondée sur la physique.

Le Langage de programmation Juliaun langage populaire pour le calcul scientifique qui est également utilisé dans les cours d’introduction à l’algèbre linéaire du MIT, offre de nombreux outils qui le rendent inestimable pour construire de tels modèles génératifs, ajoute Schäfer.

Les modèles génératifs, comme ceux qui sous-tendent ChatGPT et Dall-E, fonctionnent généralement en estimant la distribution de probabilité de certaines données, qu’ils utilisent pour générer de nouveaux points de données qui correspondent à la distribution (comme de nouvelles images de chats similaires aux images de chats existantes). .

Cependant, lorsque des simulations d’un système physique utilisant des techniques scientifiques éprouvées sont disponibles, les chercheurs obtiennent gratuitement un modèle de sa distribution de probabilité. Cette distribution décrit les statistiques de mesure du système physique.

Un modèle plus averti

L’équipe du MIT estime que cette distribution de probabilité définit également un modèle génératif sur lequel un classificateur peut être construit. Ils intègrent le modèle génératif à des formules statistiques standard pour construire directement un classificateur au lieu de l’apprendre à partir d’échantillons, comme cela se faisait avec les approches discriminantes.

« C’est une très bonne façon d’incorporer quelque chose que vous connaissez sur votre système physique au plus profond de votre programme d’apprentissage automatique. Cela va bien au-delà de la simple ingénierie des fonctionnalités sur vos échantillons de données ou de simples biais inductifs », explique Schäfer.

Ce classificateur génératif peut déterminer dans quelle phase se trouve le système en fonction d’un paramètre donné, comme la température ou la pression. Et comme les chercheurs se rapprochent directement des distributions de probabilité sous-jacentes aux mesures du système physique, le classificateur possède une connaissance du système.

Cela permet à leur méthode de mieux fonctionner que les autres techniques d’apprentissage automatique. Et comme elle peut fonctionner automatiquement sans nécessiter une formation approfondie, leur approche améliore considérablement l’efficacité informatique de l’identification des transitions de phase.

En fin de compte, de la même manière que l’on pourrait demander à ChatGPT de résoudre un problème mathématique, les chercheurs peuvent poser au classificateur génératif des questions telles que « cet échantillon appartient-il à la phase I ou à la phase II ? ou « Cet échantillon a-t-il été généré à haute température ou à basse température ? »

Les scientifiques pourraient également utiliser cette approche pour résoudre différentes tâches de classification binaire dans les systèmes physiques, éventuellement pour détecter l’intrication dans les systèmes quantiques (l’état est-il intriqué ou non ?) ou pour déterminer si la théorie A ou B est la mieux adaptée pour résoudre un problème particulier. Ils pourraient également utiliser cette approche pour mieux comprendre et améliorer les grands modèles de langage comme ChatGPT en identifiant comment certains paramètres doivent être ajustés afin que le chatbot donne les meilleurs résultats.

À l’avenir, les chercheurs souhaitent également étudier les garanties théoriques concernant le nombre de mesures dont ils auraient besoin pour détecter efficacement les transitions de phase et estimer la quantité de calculs nécessaires.

Ce travail a été financé en partie par le Fonds national suisse, le MIT-Suisse Lockheed Martin Seed Fund et le MIT International Science and Technology Initiatives.

Source

Autres articles

Affiner Llama 3.2 avec Unsloth

Donner les moyens aux futurs innovateurs à travers une optique d’impact social | Actualités du MIT

Résumé mensuel d’AIhub : mars 2024 – Interaction homme-robot, informatique sans serveur et apprentissage par renforcement profond pour les réseaux de communication