Chaque année, l’Association pour l’avancement de l’intelligence artificielle (AAAI) honore des individus ayant apporté des contributions significatives et soutenues au domaine de l’intelligence artificielle en les nommant Fellows. Nous avons discuté avec certains des Boursiers AAAI 2024 pour en savoir plus sur leurs recherches. Dans cette interview, nous rencontrons Anima Anandkumar pour découvrir ses travaux sur les Opérateurs Neuronaux, dont elle est l’inventrice.
Pourquoi les opérateurs neuronaux sont-ils si puissants et comment permettent-ils une telle avancée par rapport aux méthodes de réseaux neuronaux précédentes pour les problèmes scientifiques et techniques ?
Les opérateurs neuronaux peuvent apprendre des phénomènes physiques complexes à plusieurs résolutions, contrairement aux réseaux neuronaux standard qui utilisent une résolution fixe. Les réseaux neuronaux standard utilisent un nombre fixe de pixels pour apprendre un phénomène, tandis que les opérateurs neuronaux représentent les données sous forme de fonctions continues. Cela leur permet de capturer des détails fins que les réseaux neuronaux traditionnels ne peuvent pas. Vous pouvez comparer cela aux graphiques vectoriels et raster : les graphiques raster deviennent flous lorsqu’on zoome, alors que les graphiques vectoriels restent nets car ils utilisent des fonctions continues.
Les opérateurs neuronaux sont particulièrement pertinents pour les problèmes scientifiques et techniques qui se produisent à plusieurs échelles. Par exemple, pour prédire l’évolution d’un ouragan, il est crucial de capturer les moindres détails. Les opérateurs neuronaux peuvent le faire avec précision et sont beaucoup plus rapides (4 à 6 ordres de grandeur) que les modèles numériques traditionnels.
Existe-t-il des types particuliers de problèmes pour lesquels les opérateurs neuronaux sont particulièrement bien adaptés ? De même, des problèmes pour lesquels ils ne sont pas si bien adaptés ?
Les opérateurs neuronaux étendent les réseaux neuronaux standard à des fonctions continues, constituant ainsi une classe d’architectures plus générale. Ils peuvent être appliqués dans n’importe quel scénario d’apprentissage, mais sont particulièrement efficaces pour apprendre des phénomènes qui ne se limitent pas à une seule résolution.
Examinons une application en particulier : les prévisions météorologiques. Pourriez-vous parler de votre modèle FourCastNet et des contributions que ce travail a apportées au monde de la prévision ?
FourCastNet est le premier modèle météorologique entièrement basé sur l’IA, construit à l’aide d’opérateurs neuronaux. Il est des dizaines de milliers de fois plus rapide que les modèles météorologiques traditionnels tout en étant précis. Alors que les modèles traditionnels nécessitent un superordinateur, FourCastNet fonctionne sur un GPU de jeu et fournit une prévision sur deux semaines en moins d’une minute. Il est désormais opérationnel au CEPMMT, l’agence météorologique européenne, et ses cartes de prévisions sont accessibles à tous. Notre modèle est également open source et peut être téléchargé et exécuté par n’importe qui. Lors du récent ouragan Beryl, FourCastNet a présenté une incertitude moindre par rapport aux modèles traditionnels, prédisant ainsi avec précision la trajectoire.
Outre les prévisions météorologiques, vous avez appliqué le cadre des opérateurs neuronaux à de nombreux domaines. Y en a-t-il d’autres que vous aimeriez souligner ?
Nous avons largement appliqué les opérateurs neuronaux. Ils sont une technique générale d’IA pour résoudre les équations aux dérivées partielles (PDE), essentielles à la modélisation scientifique. Nous les avons utilisés pour modéliser l’évolution du plasma dans la fusion nucléaire, ce qui est plus d’un million de fois plus rapide que les simulations numériques. Cela peut aider à prédire et prévenir les perturbations dans les réacteurs à fusion, nous rapprochant ainsi du rêve d’une fusion durable. Nous les avons également appliqués à la modélisation du stockage du dioxyde de carbone dans des réservoirs souterrains, avec une vitesse également environ un million de fois plus rapide que les simulations traditionnelles, permettant ainsi de planifier l’atténuation du changement climatique.
Récemment, nous avons conçu un nouveau cathéter médical utilisant des opérateurs neuronaux. Un cathéter est un tube utilisé pour aspirer des liquides hors du corps humain, mais les bactéries peuvent nager en amont et provoquer des infections. Nous avons formé un modèle d’opérateur neuronal pour comprendre l’écoulement des fluides et l’activité bactérienne, générant une conception optimale de crêtes à l’intérieur du tube pour créer des vortex et empêcher les bactéries de nager dans le corps humain. Nous l’avons imprimé en 3D et testé en laboratoire, enregistrant une réduction de cent fois de la contamination bactérienne. Les opérateurs neuronaux sont donc efficaces non seulement pour la simulation, mais aussi pour la conception inverse grâce à leur différentiabilité.
Dans votre récente conférence TED, vous avez présenté une vision d’un modèle général d’IA pour la découverte scientifique. Pouvez-vous parler un peu de vos progrès actuels dans ce sens ?
Je crois que l’avenir de la science est AI+Science : une IA qui comprend profondément le monde physique et est capable de simuler et de concevoir sans hallucinations. Ce sera un grand pas en avant par rapport à l’état actuel de la science, qui repose principalement sur un processus d’essais et d’erreurs, où le goulot d’étranglement réside dans le temps et le coût des expériences physiques. Le fait que l’IA remplace bon nombre de ces expériences changera la donne. Les modèles de langage sont incapables de le faire car ils n’ont aucune base physique. Cela nécessite un modèle d’IA généraliste qui comprend un large éventail de phénomènes physiques. Les opérateurs neuronaux servent de base à un tel modèle d’IA pour une compréhension physique universelle.
À propos d’Anima
Anima Anandkumar a réalisé un travail de pionnier sur les algorithmes d’IA qui ont révolutionné les domaines scientifiques, notamment la modélisation météorologique et climatique, la découverte de médicaments, les simulations scientifiques et la conception technique. Elle a inventé des opérateurs neuronaux qui étendent l’apprentissage profond à la modélisation de processus multi-échelles dans ces domaines scientifiques. Elle a développé le premier modèle météorologique à haute résolution basé sur l’IA qui a montré des performances compétitives par rapport aux pratiques actuelles tout en étant des dizaines de milliers de fois plus rapide et qui est déployé au Centre européen pour les prévisions météorologiques à moyen terme (ECMWF), une agence météorologique mondiale de premier plan. |
Anima est professeur Bren à Caltech et membre de l’AAAI, de l’IEEE et de l’ACM. Elle a reçu plusieurs prix, notamment les bourses Guggenheim et Alfred P. Sloan, le prix IEEE Kiyo Tomiyasu, le Schmidt Sciences AI2050 senior Fellow, le Distinguished Alumnus Award de l’Indian Institute of Technology Madras, le NSF Career Award et le prix du meilleur article dans des lieux tels que Neural Information Processing et le prix spécial ACM Gordon Bell pour la recherche HPC-Based COVID-19. Elle a récemment présenté ses travaux sur AI+Science au Conseil scientifique de la Maison Blanche (PCAST), au Comité consultatif national sur l’IA et à TED 2024.
Elle a obtenu son B. Tech de l’Institut indien de technologie de Madras et son doctorat de l’Université Cornell et a effectué ses recherches postdoctorales au MIT. Elle était auparavant scientifique principale chez Amazon Web Services et directrice principale de la recherche sur l’IA chez NVIDIA.
Balises : AAAI, Boursiers AAAI 2024
Lucy Smith, rédactrice en chef d’AIhub.