Dans cette série d’entretiens, nous rencontrons certains des participants du Consortium doctoral AAAI/SIGAI pour en savoir plus sur leurs recherches. Le Consortium doctoral offre à un groupe de doctorants la possibilité de discuter et d’explorer leurs intérêts de recherche et leurs objectifs de carrière dans le cadre d’un atelier interdisciplinaire avec un panel de chercheurs confirmés. Dans cette dernière interview, nous entendons Yuan Yang, qui a terminé son doctorat en mai. Cet automne, Yuan rejoindra le Collège d’information, de génie mécanique et électrique de l’Université normale de Shanghai en tant que professeur agrégé.
Parlez-nous un peu de votre doctorat : où avez-vous étudié et quel était le sujet de vos recherches ?
De août 2018 à mai 2024, j’ai effectué mon doctorat au département d’informatique de l’Université Vanderbilt, située à Nashville, Tennessee. J’ai mené mes recherches dans le laboratoire d’Intelligence artificielle et systèmes visuels analogiques dirigé par le Dr Maithilee Kunda. Nos travaux se concentrent principalement sur la manière dont l’imagerie mentale visuelle contribue à l’apprentissage et au comportement intelligent chez les humains et les systèmes d’IA, avec des applications dans l’évaluation cognitive et l’éducation spécialisée, notamment en lien avec l’autisme et d’autres conditions neurodiverses. Influencé par ces travaux, je me suis intéressé à des sujets liés à la cognition humaine, tels que le raisonnement visuel abstrait, la création d’analogies et l’imagerie mentale. D’une part, j’examine comment la connaissance de ces capacités cognitives peut aider à construire de meilleurs systèmes d’IA ; d’autre part, je réfléchis à la manière dont l’IA peut nous aider à mieux comprendre ces capacités cognitives.
Pourriez-vous nous donner un aperçu des recherches que vous avez menées au cours de votre doctorat ?
Mon directeur de thèse m’a permis d’explorer pleinement mes intérêts de recherche au début de mon doctorat. Initialement, j’étais fasciné par le codage permettant aux robots d’effectuer diverses tâches dans des environnements virtuels, comme les Jeux olympiques de l’IA animale et l’initiative pour l’apprentissage interactif des tâches, ainsi que de nombreux projets de classe sur les robots.
Ensuite, mon attention s’est progressivement portée sur des facteurs cognitifs plus profonds qui pourraient sous-tendre diverses tâches robotiques. Cela a conduit à plusieurs changements dans mes recherches. Premièrement, pour éviter la complexité supplémentaire des systèmes robotiques et des environnements virtuels, je suis passé des tâches robotiques aux tâches de raisonnement visuel abstrait (VAR), un type de tâche couramment utilisé dans l’évaluation cognitive humaine. L’une des tâches VAR les plus connues que j’utilise est le test des matrices progressives de Raven (RPM), illustré dans la figure 1 (il s’agit d’un exemple d’élément que j’ai créé, pas d’un véritable élément de test). Ces tests semblent moins complexes que les tâches robotiques, mais elles présentent un grand défi pour l’IA lorsqu’elles sont présentées ou formulées de la manière dont les évaluations cognitives humaines sont administrées. J’ai d’abord construit des systèmes symboliques basés sur l’imagerie pour résoudre des tâches VAR, dont l’idée principale était de représenter le processus de raisonnement sous forme d’images et de séquences d’opérations sur les images. Ensuite, j’ai réalisé que la capacité à faire des analogies était une composante importante des facteurs cognitifs testés par les tâches VAR et j’ai commencé à approfondir les théories de création d’analogies. En travaillant sur l’imagerie, j’ai créé une « version imagée » de la théorie de la création d’analogies, inspirée des théories existantes et de mes travaux d’imagerie. J’ai également expérimenté des réseaux neuronaux profonds sur des tâches VAR, en essayant de mettre en œuvre les idées obtenues grâce à des études d’imagerie et d’analogie dans des réseaux neuronaux profonds. Compte tenu du paradigme de recherche synergique que j’ai mentionné ci-dessus, une comparaison a dû être faite entre les études cognitives humaines et les réseaux neuronaux profonds, par exemple en termes de mécanismes de traitement de l’information, de capacité de généralisation, de protocoles de test, etc. Mais il y a eu un grand écart car les deux camps ne s’alignent généralement pas très bien.
Figure 1. Un exemple de test des matrices progressives de Raven.
Y a-t-il un aspect de votre recherche qui a été particulièrement intéressant ?
Je pense que la partie la plus intéressante de ma recherche est « d’être abstrait ». Nous, les humains, pouvons penser de manière abstraite et former divers concepts ou symboles abstraits dans notre esprit. Tous les tests VAR testent en réalité notre capacité à gérer des concepts abstraits, par exemple à détecter, rappeler, apprendre, créer, modifier et appliquer des concepts abstraits dans différents contextes de perception. Étant donné que nous, les humains, sommes tellement habitués à penser de manière abstraite et si capables de le faire, nous ne pensons généralement pas que cela soit un problème pour les systèmes d’IA. Mais, en fait, lorsqu’une telle capacité est spécialement testée dans l’IA, par exemple via RPM ou des tests ou ensembles de données similaires, nous constatons qu’aucun système d’IA n’est assuré d’avoir ce type de capacité, même pour un ensemble très limité d’informations abstraites. notions. Par exemple, comment entraîneriez-vous ou concevriez-vous vos systèmes d’IA pour comprendre le concept de « récursion » ou de « preuve par contradiction » ? Comment vérifieriez-vous vos systèmes d’IA en termes de ces concepts abstraits ? Mon sentiment est que certains concepts abstraits (en particulier les plus importants) exigent que les systèmes d’IA « sortent de leur propre système » pour observer et raisonner sur leur propre comportement. Cependant, nous savons qu’il existe certaines limites générales pour « sortir de leurs propres systèmes » pour les systèmes informatiques ou formels. Mais comment se fait-il que les humains aient la capacité de gérer des concepts abstraits ? Ou est-ce simplement une illusion que les humains ont cette aimable capacité ? Ces questions impliquent probablement beaucoup de réflexion philosophique et mathématique, ainsi que des efforts interdisciplinaires du point de vue des sciences cognitives.
Quels sont vos projets pour développer vos recherches doctorales ? Quels aspects souhaiteriez-vous étudier ensuite ?
Il y a beaucoup de questions sans réponse dans ma thèse, par exemple, la capacité à traiter des concepts abstraits de différentes manières et le décalage entre les études cognitives humaines et les études sur l’IA. Je ne pense pas pouvoir répondre à toutes dans un avenir proche (ni même de mon vivant). Je suppose que je commencerais par affiner mes travaux précédents pour faciliter l’étude de ces questions théoriques. En particulier, je commencerai par la conception de tâches/tests, la collecte d’ensembles de données et la conception expérimentale pour cibler plus précisément des questions de recherche spécifiques.
Qu’est-ce qui vous a donné envie d’étudier l’IA ?
En bref, Terminator 2 : Judgment Day. Au début, je pensais pouvoir construire un robot comme le T800 dans le film. Au fur et à mesure que j’avance dans mes recherches, je sens que ces questions de recherche théorique sur l’intelligence m’intriguent de plus en plus et je peux y travailler toute ma vie.
Quels conseils donneriez-vous à quelqu’un qui envisage de faire un doctorat dans le domaine ?
Je pense que mon conseil serait que la chose la plus importante dans un doctorat est de le faire plutôt que d’y penser. Et comme l’IA est un domaine très jeune par rapport à d’autres domaines bien établis, j’imagine qu’il existe de nombreux domaines inexplorés dans l’IA. Ainsi, un doctorant en IA devrait être plus susceptible de trouver une direction de recherche unique qui l’intéresse le plus.
À propos de Yuan
Yuan Yang travaille dans le domaine croisé de l’IA et des sciences cognitives, en se concentrant sur la façon dont l’IA peut aider à comprendre les capacités cognitives fondamentales de l’être humain (par exemple, l’intelligence fluide, le raisonnement visuel abstrait, la création d’analogies et l’imagerie mentale) et, inversement, comment une telle compréhension peut faciliter le développement de l’IA. Ses recherches ont été soutenues par les projets du Laboratoire AIVAS qui visent à aider les personnes autistes dans leur apprentissage et leur évolution de carrière. Il est titulaire d’un BS et d’une maîtrise en informatique de la Northwestern Polytechnical University, ainsi que d’un doctorat en informatique de l’Université Vanderbilt. Cet automne, il rejoindra le Collège d’information, de génie mécanique et électrique de l’Université normale de Shanghai en tant que professeur agrégé. |
Mots clés: AAAI, Consortium doctoral AAAI, AAAI2024, ACM SIGAI
Lucy Smith, rédactrice en chef d’AIhub.