Par Keegan Harris
L’inférence causale consiste à déterminer si et comment une cause entraîne un effet, généralement en utilisant des méthodes statistiques pour distinguer la corrélation de la causalité. Apprendre les relations causales à partir des données est crucial dans divers domaines, allant des soins de santé et du développement de médicaments à la publicité en ligne et au commerce électronique. De nombreux travaux ont été réalisés dans les domaines de l’économie, des statistiques, de l’informatique et des politiques publiques pour concevoir des algorithmes et des méthodologies d’inférence causale.
Bien que l’accent soit principalement mis sur des questions statistiques, il est également essentiel de considérer les incitations de la théorie des jeux lors de l’inférence causale sur des individus stratégiques ayant des préférences quant au traitement qu’ils reçoivent. Par exemple, il peut être difficile de déduire des relations causales dans des essais contrôlés randomisés lorsque les participants ne se conforment pas au traitement qui leur est assigné. Plus généralement, l’apprentissage causal peut être complexe lorsque les individus choisissent eux-mêmes leurs traitements et qu’il existe une hétérogénéité suffisante entre les individus ayant des préférences différentes. Même lorsque la conformité peut être imposée, les individus peuvent élaborer des stratégies en modifiant les attributs qu’ils présentent au processus d’inférence causale pour obtenir un traitement plus souhaitable.
Cette liste de lecture annotée résume les travaux sur l’inférence causale en présence d’agents stratégiques. Bien que non exhaustive, elle vise à fournir un point de départ utile pour les membres de la communauté de l’apprentissage automatique souhaitant explorer ce domaine de recherche à l’intersection de l’inférence causale et de la théorie des jeux.
La liste de lecture est organisée comme suit : (1, 3) étudier la non-conformité dans les essais randomisés, (2-4) se concentrer sur les méthodes de variables instrumentales, (4-6) considérer le désalignement des incitations entre l’individu exécutant la procédure d’inférence causale et les sujets de la procédure, (7,8) étudier les interférences entre unités, et (9,10) concerner les méthodes de contrôle synthétiques.
- [Robins 1998]: Cet article donne un aperçu des méthodes permettant de corriger la non-conformité dans les essais randomisés (c’est-à-dire la non-adhésion des participants à l’essai au protocole d’attribution du traitement).
- [Angrist et al. 1996]: Cet article fondateur décrit le concept de variables instrumentales (IV) et comment elles peuvent être utilisées pour estimer les effets causals. Une IV est une variable qui affecte la variable de traitement mais n’est liée à la variable de résultat que par son effet sur le traitement. Les méthodes IV exploitent le fait que la variation des IV est indépendante de toute confusion afin d’estimer l’effet causal du traitement.
- [Ngo et al. 2021]: Contrairement aux travaux antérieurs sur la non-conformité dans les essais cliniques, ce travail utilise des outils de conception de l’information pour révéler des informations sur l’efficacité des traitements de manière à inciter les participants à se conformer aux recommandations de traitement au fil du temps.
- [Harris et al. 2022]: Cet article étudie la prise de décision concernant une population d’agents stratégiques. Les auteurs observent que la règle d’évaluation déployée par le directeur est un instrument valide, permettant d’appliquer des méthodes standards de régression des variables instrumentales pour apprendre les relations causales en présence d’un comportement stratégique.
- [Miller et al. 2020]: Cet article considère le problème de la classification stratégique, où un décideur prend des décisions concernant une population d’agents stratégiques. Connaissant la règle d’évaluation déployée par le décideur, les agents peuvent modifier stratégiquement leurs caractéristiques observables pour recevoir une évaluation plus favorable (par exemple, un meilleur taux d’intérêt sur un prêt). Les auteurs montrent que concevoir de bonnes incitations pour l’amélioration des agents (c’est-à-dire encourager l’élaboration de stratégies bénéfiques pour l’agent) est aussi difficile que d’orienter les bords du graphe causal correspondant.
- [Wang et al. 2023]: Un désalignement des incitations entre les patients et les prestataires peut se produire lorsque les résultats moyens traités sont utilisés comme mesures de qualité. Un tel désalignement est généralement indésirable dans les soins de santé, car il peut diminuer le bien-être des patients. Pour atténuer ce problème, ce travail propose une mesure de qualité alternative, l’effet total du traitement, qui prend en compte les résultats contrefactuels non traités. Les auteurs montrent que récompenser l’effet total du traitement maximise le bien-être total du patient.
- [Wager and Xu 2021]: Motivé par des applications telles que le covoiturage et les subventions aux frais de scolarité, ce travail étudie les contextes où les interventions sur une unité (par exemple une personne ou un produit) peuvent avoir des effets sur d’autres (c’est-à-dire une interférence entre unités). Les auteurs utilisent une approche basée sur la modélisation en champ moyen pour modéliser l’interférence entre unités et conçoivent une classe de programmes d’expérimentation permettant d’optimiser les paiements sans perturber l’équilibre du marché.
- [Li et al. 2023]: Comme [Wager and Xu 2021], cet article étudie les effets des interférences entre unités, bien que les interférences considérées ici proviennent de la congestion dans un système de service. En conséquence, l’interférence considérée ici est dynamique, contrairement à l’interférence statique considérée dans l’entrée précédente.
- [Abadie and Gardeazabal 2003]: Il s’agit du premier article sur les méthodes de contrôle synthétiques (SCM), une technique populaire pour estimer des contrefactuels à partir de données longitudinales. Dans la configuration SCM, il existe une période de pré-intervention pendant laquelle toutes les unités sont sous contrôle, suivie d’une période de post-intervention pendant laquelle toutes les unités subissent exactement une intervention (soit le traitement, soit le contrôle). Les SCM utilisent les données de pré-traitement pour apprendre une relation (généralement linéaire ou convexe) entre les unités de test et les unités donneuses. Cette relation est ensuite extrapolée à la période post-intervention pour estimer la trajectoire contrefactuelle de l’unité de test sous contrôle.
- [Ngo et al. 2023]: Une hypothèse courante dans la littérature sur les SCM est celle du « chevauchement » : les résultats pour l’unité de test peuvent être écrits comme une combinaison (par exemple, linéaire ou convexe) des unités donneuses. Ce travail met en lumière cette hypothèse souvent négligée et montre que (i) lorsque les unités sélectionnent leurs propres traitements et (ii) il existe une hétérogénéité suffisante entre les unités qui préfèrent des traitements différents, alors le chevauchement n’est pas valable. Comme [Ngo et al. 2021], les auteurs utilisent des outils issus de la conception de l’information et des bandits multi-armés pour inciter les unités à explorer différents traitements de manière à garantir que la condition de chevauchement sera progressivement satisfaite au fil du temps.
[Note de l’éditeur : cet article est également publié dans SIGecom Exchanges 22.1.]
Références :
- Abadie, A. et Gardeazabal, J. 2003. Les coûts économiques des conflits : une étude de cas du pays basque. Revue économique américaine 93, 1, 113-132.
- Angrist, JD, Imbens, GW et Rubin, DB 1996. Identification des effets causals à l’aide de variables instrumentales. Journal de l’American Statistics Association 91, 434, 444-455.
- Harris, K., Ngo, DDT, Stapleton, L., Heidari, H. et Wu, S. 2022. Régression des variables instrumentales stratégiques : récupérer les relations causales à partir des réponses stratégiques. Lors de la Conférence internationale sur l’apprentissage automatique. PMLR, 8502-8522.
- Li, S., Johari, R., Kuang, X. et Wager, S. 2023. Expérimentation sous congestion stochastique. Préimpression arXiv arXiv:2302.12093.
- Miller, J., Milli, S. et Hardt, M. 2020. La classification stratégique est une modélisation causale déguisée. Lors de la Conférence internationale sur l’apprentissage automatique. PMLR, 6917-6926.
- Ngo, D., Harris, K., Agarwal, A., Syrgkanis, V. et Wu, ZS 2023. Contrôle synthétique prenant en compte les incitations : estimation contrefactuelle précise via une exploration incitative. Préimpression arXiv arXiv:2312.16307.
- Ngo, DDT, Stapleton, L., Syrgkanis, V. et Wu, S. 2021. Inciter au respect des instruments algorithmiques. Lors de la Conférence internationale sur l’apprentissage automatique. PMLR, 8045-8055.
- Robins, JM 1998. Correction pour non-conformité dans les essais d’équivalence. Statistiques en médecine 17, 3, 269-302.
- Wager, S. et Xu, K. 2021. Expérimenter en équilibre. Sciences de gestion 67, 11, 6694-6715.
- Wang, S., Bates, S., Aronow, P. et Jordan, MI 2023. Opérationnalisation des mesures contrefactuelles : incitations, classement et asymétrie de l’information. Préimpression arXiv arXiv:2305.14595.
Cet article a été initialement publié sur le Blog ML@CMU et apparaît ici avec la permission des auteurs.
ML@CMU