Introduction à une approche graphique d’inférence causale

le 16 février 2012 à 11:35
dtalbot

Pour cette première édition, je souhaite partager avec vous un sujet souvent méconnu des statisticiens : l’inférence causale. D’abord, quel est l’intérêt d’effectuer de l’inférence causale? L’intérêt est de pouvoir tirer des conclusions du genre « Si je modifie la valeur de X, qu’adviendra-t-il à Y?», alors que l’inférence classique ou « prédictive » ne permet que des conclusions du genre « Si X change naturellement de valeur, qu’advient-il en général à Y? ». Plusieurs techniques d’inférence causale existent, mais j’aborderai ici l’approche graphique suggérée par Judea Pearl.

La façon la plus simple, et la plus sûre, d’effectuer de l’inférence causale est par le biais d’expériences randomisées. On divise alors les unités expérimentales aléatoirement en groupes et toutes les unités d’un groupe donné reçoivent un des traitements qu’on désire étudier. Si le hasard fait bien les choses, les groupes devraient avoir des caractéristiques similaires et toute différence dans la réponse observée entre les groupes pourra être attribuée à l’effet causal du traitement.

Qu’arrive-t-il lorsque l’étude randomisée est impossible? Doit-on abandonner complètement l’idée d’effectuer de l’inférence causale? La réponse donnée par Pearl est un «non» catégorique! Évidemment, l’inférence causale ne pourra se faire sans payer un certain prix : des hypothèses non vérifiables à partir des données devront être posées. Par contre, toute personne prête à accepter ces hypothèses devra également accepter l’interprétation causale qui découle des analyses, puisqu’il s’agira d’une conséquence directe de ces hypothèses et des informations disponibles dans les données.

L’approche proposée par Pearl consiste à tracer un graphique acyclique orienté(« Directed Acyclic Graph » ou « DAG »). Il s’agit d’un graphique où les variables observées seront représentées par des cercles pleins, les variables non observées par des cercles vides et où les relations entre les variables seront représentées par des flèches à une pointe. Par ailleurs, si on suit le chemin dirigé (dans le sens des flèches) à partir d’une variable, on ne retournera jamais à la variable d’origine, d’où le qualificatif de graphique acyclique. Les flèches du DAG représentent des relations de cause à effet. Voici quelques exemples de DAG :

Exemple 1 :

Exemple 2 :

Exemple 3 :

Introduisons maintenant le concept de chemin porte-arrière (« backdoor path »). Si on s’intéresse à l’effet causal de X sur Y, on voudra s’assurer qu’il n’y a pas de chemin porte-arrière ouvert entre Y et X. Un chemin porte-arrière est un chemin, autre que le chemin direct entre X et Y, qui permet de relier la variable d’arrivée (Y) à la variable d’origine (X) et dont le dernier segment pointe vers la variable d’origine (X). Dans le premier exemple, les trajets de Y à X sont : Y \leftarrow X et Y \leftarrow Z \leftarrow X. Ni l’un ni l’autre de ces trajets n’est un trajet porte-arrière, puisque le dernier segment ne pointe pas vers X. Dans l’exemple 2, les trajets sont : Y \leftarrow X et Y \leftarrow Z \rightarrow X. Le trajet Y \leftarrow Z \rightarrow X est un trajet porte-arrière. Finalement, dans le troisième exemple, nous avons : Y \leftarrow X, Y \rightarrow C \leftarrow B \rightarrow X, Y \leftarrow A \leftarrow U \rightarrow X, les deux derniers trajets étant des trajets porte-arrière.

À l’intérieur de certains de ces chemins, on retrouve ce qu’on appelle un collisionneur (« collider »). Un collisionneur est une variable vers laquelle deux variables pointent dans un trajet. Dans le troisième exemple, la variable C joue le rôle de collisionneur dans le trajet Y \rightarrow C \leftarrow B \rightarrow X.

Pour que l’effet causal de X sur Y soit correctement estimé, il est nécessaire de conditionner sur un ensemble de variables qui permettra de fermer tous les chemins porte-arrière et de ne conditionner sur aucun descendant de X. Un trajet porte-arrière sera fermé si et seulement s’il comporte un non-collisionneur sur lequel on conditionne ou s’il comporte un collisionneur sur lequel on ne conditionne pas et pour lequel on ne conditionne sur aucun de ses descendants. Par descendants, on entend les variables vers lesquelles le collisionneur pointe directement ou indirectement (dans l’exemple 3, C est un descendant de A en passant par Y). On comprend donc que le fait de conditionner sur un collisionneur ouvrira le chemin porte-arrière alors que de ne pas conditionner sur un collisionneur maintient le chemin fermé. Attention, le fait de contrôler ou de ne pas contrôler pour certaines variables afin de fermer un trajet porte-arrière peut conduire à l’ouverture d’un autre chemin porte-arrière. Il est donc essentiel de vérifier que tous les chemins ont été fermés.

Dans le premier exemple, il n’y a aucun chemin porte-arrière, il n’est donc pas nécessaire de conditionner sur la variable Z. En fait, si on  conditionne sur Z, on aura conditionné sur un descendant de X et l’effet causal de X sur Y ne pourra être estimé correctement. Dans l’exemple 2, le trajet porte-arrière Y \leftarrow Z \rightarrow X n’est pas bloqué. Il faut donc contrôler sur Z afin d’obtenir l’effet causal de X sur Y. Dans le troisième exemple, Y \rightarrow C \leftarrow B \rightarrow X est un chemin porte-arrière naturellement bloqué par le collisionneur C. Il n’est donc pas nécessaire de faire quoi que ce soit pour bloquer ce trajet. Par contre, le trajet Y \leftarrow A \leftarrow U \rightarrow X est ouvert et devra être bloqué. On pourrait penser contrôler pour A ou U, par exemple. Par contre, la variable U n’étant pas observée, il faudra contrôler pour A. Le fait de contrôler pour A n’affectera en rien le trajet Y \rightarrow C \leftarrow B \rightarrow X, puisque A ne se retrouve pas dans ce trajet et n’est pas un descendant de C.

Comme on pourra le constater, il est nécessaire d’incorporer plusieurs nouvelles notions pour utiliser l’approche graphique suggérée par Pearl. Ces notions sont néanmoins assez simples et, une fois bien assimilées, sont faciles à utiliser. Un autre point qu’on pourra remarquer est que l’inférence causale selon cette approche nécessite une connaissance suffisamment approfondie du domaine d’application pour être en mesure de tracer un DAG raisonnable. Tel que mentionné initialement, toute personne acceptant le DAG tracé devra également accepter les conclusions tirées à partir de ce DAG. Pour plus d’information, je vous invite à consulter Causality: Models, Reasoning, and Inference, Cambridge University Press, 2009 de Judea Pearl.

Denis Talbot

Retour à la table des matières

FacebookTwitterGoogle+LinkedIn