Séminaire de statistique, Université Laval, 10 février 2011

le 4 février 2011 à 11:51
Jean-Francois Plante

Le jeudi 10 février 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot

Triple robustesse dans les enquêtes en présence de données manquantes
David Haziza, Université de Montréal

Dans les enquêtes, il faut se résigner au fait qu’une partie des données sera manquante. On distingue la non-réponse totale de la non-réponse partielle. La non-réponse totale, qui se traduit par une absence d’information pour toutes les variables, se traite habituellement en utilisant une procédure d’ajustement des poids de sondage. Lorsque la non-réponse est limitée à certaines variables, on est en présence de non-réponse partielle, qui se traite généralement par imputation. Plusieurs méthodes d’imputation sont utilisées en pratique : imputation par la régression qui inclut l’imputation par la moyenne et l’imputation par le ratio comme cas particulier, l’imputation par le plus proche voisin, l’imputation par hot-deck aléatoire, etc. Récemment, une nouvelle famille de méthode a été étudiée dans la littérature : celle des méthodes doublement robustes. Lorsqu’utilisées, ces méthodes mènent à des estimateurs imputés qui sont asymptotiquement sans biais et convergents si le modèle de non-réponse et/ou le modèle d’imputation est correctement spécifié. Autrement dit, ce type de méthodes offre une certaine protection si l’un des deux modèles est valide.

En présence de valeurs aberrantes, les estimateurs imputés sont habituellement hautement volatiles. Il convient alors de réduire l’influence des valeurs aberrantes, ce qui se traduira par l’obtention d’estimateur biaisés mais plus stables. Dans un premier temps, nous introduisons le concept de biais conditionnel d’une unité qui est une mesure d’influence. Nous proposerons alors des estimateurs robustes à la présence valeurs aberrantes, construits à partir du biais conditionnel estimé. Les résultats d’une étude par simulation seront présentés afin d’étudier le comportement de l’estimateur proposé en termes de biais relatif et d’efficacité relative.

Share