Séminaire de statistique, Université Laval, 19 mai 2011

le 17 mai 2011 à 20:39
Jean-Francois Plante

Le jeudi 19 mai 2011, 11 h 30, en la salle 2546 du pavillon Adrien-Pouliot

Les procédures bootstrap pour des données d’enquête imputées
Zeinab Mashreghi, Université de Montréal

L’estimation de la variance d’une statistique basée sur des données d’enquête imputées est une tâche difficile. Dans ce contexte, Shao et Sitter (1996) ont proposé une méthode de bootstrap dans laquelle, en utilisant les indicateurs de réponse originale, les non-répondants de l’échantillon bootstrap sont réimputés avec la même méthode que pour les données originales, conduisant à un estimateur de la variance valide lorsque la fraction de sondage, f, est négligeable. En général, il y a deux difficultés avec leur méthode : la nécessité d’avoir accès au statut de réponse pour toutes les unités et une sous-estimation de la variance pour de grandes valeurs de f. Afin d’éliminer ces problèmes, nous proposons une nouvelle procédure, qu’on appelle le bootstrap indépendant, dans laquelle en utilisant seulement le taux de réponse, nous obtenons un estimateur valide de la variance même pour une grande fraction de sondage. Cette méthode consiste à rééchantillonner les données en modifiant la constante de la procédure bootstrap considérée, indépendamment à générer des indicateurs de réponse indépendants selon une Bernoulli avec le taux de réponse et à réimputer les non-répondants de l’échantillon bootstrap. Pour plusieurs estimateurs et méthodes d’imputation, la statistique calculée sur les données imputées peut s’écrire comme une fonction de totaux de quantités impliquant les observations et les indicateurs de réponse. Si c’est le cas et que f est négligeable, alors un autre estimateur valide pour la variance obtient en appliquant simplement les méthodes de bootstrap pour données complètes pour la fonction des totaux, sans avoir besoin de réimputation.

FacebookTwitterGoogle+LinkedIn