Séminaire de statistique, Université Laval, 19 mai 2011 le 17 mai 2011 à 20:39

Le jeudi 19 mai 2011, 11 h 30, en la salle 2546 du pavillon Adrien-Pouliot

Les procédures bootstrap pour des données d’enquête imputées
Zeinab Mashreghi, Université de Montréal

L’estimation de la variance d’une statistique basée sur des données d’enquête imputées est une tâche difficile. Dans ce contexte, Shao et Sitter (1996) ont proposé une méthode de bootstrap dans laquelle, en utilisant les indicateurs de réponse originale, les non-répondants de l’échantillon bootstrap sont réimputés avec la même méthode que pour les données originales, conduisant à un estimateur de la variance valide lorsque la fraction de sondage, f, est négligeable. En général, il y a deux difficultés avec leur méthode : la nécessité d’avoir accès au statut de réponse pour toutes les unités et une sous-estimation de la variance pour de grandes valeurs de f. Afin d’éliminer ces problèmes, nous proposons une nouvelle procédure, qu’on appelle le bootstrap indépendant, dans laquelle en utilisant seulement le taux de réponse, nous obtenons un estimateur valide de la variance même pour une grande fraction de sondage. Cette méthode consiste à rééchantillonner les données en modifiant la constante de la procédure bootstrap considérée, indépendamment à générer des indicateurs de réponse indépendants selon une Bernoulli avec le taux de réponse et à réimputer les non-répondants de l’échantillon bootstrap. Pour plusieurs estimateurs et méthodes d’imputation, la statistique calculée sur les données imputées peut s’écrire comme une fonction de totaux de quantités impliquant les observations et les indicateurs de réponse. Si c’est le cas et que f est négligeable, alors un autre estimateur valide pour la variance obtient en appliquant simplement les méthodes de bootstrap pour données complètes pour la fonction des totaux, sans avoir besoin de réimputation.

commentaires (0) - poster un commentaire

Séminaire de statistique, Université Laval, 12 mai 2011 le 6 mai 2011 à 17:32

Le jeudi 12 mai 2011, 11 h 30, en la salle 2546 du pavillon Adrien-Pouliot

La détection de rupture dans le système climatique
Claudie Beaulieu, Université Princeton

La détection de rupture permet d’identifier un ou plusieurs changements abrupts dans une série temporelle, ce qui la rend particulièrement intéressante pour étudier les variations du climat. En effet, les changements climatiques ne se manifestent pas uniquement sous la forme d’une tendance linéaire et les données révèlent également des changements abrupts. Dans cet exposé, l’importance de la détection de rupture est illustrée par deux applications. La première porte sur l’identification des ruptures artificielles dans les séries d’observations de précipitations totales, introduites par des changements dans les procédures de mesure tels qu’une relocalisation de la station de mesure. La détection et la correction de ces ruptures artificielles sont importantes puisqu’elles peuvent interférer avec les variations réelles du climat et biaiser notre compréhension du système climatique. La deuxième application porte sur la détection de rupture dans le cycle du carbone. Des ruptures détectées dans le taux de croissance atmosphérique du carbone et dans les puits de carbone terrestres en 1988/1989 indiquent qu’il est possible que des modifications majeures dans le cycle du carbone se soient produites. Nous discuterons des extensions nécessaires aux méthodes de détection de rupture afin de les rendre plus flexibles pour étudier le système climatique. Ces extensions permettront la détection de différents types de changements dans les paramètres d’une distribution ou dans les paramètres d’un modèle de régression, dans des séries de données souvent autocorrélées.

commentaires (0) - poster un commentaire

Colloque ASSQ et AGA 2011, Manoir Montmorency, 3 juin 2011 le 2 mai 2011 à 20:35

Bonjour chers membres,

Vous êtes cordialement invités au Colloque de l’ASSQ qui se tiendra au Manoir Montmorency le 3 juin 2011 dès 13h.

Un programme scientifique comportant quatre présentations sera suivi de l’Assemblée générale annuelle de l’association. Un coquetel et un repas gastronomique suivront.

Pour profiter du tarif réduit, veuillez vous inscrire avant le 13 mai 2011. Le paiement doit être complété avant le 27 mai 2011.

Plus de détails, incluant le titre des présentations scientifiques, se trouvent sur la fiche d’inscription.

Au plaisir de vous voir au Manoir Montmorency le 3 juin!

Jean-François Plante
Directeur des communications, ASSQ

commentaires (0) - poster un commentaire

Séminaire de statistique, Université Laval, 21 avril 2011 le 15 avril 2011 à 20:21

Le jeudi 21 avril 2011, 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot

Noyaux Beta et « transformed kernel » : applications à l’estimation de quantiles et de densité de copules
Arthur Charpentier, Université Rennes 1

Les copules étant à support compact (le carré unité en dimension 2), les estimateurs des densités à noyaux classiques sont biaisés (de manière multiplicative) sur les bords, et dans les coins. Deux techniques peuvent être utilisées pour éviter cette sous-estimation de la densité: les noyaux Beta, et les « transformed kernels ». Nous allons décrire et présenter ces deux techniques dans une première partie, avec une application à l’estimation de densité de copules.

Dans un second temps, nous verrons qu’il est possible de combiner ces deux idées afin d’estimer différentes quantités (e.g. les quantiles): on commence par transformer les données en les ramenant sur l’intervalle unité, puis on utilise une estimation à noyau Beta de la densité, que l’on cumulera et que l’on inversera pour estimer un quantile (des données transformées), et enfin on reviendra sur le support initial. De manière assez surprenant, cette estimation de quantile peut s’avérer bien meilleur que des techniques classiques, en particulier si les observations sont à queue épaisse.

commentaires (0) - poster un commentaire

Atelier du CRM sur la Modélisation de la dépendance et les copules, Montréal, 6 au 9 juin 2011 le 14 avril 2011 à 14:02

L’atelier du CRM sur la Modélisation de la dépendance et les copules se tiendra à Montréal du 6 au 9 juin 2011. Une journée sera consacrée à chacun des thèmes suivants : modèles de copules multidimensionnels, modèles de copules dynamiques, copules et extrêmes, ainsi que copules et données incomplètes. Plusieurs éminents chercheurs ont accepté de présenter un exposé, y compris les conférenciers principaux Andrew Patton, Johan Segers et Noël Veraverbeke.

La date limite pour soumettre un résumé d’affiche est le 1er mai. Le nombre de places étant limité, les personnes intéressées sont invitées à s’inscrire tôt.

Pour de plus amples renseignements, consultez le site Web de l’événement.

commentaires (0) - poster un commentaire

Colloque CRM-ISM-GERAD, 8 avril 2011, McGill le 6 avril 2011 à 11:35

Le vendredi 8 avril 2011, 15 h 35, McGill University, Burnside Hall, 805, rue Sherbrooke O., room 1B24

Applying Statistical Principles in Large-Scale Biological Data Analysis: why is it rare and what should we do about it?
Yutaka Yasui, School of Public Health, University of Alberta

Technology-driven modern biology explores the entire human genome and its expression for associations with disease risks, drug effects/toxicities, and modifications of environmental exposure effects. Claimed benefits of this line of research are immeasurable including new/tailored prevention, screening, and treatment of various diseases as well as knowledge on disease biology/etiology. Given that as many as 1 million pieces of information per subject are being analyzed in such research and biological phenomena of interest are not deterministic, statistics plays a crucial role here.

In this talk, I will discuss two standard frameworks of scientific investigations in this area. Focus will be on relevant statistical principles that are largely ignored such as importance of alternative hypotheses, evidential interpretation of data, parameter estimation vs. significance test, and collapsibility conditions of log-linear models in assessing marginal associations. I explain why these are critical in making the statistical analysis of these massive genetic data biologically meaningful. Methods that account for these issues will be discussed, illustrating differences in biological findings. Implications on statistical training and collaborations will also be explored.

commentaires (0) - poster un commentaire

Colloque ISM-CRM-GERAD, 1er avril 2011, Concordia le 30 mars 2011 à 15:20

Le vendredi 1er avril 2011, 15 h 30 – 17 h, Concordia University, Library Building, 1400 de Maisonneuve O., LB 921-4, SGW

Sharp estimates on the heat kernels and Green functions of subordinate Brownian motions in smooth domains
Renming Song, University of Illinois

A subordinate Brownian motion is a Lévy process which can obtained by replacing the time of Brownian motion by an independent increasing Lévy process. The infinitesimal generator of a subordinate Brownian motion is $-\phi(-\Delta)$, where $\phi$ is the Laplace exponent of the subordinator. When $\phi(\lambda)=\lambda^{\alpha/2}$ for some $\alpha\in (0, 2)$, we get the fractional Laplacian $-(-\Delta)^{\alpha/2}$ as a special case. In this talk, I will give a survey of some recent results on sharp two-sided estimates on the Dirichlet heat kernels and Green functions of $-\phi(-\Delta)$ in smooth domains.

commentaires (0) - poster un commentaire

Séminaire de statistique, 31 mars 2011, Université Laval le 30 mars 2011 à 15:18

Le jeudi 31 mars 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot, Université Laval

Classification et regroupement bayésiens avec sélection de variables pour des données continues en haute dimension
Vahid Partovi Nia, Université McGill

Nous proposons une approche performante pour la classification et le regroupement pour des données continues en haute dimension, en se basant sur une mixture de modèles bayésiens pour lesquels les formes analytiques sont accessibles. Ceci nous autorise alors à traiter le problème de la classification et du partitionnement simultanément ainsi que le calcul de probabilités pour des classes jusqu’alors non observées. La méthodologie développée a l’avantage d’être robuste à l’ajout de variables bruitées comme une conséquence de la structure « pic-et-plat » inhérente au modèle bayésien proposé.

commentaires (0) - poster un commentaire

Colloque CRM-ISM-GERAD, 25 mars 2011, McGill le 21 mars 2011 à 12:54

Vendredi le 25 mars 2011, 15:35, McGill University, Burnside Hall, 805, rue Sherbrooke O., salle 1B24

Targeted Maximum Likelihood Estimation: Assessing Effects in RCT and Observational Studies
Mark van der Laan, Jiann-Ping Hsu/Karl E. Peace, UC Berkeley

In this talk we present targeted maximum likelihood based estimators of a causal effect defined in realistic semiparametric models for the data generating experiment, that takes away the need for specifying regression models. Fundamental concepts underlying this methodology are careful definition of the target parameter of the data generating distribution in a realistic semiparametric model, super Learning, i.e., the very aggressive use of cross-validation to select optimal combinations of many candidate estimators, and subsequent targeted maximum likelihood estimation to target the fit towards the causal effect/target parameter of interest. We demonstrate the performance in simulation studies. We also illustrate this method for assessing causal effects of treatment on clinical outcomes in RCT and observational studies in HIV. In particular, we demonstrate the TMLE that allows right-censoring to be a function of time-dependent covariates.

commentaires (0) - poster un commentaire

Réunion scientifique, Hôpital du Saint-Sacrement, Québec le 17 mars 2011 à 16:41

Le 19 avril 2011, 12h00 à 13h30, Salle E2-03 (2e étage), Hôpital du Saint-Sacrement, 1050 chemin Sainte-Foy, Québec (Québec) G1S 4L8.

L’analyse des correspondances et les techniques de regroupement : une puissante combinaison!
Monsieur Jean-François Allaire, M.Sc., Statisticien senior, Groupe de consultation en statistique Centre de recherche Philippe-Pinel de Montréal

Développer une typologie et analyser des profils d’individus représentent un défi technique croissant pour les chercheurs étant donné le nombre et la complexité des méthodes statistiques. Une méthode en particulier gagne cependant à être connue : la combinaison de l’analyse des correspondances multiples (ACM) et des techniques de regroupement. Mettant en lien plusieurs variables catégorielles pour former des groupes d’individus, elle produit des résultats performants et apporte des bénéfices supplémentaires par rapport aux approches traditionnelles.

À propos du conférencier
Jean-François Allaire, M. Sc., est statisticien senior au Centre de recherche de l’Institut Philippe-Pinel de Montréal (CRIPPM), où il coordonne une équipe de statisticiens attitrés aux chercheurs et aux activités de recherche. Il est également cofondateur de SolutionStat, un nouveau cabinet offrant des services de consultation et de formation en statistique.

Titulaire d’une maîtrise en statistique (1997) de l’Université de Montréal et membre de l’Association des statisticiennes et des statisticiens du Québec (ASSQ), Jean-François Allaire est auteur et coauteur de plusieurs publications, présentations et formations, traitant de l’application de l’analyse des correspondances multiples (ACM) jumelée aux techniques de regroupement (clustering) et de classification. Ses champs d’expertise incluent la biostatistique, l’utilisation de systèmes d’informations géographiques (SIG) et l’exploration de grandes bases de données (data mining).

Pour information : Myrto Mondor, URESP, Tél : (418) 682-7511 poste 2709

commentaires (0) - poster un commentaire




2136 chemin Sainte-Foy, Suite 200
Québec (Québec)
G1V 1R8

Adresse électronique :  assq@association-assq.qc.ca