Séminaire de statistique, Université Laval, 24 février 2011 le 18 février 2011 à 09:18

Le jeudi 24 février 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot

Contrôle de la divulgation de données : l’approche de la confidentialité différentielle
Anne-Sophie Charest, Université Carnegie Mellon

Toute organisation qui souhaite publier des données ou conclusions statistiques doit faire attention de respecter son engagement de confidentialité envers ses répondants. Avec la multiplication de l’information disponible en ligne sur chaque individu, cette tâche est de plus en plus ardue. Dans cette présentation, nous ferons d’abord un bref survol des différentes méthodes utilisées pour le contrôle de la divulgation, et des critères employés pour évaluer la confidentialité des données publiées. Puis, nous présenterons un critère relativement nouveau dans la littérature de contrôle de la divulgation: la confidentialité différentielle. Dans cette approche, on considère une méthode de contrôle de la divulgation comme une fonction générant un objet (statistique résumée, paramètres de modèles, jeux de données synthétiques…) à partir d’un jeu de données qu’on désire garder confidentielles. La confidentialité différentielle est une propriété de cette fonction. Il s’agit d’un critère très strict qui n’assume rien à propos des ressources de l’adversaire cherchant à révéler les données confidentielles. Nous nous attarderons à la création de données synthétiques satisfaisant le critère de confidentialité différentielle, et en particulier à l’analyse de tels jeux de données synthétiques.

commentaires (0) - poster un commentaire

Colloque CRM-ISM-GERAD, Concordia, 18 février 2011 le 15 février 2011 à 09:46

Le vendredi 18 février 2011, 15 h 30 – 16 h 30, Concordia University, Concordia University, Library Building, 1400 de Maisonneuve O., salle LB 921-4

Some remarks on random matrix theory and its applications to multivariate statistics
Noureddine El Karoui (UC, Berkeley)

Over the last 10-15 years, there has been renewed interest in understanding various probabilistic properties of large random matrices. These objects also come up naturally in high-dimensional statistics problems. In this talk, I will describe some of the light random matrix results shed on various classical and modern problems in multivariate statistics, discuss robustness issues (and lack thereof) of random matrix models and present some consequences for problems in optimization, classification, and time permitting, numerical linear algebra.

commentaires (0) - poster un commentaire

Séminaire de statistique, Université Laval, 17 février 2011 le 11 février 2011 à 16:14

Le jeudi 17 février 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot

Optimal Design for Clinical Trials with an Unknown Delay in Treatment Effect
Juli Atherton, Université McGill

Sometimes clinical trials data consist, for each subject, of a sequence of baseline pre-treatment observations that are followed by a sequence of post-treatment observations. In such trials subjects serve as their own controls. Alternatively, in a randomized controlled trial with say, a control group and one or more treatment groups, a sequence of post-treatment observations is taken on each treatment group from the start of the study. In either situation, if there is an unknown delay before a treatment takes effect (assuming it does), the subject specific times-to-effect can be viewed as the unknown change-points in a multipath change-point setting. Once the data are collected, i) they may be used to estimate the size of each treatment effect and ii) to estimate the proportion of subjects that will experience a treatment effect. Before the data are collected, however, design is the main concern, and optimal timing of the observations will enhance the precision of the eventual inference.

In a broader setting, we consider, optimal design for multipath change-point problems, focusing on problems motivated by i) and ii) above. These optimal design problems are highly non-linear and a Bayesian approach is advantageous. By introducing a design measure we are able to convert a multimodal design criterion function of the design points, into one that is a concave function of the design measures over a simple region. Through this device we reduce the optimal design problem to a feasible numerical search. We carry out simulations whose results have ramifications for the design of clinical trials in which there is an unknown lag between the start of treatment and the occurrence of an effect. In particular, our results suggest that the standard practice-no doubt historically used for convenience-of having a common observation protocol for all subjects, is, in fact, under “objective modeling”, optimal. Further, in many situations, choosing equally spaced observations, which is another common and convenient practice, does not entail a substantial loss in efficiency.

commentaires (0) - poster un commentaire

Jeudis de l’ASSQ, 24 février 2011, Québec le 7 février 2011 à 12:25

Le CA de l’ASSQ vous convie au prochain « jeudi de l’ASSQ » qui aura lieu le 24 février prochain au pavillon Vachon de l’Université Laval, salle 1240.

La première partie du 5 à 7 sera consacrée à une présentation de M. Ronald Frenette intitulée « Mesure de la satisfaction de la clientèle – résumé de lectures ». Dans la deuxième partie, vous êtes invité à échanger avec l’ensemble des participants en dégustant quelques canapés et bons vins.

Ce document vous fournit toutes les informations pour l’inscription. Pour vous assurez d’une place, réservez d’ici au 18 février 2011.

C’est un événement à ne pas manquer! On vous attend en grand nombre.

commentaires (0) - poster un commentaire

Séminaire de statistique, Université Laval, 10 février 2011 le 4 février 2011 à 11:51

Le jeudi 10 février 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot

Triple robustesse dans les enquêtes en présence de données manquantes
David Haziza, Université de Montréal

Dans les enquêtes, il faut se résigner au fait qu’une partie des données sera manquante. On distingue la non-réponse totale de la non-réponse partielle. La non-réponse totale, qui se traduit par une absence d’information pour toutes les variables, se traite habituellement en utilisant une procédure d’ajustement des poids de sondage. Lorsque la non-réponse est limitée à certaines variables, on est en présence de non-réponse partielle, qui se traite généralement par imputation. Plusieurs méthodes d’imputation sont utilisées en pratique : imputation par la régression qui inclut l’imputation par la moyenne et l’imputation par le ratio comme cas particulier, l’imputation par le plus proche voisin, l’imputation par hot-deck aléatoire, etc. Récemment, une nouvelle famille de méthode a été étudiée dans la littérature : celle des méthodes doublement robustes. Lorsqu’utilisées, ces méthodes mènent à des estimateurs imputés qui sont asymptotiquement sans biais et convergents si le modèle de non-réponse et/ou le modèle d’imputation est correctement spécifié. Autrement dit, ce type de méthodes offre une certaine protection si l’un des deux modèles est valide.

En présence de valeurs aberrantes, les estimateurs imputés sont habituellement hautement volatiles. Il convient alors de réduire l’influence des valeurs aberrantes, ce qui se traduira par l’obtention d’estimateur biaisés mais plus stables. Dans un premier temps, nous introduisons le concept de biais conditionnel d’une unité qui est une mesure d’influence. Nous proposerons alors des estimateurs robustes à la présence valeurs aberrantes, construits à partir du biais conditionnel estimé. Les résultats d’une étude par simulation seront présentés afin d’étudier le comportement de l’estimateur proposé en termes de biais relatif et d’efficacité relative.

commentaires (0) - poster un commentaire

Colloque CRM-ISM-GERAD, Concordia, 11 février 2011 le 4 février 2011 à 09:03

Le vendredi 11 février 2011, 15:30, Concordia University, Concordia University, Library Building, 1400 de Maisonneuve O., salle LB 921-4

A unified competing risks cure rate model with application to cancer survival data
Sanjib Basu, Northern Illinois University

A competing risks framework refers to multiple risks acting simultaneously on a subject or on a system. A cure rate, or a limited-failure model, postulates a fraction of the subjects/systems to be cured or failure-free, and can be formulated as a mixture model, or alternatively by a bounded cumulative hazard model. We develop models that unify the competing risks and limited-failure approaches. We describe Bayesian analysis of these models, and discuss conceptual, methodological and computational issues related to model fitting and model selection. We describe detailed applications in survival data from breast cancer patients in the Surveillance, Epidemiology, and End Results (SEER) program of the National Cancer Institute (NCI) of the United States.

commentaires (0) - poster un commentaire

Colloque CRM-ISM-GERAD, UQÀM, 4 février 2011 le 28 janvier 2011 à 17:49

Le 4 février 2011 à 15:30, UQÀM, Pav. Président-Kennedy, 200, av. Président-Kennedy, salle PK-1620

Composite Joint Estimating Functions and Applications in Spatio-Temporal Models
Peter X.K. Song, U. Michigan

Modeling of spatio-temporal processes has received considerable attention in recent statistical research. However, due to high dimensionality of the data, joint modeling of the spatial and temporal processes presents great computational challenge in both likelihood-based and Bayesian approaches. In this talk, I will present a composite joint estimating function (CJEF) approach to estimating spatio-temporal covariance structures, which substantially reduces the dimensionality and computational complexity and is more efficient than existing composite likelihood methods in spatial/temporal applications. The novelty of the proposed CJEF lies in the construction of three sets of estimating functions from spatial, temporal and cross pairs respectively. To deal with the issue that the resulting set of estimating functions contains more equations than the number of parameters, we form a quadratic inference function in a similar spirit to Hansen’s generalized method of moments for estimation. We show that the proposed method yields consistent estimation and the estimator is asymptotically normal under practical scenarios. Simulations prove that our method performs very well in finite samples. Finally, we apply our method to study the spatio-temporal dependence structure of PM10 particles in northeastern United States. This is the joint work with Yun Bai and T.E. Raghunathan.

commentaires (0) - poster un commentaire

Séminaire de statistique, Université Laval, 3 février 2011 le 28 janvier 2011 à 17:47

Le jeudi 3 février 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot

Analyse fréquentielle non-stationnaire des extrêmes hydrométéorologiques
Taha Ouarda, Institut national de recherche scientifique

On discutera de l’analyse fréquentielle des variables hydrométéorologiques dans un cadre de changement. Un modèle Bayésien qui permet d’exprimer les paramètres comme fonctions de différentes covariables est présenté. On discutera ensuite de la modélisation des oscillations non-stationnaires des variables et des indices climatiques. D’un intérêt particulier est la modélisation du lien entre les variables climatiques et les extrêmes hydrologiques. Puisque les indices climatiques et les variables hydrométéorologiques associées contiennent des processus oscillatoires non-stationnaires, il serait utile de pouvoir décomposer les oscillations non-stationnaires intrinsèques en un nombre fini de composantes. Ces composantes pourront ensuite être utilisées pour prédire l’évolution future du climat et des extrêmes hydrométéorologiques et pour alimenter les études d’analyse fréquentielle. En partant d’études effectuées sur les composantes des apports naturels au système des Grands Lacs d’Amérique du Nord, on montre l’importance d’utiliser les modèles de processus non-linéaires et non-stationnaires pour la modélisation des variables hydrométéorologiques. On propose ensuite un modèle qui permet d’extraire les oscillations non-stationnaires des variables hydrométéorologiques en utilisant une approche de décomposition. Les aspects théoriques sont présentés, suivis par des applications à différentes variables d’intérêt. Les résultats indiquent que les approches proposées permettent de bien modéliser les patrons d’évolution à long terme.

commentaires (0) - poster un commentaire

Colloque CRM-ISM-GERAD, McGill, 28 janvier 2011 le 27 janvier 2011 à 21:05

Le vendredi 28 janvier 2011, de 15 h 30 à 16 h 30, McGill, Burnside Hall, 805 Sherbrooke O. / salle 1B24

Testing for bivariate extreme-value dependence
Jean-Francois Quessy, Université du Québec à Trois-Rivières

In this talk, I will describe new tests for the hypothesis of bivariate extreme-value dependence. All these test statistics are functionals of either Kendall’s process or its version with estimated parameters. The procedures considered are based on linear combinations of moments and on Cramér-von Mises distances. It will be shown how a suitably adapted version of the Multiplier Central Limit Theorem enables the computation of asymptotically valid p-values. Some results about the power of the tests in small samples and asymptotically under local alternatives will be presented. The methods will be illustrated on the Cook & Johnson data set.

commentaires (0) - poster un commentaire

Séminaire de statistique, Université Laval, 27 janvier 2011 le 27 janvier 2011 à 21:03

Le jeudi 27 janvier 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot

Modélisation bayésienne empirique des effets « entreprise » et « véhicule » pour des données longitudinales
Jean-François Angers, Université de Montréal

Durant cette présentation, nous proposons un modèle statistique pour représenter la distribution du nombre d’accidents de flottes de véhicules. Le modèle utilise des données longitudinales pour représenter simultanément les effets « entreprise », « véhicule » et « temps ». Comme la distribution des accidents dépend de facteurs observables et non observables, ces derniers sont considérés comme étant aléatoires. Une approche bayésienne empirique est utilisée pour estimer les différents hyperparamètres.

commentaires (0) - poster un commentaire




2136 chemin Sainte-Foy, Suite 200
Québec (Québec)
G1V 1R8

Adresse électronique :  assq@association-assq.qc.ca