Le jeudi 24 février 2011, à 13 h 30, en la salle 2500 du pavillon Adrien-Pouliot
Contrôle de la divulgation de données : l’approche de la confidentialité différentielle
Anne-Sophie Charest, Université Carnegie Mellon
Toute organisation qui souhaite publier des données ou conclusions statistiques doit faire attention de respecter son engagement de confidentialité envers ses répondants. Avec la multiplication de l’information disponible en ligne sur chaque individu, cette tâche est de plus en plus ardue. Dans cette présentation, nous ferons d’abord un bref survol des différentes méthodes utilisées pour le contrôle de la divulgation, et des critères employés pour évaluer la confidentialité des données publiées. Puis, nous présenterons un critère relativement nouveau dans la littérature de contrôle de la divulgation: la confidentialité différentielle. Dans cette approche, on considère une méthode de contrôle de la divulgation comme une fonction générant un objet (statistique résumée, paramètres de modèles, jeux de données synthétiques…) à partir d’un jeu de données qu’on désire garder confidentielles. La confidentialité différentielle est une propriété de cette fonction. Il s’agit d’un critère très strict qui n’assume rien à propos des ressources de l’adversaire cherchant à révéler les données confidentielles. Nous nous attarderons à la création de données synthétiques satisfaisant le critère de confidentialité différentielle, et en particulier à l’analyse de tels jeux de données synthétiques.