Les probabilités et la statistique, un hasard qui devient une passion et qui mène à une excellente carrière – Entrevue avec le professeur Bruno Rémillard

le 19 décembre 2016 à 18:50
dtalbot

Monsieur Rémillard, vous êtes professeur en ingénierie financière à HEC Montréal. Vous avez effectué un doctorat en probabilités à l’Université Carleton et des études postdoctorales à l’Université Cornell. Vous êtes auteur ou co-auteur de plus de soixante-dix articles de recherche en probabilités, statistique et ingénierie financière. Vous êtes un des récipiendaires du prestigieux prix Pierre-Robillard de la meilleure thèse de doctorat offert par la Société statistique du Canada. Vous avez aussi gagné le prix du meilleur article de la Revue Canadienne de Statistique en 2003. Vous avez été consultant pour plusieurs firmes en finance comme Innocap et la Banque Nationale du Canada, où vous avez contribué à l’élaboration et l’implantation de nouvelles méthodes quantitatives pour la gestion des portefeuilles. Vous êtes aussi l’auteur d’un livre sur les méthodes statistiques utilisées en ingénierie financière. M. Rémillard, merci de m’accorder cette entrevue.

 

Bruno Rémillard, un scientifique avant tout

Q. Comment avez-vous développé votre intérêt pour la science? Les mathématiques ont été un choix naturel pour vous?

R. J’ai toujours été curieux et je voulais savoir comment tout fonctionnait. Lorsque j’étais enfant, j’avais d’ailleurs un microscope et un « kit » de petit chimiste, ce qui m’a donné le goût de la recherche. Je me suis rendu compte assez tard que j’aimais les mathématiques et que j’avais un certain talent. Il a fallu aussi l’aide du destin! En effet, lors de la traditionnelle visite des étudiants du cégep à l’Université Laval, je devais visiter le département de chimie mais je me suis perdu. En errant, je suis arrivé devant le département de mathématiques et j’y suis entré écouter la présentation du directeur de l’époque, Claude Lemaire. En sortant de la rencontre, j’ai décidé de me diriger en mathématiques. On peut donc dire que ma carrière en mathématiques a débuté par une marche aléatoire!

 

Q. Vous avez un doctorat en probabilités. Vous considérez-vous plus probabiliste ou statisticien?

R. Bonne question! Même dans mes projets de recherche en statistique, j’utilise très souvent des techniques probabilistes. Mais comme j’aime aussi faire des applications, pas seulement de la théorie, je me définirais avant tout comme un probabiliste appliqué.

 

Q. Qui sont les gens qui vous ont inspiré d’une manière significative dans votre carrière?

R. Parmi les gens que j’ai connus, je peux nommer Radu Theodorescu avec qui j’ai fait ma maîtrise à l’Université Laval, Donald Dawson, l’un des meilleurs probabilistes au monde qui a été mon superviseur de doctorat à Carleton University, et Christian Genest, avec qui je collabore depuis plus de vingt ans. Ce dernier est surtout responsable de l’orientation statistique de ma carrière. Parmi les personnes que je n’ai pas connues, il y a bien sûr Carl Friedrich Gauss. En passant, c’est le professeur Theodorescu qui m’a fortement encouragé à aller étudier avec Don Dawson. Je lui en serai éternellement reconnaissant.

 

Q. En statistique ou en probabilités, quel théorème est votre coup de cœur?

R. J’ai toujours eu un faible pour le théorème central limite fonctionnel (Donsker, 1952) donnant la convergence du processus empirique vers le pont brownien, mais le résultat qui m’a le plus épaté est la loi du logarithme itéré sous forme fonctionnelle. Parlant du théorème fonctionnel, on peut s’en servir pour déduire le fameux théorème central limite que tous connaissent, mais c’est un peu comme utiliser une bombe atomique pour tuer une mouche!

 

Q. Vous avez plus de 70 articles, généralement publiés dans des revues prestigieuses en statistique ou en probabilités. Nommez-moi un de vos articles que vous aimez le plus.

R. Celui dont je suis le plus fier est l’article avec mon bon ami Christian Genest (Genest et Rémillard, 2008), où nous montrons l’applicabilité d’une méthode Monte Carlo (ré- échantillonnage paramétrique) pour estimer les probabilités critiques de modèles complexes. Même si c’est un article techniquement difficile, il est très cité.

 

Q. Parlez-nous de vos intérêts de recherche.

R. Mes intérêts de recherche portent beaucoup sur le développement d’outils pour des tests d’adéquation ou d’indépendance, incluant la dépendance sérielle. En fait, ce qui me motive le plus est de pouvoir valider l’utilisation de modèles statistiques à un ensemble de données. La plupart des modèles comportent des hypothèses qui doivent être vérifiées, comme par exemple les termes d’erreur non observables sont indépendants ou gaussiens, etc. Il faut donc être capable de vérifier si ces hypothèses sont réalistes. Valider un modèle est aussi très important en ingénierie financière. Par exemple, avec des collègues, j’ai développé des techniques avancées d’investissement où il est extrêmement important de bien modéliser les données. Ces techniques ont été utilisées dans l’industrie. Certaines le sont encore. En passant, avant que je ne reçoive des demandes de conseils de placements, je dois dire que ces techniques nécessitent un investissement initial de plusieurs millions de dollars, donc elles ne sont pas accessibles aux particuliers! Je m’intéresse aussi beaucoup aux processus empiriques, ainsi qu’à plusieurs autres problèmes de nature probabiliste.

 

Q. Une grande partie de votre recherche porte sur les processus empiriques, un domaine assez difficile et demandant de large développements mathématiques. Comment avez-vous développé cette passion pour ce champ de recherche?

R. Suite à mon début de collaboration avec Christian Genest et Kilani Ghoudi, qui était chercheur postdoctoral avec Christian à ce moment, je suis tout simplement passé des processus stochastiques sans applications (en probabilités) à des processus stochastiques ayant des applications! Nous nous sommes intéressés aux fonctions de répartitions empiriques construites à partir de résidus ou autres transformations que l’on a nommé pseudo-observations. On y travaille depuis plus de vingt ans. C’était aussi à un moment de ma carrière où je me questionnais sur l’utilité de mes recherches. Encore une fois, le hasard a bien fait les choses!

 

Q. Vos articles les plus cités traitent des copules. Comment expliquez-vous cela?

R. Les copules sont utilisées dans plusieurs domaines d’application, et la plupart des références à mes articles proviennent de chercheurs qui ne sont pas statisticiens, mais qui utilisent les copules dans leurs domaines d’expertise. D’ou l’intérêt de développer des outils qu’ils pourront utiliser.

 

Q. Quelles sont les domaines d’application que vous visez le plus dans votre recherche?

R. En premier lieu, les applications en finance et en économétrie, domaines que je connais le mieux. Et, par conséquent, les données qui m’intéressent le plus sont des séries chronologiques. Je m’intéresse maintenant aussi aux applications en hydrologie et à la dépendance à long terme.

 

Le livre de Bruno Rémillard : Statistical Methods For Financial Engineering

img4

Q. Vous êtes le seul statisticien au Québec, à ma connaissance, à avoir rédigé un livre comme unique auteur. D’abord, félicitations pour cet excellent livre, qui a gagné le prixRoger-Charbonneau en 2013. Pourquoi avez-vous décidé de l’écrire? Parlez-nous de cette expérience.

R. Premièrement, un mot sur l’ingénierie financière. Dans ce domaine, on cherche souvent à évaluer la valeur de produits financiers souvent complexes, basés sur des actifs transigés en bourse. Cela implique donc d’avoir des modèles pour l’évolution de la valeur de ces actifs au cours du temps.

J’avais des notes de cours que j’avais développées pour un cours de maîtrise en ingénierie financière, car la plupart des livres sur le marché traitaient des statistiques de base sans étudier en détails les modèles ou problèmes rencontrés dans ce domaine. Ensuite, j’ai été contacté par des éditeurs. J’ai donc traduit mes notes de cours, mis à jour les exemples numériques et j’ai ajouté certains sujets qui m’intéressaient particulièrement et que j’avais rencontrés en pratique lors de mes consultations. Le principe sous-jacent de presque chaque chapitre est de prendre un article fondamental afin d’introduire le sujet, par exemple les modèles de taux d’intérêt, et ensuite montrer comment les statistiques peuvent être utilisées pour implanter efficacement le modèle et faire les calculs appropriés, comme l’évaluation d’options, basés sur ces modèles. J’ai aussi reçu le support financier de HEC pour rédiger des exercices et faire traduire mes programmes Matlab en R, car R est de plus en plus populaire en finance.

 

Q. À qui est destiné votre livre?

R. Avant tout, aux étudiants gradués en ingénierie financière et aux « quants »[i] qui travaillent dans les institutions financières. Les statisticiens peuvent aussi y trouver leur compte, car le livre contient des techniques assez nouvelles et avancées qui sont peu ou pas enseignées. Et surtout, un long chapitre sur les copules!

 

Q. Trois des dix chapitres du livre sont consacrés aux modèles de Black-Scholes. Pouvez-vous nous parler davantage de leur utilité en ingénierie financière?

R. Les modèles de Black-Scholes sont les modèles de base en ingénierie financière. Ils correspondent au cas classique en statistique de données indépendantes et identiquement distribuées, selon un vecteur de loi normale. Ils sont aussi les seuls où l’on a des formules explicites pour l’estimation des paramètres et la valeur de plusieurs produits financiers comme les options d’achat ou de vente. Dans ces trois chapitres, j’ai donc traité des principaux problèmes statistiques auxquels les utilisateurs de ces modèles font face. Par exemple, le fait d’estimer l’écart type (appelé ici volatilité) a un effet sur la valeur d’une option. Je montre comment quantifier cette erreur. En fait, je me sers aussi de ces modèles pour introduire le principe du maximum de vraisemblance, qui est ensuite utilisé pour des modèles plus compliqués qui ont une dépendance temporelle. J’en profite aussi pour montrer comment vérifier les hypothèses de ces modèles.

 

Q. En lisant le titre du livre, on pourrait s’attendre à ce que ce livre traite en grand majorité de modèles de base des séries chronologiques. Pourtant, il y a seulement un seul petit chapitre sur ce sujet et qui parle plus particulièrement des modèles GARCH. Pourquoi avez-vous fait le choix de parler d’autre chose que des séries chronologiques?

R. Vous parlez peut-être de l’approche traditionnelle de séries chronologiques comme les modèles ARMA, etc. Dans ce cas, oui, je ne les traite pas ou très peu. Ce ne sont pas des modèles qui sont utilisés dans le livre. En fait, presque tous les chapitres portent sur des modèles de séries chronologiques! Dans chacun, on tente de modéliser l’évolution de la valeur d’actifs financiers, souvent en temps continu. En pratique, on observe ces valeurs en temps discret, d’où les séries chronologiques.

 

Q. Votre livre contient un long chapitre sur les copules, très détaillé, et qui résume bien la littérature sur ce sujet. Quel est le rôle des copules dans la modélisation en finance?

R. En fait, dès qu’il existe une forme de dépendance, on peut utiliser des copules. Je donne justement un exemple intéressant dans le début du chapitre, où je traite de modèles d’évolution de cotes de crédit, ce qui revient à introduire une dépendance entre des chaînes de Markov discrètes. La construction d’un portefeuille de plusieurs actifs dépend aussi de la dépendance entre ces actifs. Je donne aussi un autre exemple en finance pour la réplication d’indices de fonds de couverture, ce qui est relié aux fameux FNB (fonds négociés en bourse), si populaires en ce moment. Une section importante à la fin porte aussi sur l’utilisation des copules sur des résidus de modèles de séries chronologiques. Je montre surtout comment implanter efficacement un modèle de copule. Le plus drôle avec ce chapitre, c’est qu’il n’apparaissait pas dans la première version du cours. C’est suite à la demande des étudiants que j’ai introduit ce sujet. Après, un grand nombre de mémoires de maîtrise en ingénierie financière ont utilisé les copules!

 

Q. Votre livre traite aussi du filtrage, un domaine moins connu mais très utile en finance. Pouvez-vous nous parlez davantage des techniques de filtrage?

R. La plupart des statisticiens connaissent ou ont du moins entendu parler des méthodes bayésiennes. On cherche la distribution conditionnelle d’un paramètre aléatoire par rapport à des observations dont la loi dépend du paramètre en question, ce qui est une application du fameux théorème de Bayes que tant d’étudiants détestent! Dans le contexte des problèmes de filtrage, on remplace la variable par une série de variables qui évoluent dans le temps, autrement dit un processus aléatoire. À l’aide d’observations d’une série chronologique, le filtrage sert à prévoir les valeurs actuelles et futures du processus, en fonction des observations disponibles jusqu’à présent. Plus précisément, on s’intéresse à la loi conditionnelle des valeurs présentes et futures du processus, par rapport aux observations. C’est une technique très utile dans bien des domaines, dont la finance, où les observations sont les rendements d’actifs. Vous avez même pu entendre parler d’un type particulier de filtre, le filtre de Kalman.

 

Q. Votre livre a fait l’objet d’une analyse dans la prestigieuse revue Journal of the American Statistical Association. L’article est rédigé par Michael Steele, professeur au département statistique à la University of Pennsylvania. Il recommande fortement l’utilisation de votre livre, mais il dénie l’utilité des deux annexes portant sur les bases de la statistique et des probabilités. Que répondez-vous à cette critique?

R. Dans l’annexe sur les probabilités, j’énumère surtout les lois utilisées et leurs propriétés, en fixant certaines notations qui sont utilisées dans les chapitres principaux ainsi que dans les programmes R et Matlab. Par exemple, je me suis aperçu en donnant ce cours que la convention classique des paramètres d’une loi gamma n’était pas respectée, dépendamment de la provenance des étudiants. Donc, oui, cela est nécessaire. Quant à l’annexe sur les statistiques, elle permet de ne pas incorporer dans le texte un paquet de formules qui nuiraient au déroulement du sujet traité. Dans cette annexe, je traite de maximum de vraisemblance pour des séries chronologiques, d’estimation de densité, de tests d’adéquation et d’indépendance, d’algorithme EM, etc. En passant, plusieurs de ces sujets sont d’intérêt pour des statisticiens.

 

Q. La présence des codes Matlab et R pour chaque chapitre permet, à mon avis, d’aider les lecteurs de ce livre à mieux comprendre et à mettre en pratique les connaissances acquises. D’ailleurs, votre livre fait partie des Mathworks Book, ce qui est exceptionnel. Les codes R et Matlab sont-ils gratuits pour tout le monde?

R. Oui, tous les codes sont gratuits. Il suffit de me demander le mot de passe pour y accéder. Toutefois, sans le livre, ils sont un peu difficiles à utiliser. L’achat du livre est donc nécessaire! En passant, il y a aussi des exercices numériques dont les réponses sont aussi en format R et Matlab.

 

Q. On trouve plusieurs livres qui traitent de modèles statistiques utilisables dans le domaine de la finance. Pensons entre autres au livre de David Ruppert, professeur à Cornell University, intitulé Statistics and Data Analysis for Financial Engineering (Ruppert, 2011). En quoi votre livre se distingue-t-il de celui-ci ou d’autres livres du même genre?

R. C’est une question à laquelle j’ai dû répondre lors de la parution du livre. L’éditeur s’en sert pour la promotion! Les autres livres, dont celui de Ruppert que vous mentionnez, contiennent des outils statistiques assez standards que l’on retrouve dans les cours universitaires, surtout en économie et en statistique. Par exemple, Ruppert parle de régression alors que je n’y touche presque pas, car ce n’est pas utile en général en ingénierie financière. Je dirais que le livre de Ruppert, comme les autres d’ailleurs, sont plus des livres destinés aux statisticiens qui voudraient faire des applications très simples en ingénierie financière, et non pas à des ingénieurs financiers qui ont besoin de techniques plus poussées. Je ne peux pas les utiliser dans mes cours. Contrairement à la plupart des autres livres, le mien tente de montrer comment valider et implanter les modèles utilisés en ingénierie financière, et en particulier comment estimer les paramètres, comment évaluer les produits financiers et donner l’erreur sur l’évaluation, en tenant compte du fait que les paramètres sont estimés. J’ai aussi introduit beaucoup de tests de validation que j’ai développés au cours des ans, suite à mes collaborations avec l’industrie.

 

Q. Est-ce que votre livre peut être d’intérêt pour un statisticien?

R. Comme je l’ai mentionné précédemment, le livre compte plusieurs techniques intéressantes qui sont peu ou pas enseignées, même au niveau gradué. Pour les amateurs de séries chronologiques, je traite de tests de dépendance sérielle et de tests de changements de structure, basés sur les fonctions de répartitions empiriques. Je traite aussi de modèles de Markov cachés, d’estimation de la densité, etc. Par contre, ces techniques sont éparpillées un peu partout dans les chapitres. Mais on peut les retrouver grâce à la table des matières!

 

Bruno Rémillard, quelques conseils

 

Q. Que conseillez-vous aux chercheurs juniors qui désirent mener une carrière aussi brillante que la vôtre?

R. Merci du compliment! Faire de la recherche et vouloir contribuer de façon significative demande beaucoup de temps, de persévérance et de sacrifices. C’est plus une vocation. Ça ne se fait pas facilement en faisant du neuf à cinq par exemple. On ne peut pas nécessairement avoir l’inspiration au moment voulu. Parlant de persévérance, il y a des problèmes que j’ai mis douze ans à résoudre et d’autres qui ne sont pas encore résolus après vingt ans. Un dernier conseil : les résultats théoriques, c’est bien beau, mais si on veut que les utilisateurs les mettent en pratique, il faut leur donner les outils nécessaires, ce qui implique de devoir créer des logiciels. Cela demande du temps mais c’est tellement gratifiant lorsque les gens utilisent nos techniques.

 

 

Références

  • Genest, C. et Rémillard, B. (2008). Validity of the parametric bootstrap for goodness-of-fit testing in semiparametric models. Annales de l’Institut Henri-Poincaré : Probabilités et statistiques. 44(6) : 1096-1127.
  • Donsker, M. D.(1952). Justification and extension of Doob’s heuristic approach to the Kolmogorov–Smirnov theorems. Annals of Mathematical Statistics23 : 277–281.
  • Ruppert, D. (2011). Statistics and Data Analysis for Financial Engineering. Springer Texts in Statistics, Springer NY.

Pour plus d’information sur le professeur Bruno Rémillard, n’hésitez pas à consulter :

http://neumann.hec.ca/pages/bruno.remillard/

http://brunoremillard.com

http://ssrn.com/author=429719

 

Entrevue réalisée par :

Bouchra Nasri,

Présidente intérimaire et vice-présidente

 

Retour à la table des matière

[i] NDLR : aux analystes quantitatifs, aux personnes se spécialisant dans l’utilisation de méthodes mathématiques et statistiques pour résoudre des problèmes en finance ou en gestion de risque.

FacebookTwitterGoogle+LinkedIn