Prévisions météorologiques par régression non-paramétrique bayésienne basée sur le modèle PPMx spatio-temporel


Thèse ou mémoire / Thesis or Dissertation

Date de publication

Autrices et auteurs

Identifiant ORCID de l’auteur

Contributrices et contributeurs

Direction de recherche

Publié dans

Date de la Conférence

Lieu de la Conférence

Éditeur

Cycle d'études

Maîtrise / Master's

Programme

Affiliation

Mots-clés

  • prévisions numériques du temps
  • post-traitement statistique
  • Statistical post-processing
  • Spatio-temporal
  • Random partition models
  • Potts model
  • Dirichlet process
  • Non-parametric Bayesian models.
  • spatio-temporel
  • modèles de partition aléatoire
  • modèle de Potts
  • PPMx
  • processus de Dirichlet
  • DPMM
  • modèle bayésien non-paramétrique
  • Numerical weather prediction

Organisme subventionnaire

Résumé

Ce mémoire présente un modèle de régression bayésien non-paramétrique spatiotemporel basé sur le modèle PPMx, introduit par Quintana et al. (2011), avec l’ajout d’effets aléatoires. On surnomme ce modèle STPPMx, développé dans le contexte de prévisions météorologiques. On se concentre principalement sur les ensembles de prévisions numériques du temps (PNT) émises par des modèles physiques à partir d’un ensemble de conditions météorologiques initiales. Le modèle STPPMx est comparé à d’autres modèles de régressions alternatifs pour le post-traitement statistique, qui consiste dans notre cas à fournir une densité prédictive capable de potentiellement émettre des prévisions mieux calibrées et plus précises que les prévisions PNT. L’avantage du modèle STPPMx est qu’il permet de former des grappes spatio-temporelles parmi les observations selon la similarité entre leurs covariables, en plus d’offrir une grande flexibilité dans la modélisation de la corrélation spatio-temporelle. La similarité entre les modèles STPPMx et les modèles de mélanges par processus de Dirichlet (DPMM) permet de facilement implémenter des algorithmes de Monte-Carlo par chaînes de Markov (MCMC) développés pour les DPMM afin d’effectuer l’échantillonnage à postériori et l’estimation de la densité prédictive du modèle STPPMx, notamment grâce au schéma de Black-MacQueen. L’algorithme 8 de Neal (2000) a été considéré afin de pouvoir mener l’inférence prédictive avec des distributions à priori conjuguées et nonconjuguées. On compare la performance prédictive entre le modèle STPPMx et des modèles alternatifs dans deux cas de simulation où on génère des données en grappes et corrélées spatio-temporellement, ainsi que dans une application à des données climatologiques et des prévisions PNT provenant de plusieurs stations géographiques réparties en Europe centrale à travers le temps. Le code pour le modèle est implémenté en C++ et R et est disponible au grand public.


In the context of weather forecast, the goal of this thesis is to introduce a non-parametric spatio-temporal Bayesian regression model based on the PPMx model, introduced by Quintana et al. (2011), with random effects, which we name STPPMx. We mainly focus on ensemble numerical weather predictions (NWP) that are produced by physical models starting from a set of similar initial conditions. The STPPMx model is compared to alternative statistical post-processing models, which in our case consist of giving a predictive density capable of producing forecasts that are more calibrated and sharper than the NWP forecasts. The STPPMx model’s main advantage is the ability to partition the data based on the similarity between covariates, while offering flexible modelling of the spatio-temporal correlation. The similarity between PPMx models and Dirichlet process mixture models (DPMM) allows us to use multiple available and easy-to-implement MCMC algorithms designed for DPMMs. We can then estimate the predictive density and make forecasts, mainly due to the convenience of the Blackwell-MacQueen scheme. Specifically, we use an algorithm developed by Neal (2000) that allows predictive inference with conjugate and non-conjugate priors. We compare the STPPMx model with alternative statistical post-processing models in two simulation cases where data is generated into partitions with spatio-temporal correlation, then with real climatological data from multiple stations in Central Europe across time. The code implemented in C++/R is available to the public.

Table des matières

Notes

Notes

Autre version linguistique

Ensemble de données lié

Licence

Approbation

Évaluation

Complété par

Référencé par

Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Sauf si le document est diffusé sous une licence Creative Commons, il ne peut être utilisé que dans le cadre d'une utilisation équitable et non commerciale comme le prévoit la Loi (i.e. à des fins d'étude privée ou de recherche, de critique ou de compte-rendu). Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.