Numéro spécial : Special Issue on Modelling and Inference for Infectious diseases
Construction of semi-Markov genetic-space-time SEIR models and inference
[Construction de modèles stochastiques génético-spatio-temporels et inférence]
Journal de la société française de statistique, Tome 157 (2016) no. 1, pp. 129-152

Voir la notice de l'article provenant de la source Numdam

Identifying transmission links of an infectious disease through a host population is critical to understanding its epidemiology and informing measures for its control. Infected hosts close together in their locations and timings are often thought to be linked, but timing and locations alone are usually consistent with many different scenarios of who infected whom. To infer more reliably who-transmitted-to-whom over the course of a disease outbreak caused by a fast-evolving pathogen, pathogen genomic data have been combined with spatial and temporal data. However, the manner to combine these data remains today a modeling and statistical challenge.

One of the approaches recently proposed is based on an extension of stochastic Susceptible-Exposed-Infectious-Removed (SEIR) models. In this article, we present this extension that combines (i) an individual-based, spatial, semi-Markov SEIR model for the spatio-temporal dynamics of the pathogen, and (ii) a Markovian evolutionary model for the temporal evolution of genetic sequences of the pathogen. The resulting model is a state-space model including latent vectors of high dimension. Then, we describe a new algorithm that allows an approximate Bayesian inference of model parameters and latent variables. Finally, the capacity of the estimation algorithm to reconstruct transmission trees (i.e. who infected whom) is assessed with a simulation study. We especially investigate how the inference method performs when only a fraction of pathogen genomic data is available.

Identifier les évènements de transmission d’une maladie infectieuse dans une population hôte est essentiel pour comprendre son épidémiologie et améliorer les mesures de lutte contre la maladie. Les hôtes infectés proches spatialement et temporellement sont souvent supposés être liés, mais les données temporelles et spatiales seules sont généralement compatibles avec de nombreux scénarios de qui a infecté qui. Pour inférer de manière plus précise qui a infecté qui au cours d’une épidémie causée par un pathogène à évolution rapide, des données génomiques sur le pathogène ont été associées aux données spatiales et temporelles. Cependant, la manière d’associer ces données reste aujourd’hui un défit en terme de modélisation et de statistique.

Une des approches récemment développées est basée sur une extension des modèles stochastiques Susceptible-Exposé-Infectieux-Retiré (SEIR). Dans cet article, nous présentons cette extension qui associe (i) un modèle SEIR individu-centré, spatial et semi-markovien pour la dynamique spatio-temporelle du pathogène, et (ii) un modèle markovien d’évolution temporelle des séquences génétiques du pathogène. Le modèle résultant est un modèle à espace d’états incorporant des vecteurs latents de grande dimension. Ensuite, nous décrivons un nouvel algorithme permettant de mener une inférence bayésienne approchée des paramètres du modèle et des variables latentes. Enfin, la capacité de l’algorithme d’estimation à reconstruire les arbres de transmission (c-à-d qui a infecté qui) est évaluée avec une étude simulatoire. Nous nous intéressons tout particulièrement aux performances de la méthode d’inférence lorsque seulement une fraction des données génomiques sur le pathogène est observée.

Keywords: Bayesian estimation, Genomic data, Spatiotemporal data, State-space model, Susceptible-Exposed-Infectious-Removed model
Mots-clés : Estimation bayésienne, Données génomiques, Données spatiotemporelles, Modèle à espace d’état, Modèle Susceptible-Exposé-Infectieux-Retiré
@article{JSFS_2016__157_1_129_0,
     author = {Soubeyrand, Samuel},
     title = {Construction of {semi-Markov} genetic-space-time {SEIR} models and inference},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {129--152},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {157},
     number = {1},
     year = {2016},
     zbl = {1360.92117},
     language = {en},
     url = {http://geodesic.mathdoc.fr/item/JSFS_2016__157_1_129_0/}
}
TY  - JOUR
AU  - Soubeyrand, Samuel
TI  - Construction of semi-Markov genetic-space-time SEIR models and inference
JO  - Journal de la société française de statistique
PY  - 2016
SP  - 129
EP  - 152
VL  - 157
IS  - 1
PB  - Société française de statistique
UR  - http://geodesic.mathdoc.fr/item/JSFS_2016__157_1_129_0/
LA  - en
ID  - JSFS_2016__157_1_129_0
ER  - 
%0 Journal Article
%A Soubeyrand, Samuel
%T Construction of semi-Markov genetic-space-time SEIR models and inference
%J Journal de la société française de statistique
%D 2016
%P 129-152
%V 157
%N 1
%I Société française de statistique
%U http://geodesic.mathdoc.fr/item/JSFS_2016__157_1_129_0/
%G en
%F JSFS_2016__157_1_129_0
Soubeyrand, Samuel. Construction of semi-Markov genetic-space-time SEIR models and inference. Journal de la société française de statistique, Tome 157 (2016) no. 1, pp. 129-152. http://geodesic.mathdoc.fr/item/JSFS_2016__157_1_129_0/