Defining a robust biological prior from Pathway Analysis to drive Network Inference
[Construction d’un a priori biologique robuste à partir de l’analyse de voies métaboliques pour l’inférence de réseaux]
Journal de la société française de statistique, Tome 152 (2011) no. 2, pp. 97-110

Voir la notice de l'article provenant de la source Numdam

Inferring genetic networks from gene expression data is one of the most challenging work in the post-genomic era, partly due to the vast space of possible networks and the relatively small amount of data available. In this field, Gaussian Graphical Model (GGM) provides a convenient framework for the discovery of biological networks.

In this paper, we propose an original approach for inferring gene regulation networks using a robust biological prior on their structure in order to limit the set of candidate networks.

Pathways, that represent biological knowledge on the regulatory networks, will be used as an informative prior knowledge to drive Network Inference. This approach is based on the selection of a relevant set of genes, called the “molecular signature”, associated with a condition of interest (for instance, the genes involved in disease development). In this context, differential expression analysis is a well established strategy. However outcome signatures are often not consistent and show little overlap between studies. Thus, we will dedicate the first part of our work to the improvement of the standard process of biomarker identification to guarantee the robustness and reproducibility of the molecular signature.

Our approach enables to compare the networks inferred between two conditions of interest (for instance case and control networks) and help along the biological interpretation of results. Thus it allows to identify differential regulations that occur in these conditions. We illustrate the proposed approach by applying our method to a study of breast cancer’s response to treatment.

L’inférence de réseaux génétiques à partir de données issues de biopuces est un des défis majeurs de l’ère post-génomique, en partie à cause du grand nombre de réseaux possibles et de la quantité relativement faible de données disponibles. Dans ce contexte, la théorie des modèles graphiques gaussiens est un outil efficace pour la reconstruction de réseaux.

A travers ce travail nous proposons une approche d’inférence de réseaux de régulation à partir d’un a priori biologique robuste sur la structure des réseaux afin de limiter le nombre de candidats possibles.

Les voies métaboliques, qui rendent compte des connaissances biologiques des réseaux de régulation, nous permettent de définir cet a priori. Cette approche est basée sur la sélection d’un ensemble de gènes pertinents, appelé “signature moléculaire”, potentiellement associé à un phénotype d’intérêt (par exemple les gènes impliqués dans le développement d’une pathologie). Dans ce contexte, l’analyse différentielle est la strategie prédominante. Néanmoins les signatures de gènes diffèrent d’une étude à l’autre et la robustesse de telles approches peut être remise en question. Ainsi, la première partie de notre travail consistera en l’amélioration de la stratégie d’identification des gènes les plus informatifs afin de garantir la robustesse et la reproductibilité de la signature moléculaire.

Notre approche vise à comparer les réseaux inférés dans différentes conditions d’étude et à faciliter l’interprétation biologique des résultats. Ainsi, elle permet de mettre en avant des régulations différentielles entre ces conditions.

Nous appliquerons notre méthode à l’étude de la réponse au traitement dans le cancer du sein.

Keywords: Network Inference, Gaussian Graphical Model, $\ell _1$ penalization, Prior information, Pathway Analysis
Mots-clés : Inférence de réseaux, Modèle graphique gaussien, Pénalisation $\ell _1$, Information a priori, Analyse de voies métaboliques
@article{JSFS_2011__152_2_97_0,
     author = {Jeanmougin, Marine and Guedj, Mickael and Ambroise, Christophe},
     title = {Defining a robust biological prior from {Pathway} {Analysis} to drive {Network} {Inference}},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {97--110},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {152},
     number = {2},
     year = {2011},
     mrnumber = {2821224},
     zbl = {1316.92050},
     language = {en},
     url = {http://geodesic.mathdoc.fr/item/JSFS_2011__152_2_97_0/}
}
TY  - JOUR
AU  - Jeanmougin, Marine
AU  - Guedj, Mickael
AU  - Ambroise, Christophe
TI  - Defining a robust biological prior from Pathway Analysis to drive Network Inference
JO  - Journal de la société française de statistique
PY  - 2011
SP  - 97
EP  - 110
VL  - 152
IS  - 2
PB  - Société française de statistique
UR  - http://geodesic.mathdoc.fr/item/JSFS_2011__152_2_97_0/
LA  - en
ID  - JSFS_2011__152_2_97_0
ER  - 
%0 Journal Article
%A Jeanmougin, Marine
%A Guedj, Mickael
%A Ambroise, Christophe
%T Defining a robust biological prior from Pathway Analysis to drive Network Inference
%J Journal de la société française de statistique
%D 2011
%P 97-110
%V 152
%N 2
%I Société française de statistique
%U http://geodesic.mathdoc.fr/item/JSFS_2011__152_2_97_0/
%G en
%F JSFS_2011__152_2_97_0
Jeanmougin, Marine; Guedj, Mickael; Ambroise, Christophe. Defining a robust biological prior from Pathway Analysis to drive Network Inference. Journal de la société française de statistique, Tome 152 (2011) no. 2, pp. 97-110. http://geodesic.mathdoc.fr/item/JSFS_2011__152_2_97_0/