Cluster or co-cluster the nodes of oriented graphs?
[Classification non supervisée de graphes orientés : faut-il distinguer les nœuds origines des noeuds terminaux ?]
Journal de la société française de statistique, Tome 162 (2021) no. 1, pp. 46-69

Voir la notice de l'article provenant de la source Numdam

When clustering the nodes of a graph, a unique partition of the nodes is usually built, either the graph is undirected or directed. While this choice is pertinent for undirected graphs, it should be discussed for directed graphs because it implies that no difference is made between the clusters of source and target nodes. We examine this question in the context of probabilistic models with latent variables and compare the use of the Stochastic Block Model (SBM) and of the Latent Block Model (LBM). We analyze and discuss this comparison through simulated and real data sets and suggest some recommendation.

Lors de la classification non supervisée des nœuds d’un graphe, une partition unique des nœuds est généralement construite, que le graphe soit orienté ou non. Bien que ce choix soit pertinent pour les graphes non orientés, il devrait être discuté pour les graphes orientés car il implique qu’aucune différence n’est faite entre les clusters de nœuds source et cible. Nous examinons cette question dans le contexte des modèles de clustering probabilistes à variables latentes et comparons l’utilisation du modèle de blocs stochastiques (SBM) et du modèle de blocs latents (LBM). Nous analysons et discutons cette comparaison à travers des jeux de données simulées et réelles.

Classification : 62-09, 62J05, 62P10
Keywords: Clustering for directed graphs, Genes networks, Penalized log-likehood, Co-clustering, SBM, LBM
Mots-clés : Classification non supervisée de graphes orientés, Réseaux de gènes, Vraisemblance pénalisée, Co-clustering, SBM, LBM

Keribin, Christine 1

1 Université Paris-Saclay, CNRS, Inria, Laboratoire de mathématiques d’Orsay, 91405, Orsay, France.
@article{JSFS_2021__162_1_46_0,
     author = {Keribin, Christine},
     title = {Cluster or co-cluster the nodes of oriented graphs?},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {46--69},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {162},
     number = {1},
     year = {2021},
     mrnumber = {4286849},
     zbl = {1469.62287},
     language = {en},
     url = {http://geodesic.mathdoc.fr/item/JSFS_2021__162_1_46_0/}
}
TY  - JOUR
AU  - Keribin, Christine
TI  - Cluster or co-cluster the nodes of oriented graphs?
JO  - Journal de la société française de statistique
PY  - 2021
SP  - 46
EP  - 69
VL  - 162
IS  - 1
PB  - Société française de statistique
UR  - http://geodesic.mathdoc.fr/item/JSFS_2021__162_1_46_0/
LA  - en
ID  - JSFS_2021__162_1_46_0
ER  - 
%0 Journal Article
%A Keribin, Christine
%T Cluster or co-cluster the nodes of oriented graphs?
%J Journal de la société française de statistique
%D 2021
%P 46-69
%V 162
%N 1
%I Société française de statistique
%U http://geodesic.mathdoc.fr/item/JSFS_2021__162_1_46_0/
%G en
%F JSFS_2021__162_1_46_0
Keribin, Christine. Cluster or co-cluster the nodes of oriented graphs?. Journal de la société française de statistique, Tome 162 (2021) no. 1, pp. 46-69. http://geodesic.mathdoc.fr/item/JSFS_2021__162_1_46_0/