Numéro spécial : Special Issue on Networks and Statistics
Co-clustering through Latent Bloc Model: a Review
[Une revue bibliographique de la classification croisée au travers du modèle des blocs latents]
Journal de la société française de statistique, Tome 156 (2015) no. 3, pp. 120-139

Voir la notice de l'article provenant de la source Numdam

We present here model-based co-clustering methods, with a focus on the latent block model (LBM). We introduce several specifications of the LBM (standard, sparse, Bayesian) and review some identifiability results. We show how the complex dependency structure prevents standard maximum likelihood estimation and present alternative and popular inference methods. Those estimation methods are based on a tractable approximation of the likelihood and rely on iterative procedures, which makes them difficult to analyze. We nevertheless present some asymptotic results for consistency. The results are partial as they rely on a reasonable but still unproved condition. Likewise, available model selection tools for choosing the number of groups in rows and columns are only valid up to a conjecture. We also briefly discuss non model-based co-clustering procedures. Finally, we show how LBM can be used for bipartite graph analysis and highlight throughout this review its connection to the Stochastic Block Model.

Nous présentons ici les méthodes de co-clustering, avec une emphase sur les modèles à blocs latents (LBM) et les parallèles qui existent entre le LBM et le Modèle à Blocs Stochastiques (SBM), notamment pour l’analyse de graphes bipartites. Nous introduisons différentes variantes du LBM (standard, sparse, bayésien) et présentons des résultats d’identifiabilité. Nous montrons comment la structure de dépendance complexe induite par le LBM rend l’estimation des paramètres par maximum de vraisemblance impossible en pratique et passons en revue des méthodes d’inférence alternatives. Ces dernières sont basées sur des procédures itératives, combinées à des approximations faciles à maximiser de la vraisemblance, ce qui les rend malaisés à analyser théoriquement. Il existe néanmoins des résultats de consistence, partiels en ce qu’ils reposent sur une condition raisonnable mais encore non démontrée. De même, les outils de sélection de modèle actuellement disponibles pour choisir le nombre de cluster reposent sur une conjecture. Nous replacons brièvement LBM dans le contexte des méthodes de co-clustering qui ne s’appuient pas sur un modèle génératif, particulièrement celles basées sur la factorisation de matrices. Nous concluons avec une étude de cas qui illustre les avantages du co-clustering sur le clustering simple.

Keywords: Latent Variable model, Latent Block Model, Variational approximation, Model Selection, ICL, BIC, Bipartite Graphs
Mots-clés : Modèle à blocs latents, Modèle à variables latentes, Approximation variationnelle, Sélection de modèle, ICL, BIC, Graphes bipartites
@article{JSFS_2015__156_3_120_0,
     author = {Brault, Vincent and Mariadassou, Mahendra},
     title = {Co-clustering through {Latent} {Bloc} {Model:} a {Review}},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {120--139},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {156},
     number = {3},
     year = {2015},
     mrnumber = {3432606},
     zbl = {1341.62172},
     language = {en},
     url = {http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_120_0/}
}
TY  - JOUR
AU  - Brault, Vincent
AU  - Mariadassou, Mahendra
TI  - Co-clustering through Latent Bloc Model: a Review
JO  - Journal de la société française de statistique
PY  - 2015
SP  - 120
EP  - 139
VL  - 156
IS  - 3
PB  - Société française de statistique
UR  - http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_120_0/
LA  - en
ID  - JSFS_2015__156_3_120_0
ER  - 
%0 Journal Article
%A Brault, Vincent
%A Mariadassou, Mahendra
%T Co-clustering through Latent Bloc Model: a Review
%J Journal de la société française de statistique
%D 2015
%P 120-139
%V 156
%N 3
%I Société française de statistique
%U http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_120_0/
%G en
%F JSFS_2015__156_3_120_0
Brault, Vincent; Mariadassou, Mahendra. Co-clustering through Latent Bloc Model: a Review. Journal de la société française de statistique, Tome 156 (2015) no. 3, pp. 120-139. http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_120_0/