Numéro spécial : Special Issue on Networks and Statistics
Using SOMbrero for clustering and visualizing graphs
[Utiliser SOMbrero pour la classification et la visualisation de graphes]
Journal de la société française de statistique, Tome 156 (2015) no. 3, pp. 95-119

Voir la notice de l'article provenant de la source Numdam

Graphs have attracted a burst of attention in the last years, with applications to social science, biology, computer science... In the present paper, we illustrate how self-organizing maps (SOM) can be used to enlighten the structure of the graph, performing clustering of the graph together with visualization of a simplified graph. In particular, we present the R package SOMbrero which implements a stochastic version of the so-called relational algorithm: the method is able to process any dissimilarity data and several dissimilarities adapted to graphs are described and compared. The use of the package is illustrated on two real-world datasets: one, included in the package itself, is small enough to allow for a full investigation of the influence of the choice of a dissimilarity to measure the proximity between the vertices on the results. The other example comes from an application in biology and is based on a large bipartite graph of chemical reactions with several thousands vertices.

L’analyse de graphes a connu un intérêt croissant dans les dernières années, avec des applications en sciences sociales, biologie, informatique, ... Dans cet article, nous illustrons comment les cartes auto-organisatrices (SOM) peuvent être utilisées pour mettre en lumière la structure d’un graphe en combinant la classification de ses sommets avec une visualisation simplifiée de celui-ci. En particulier, nous présentons le package R SOMbrero dans lequel est implémentée une version stochastique de l’approche dite « relationnelle » de l’algorithme de cartes auto-organisatrices. Cette méthode permet d’utiliser les cartes auto-organisatrices avec des données décrites par des mesures de dissimilarité et nous discutons et comparons ici plusieurs types de dissimilarités adaptées aux graphes. L’utilisation du package est illustrée sur deux jeux de données réelles : le premier, inclus dans le package lui-même, est suffisamment petit pour permettre l’analyse complète de l’influence du choix de la mesure de dissimilarité sur les résultats. Le second exemple provient d’une application en biologie et est basé sur un graphe biparti de grande taille, issu de réactions chimiques et qui contient plusieurs milliers de nœuds.

Keywords: graph, R package, self-organizing map, clustering, visualization
Mots-clés : graphe, package R, carte auto-organisatrice, classification, visualisation
@article{JSFS_2015__156_3_95_0,
     author = {Olteanu, Madalina and Villa-Vialaneix, Nathalie},
     title = {Using {SOMbrero} for clustering and visualizing graphs},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {95--119},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {156},
     number = {3},
     year = {2015},
     zbl = {1336.62034},
     language = {en},
     url = {http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_95_0/}
}
TY  - JOUR
AU  - Olteanu, Madalina
AU  - Villa-Vialaneix, Nathalie
TI  - Using SOMbrero for clustering and visualizing graphs
JO  - Journal de la société française de statistique
PY  - 2015
SP  - 95
EP  - 119
VL  - 156
IS  - 3
PB  - Société française de statistique
UR  - http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_95_0/
LA  - en
ID  - JSFS_2015__156_3_95_0
ER  - 
%0 Journal Article
%A Olteanu, Madalina
%A Villa-Vialaneix, Nathalie
%T Using SOMbrero for clustering and visualizing graphs
%J Journal de la société française de statistique
%D 2015
%P 95-119
%V 156
%N 3
%I Société française de statistique
%U http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_95_0/
%G en
%F JSFS_2015__156_3_95_0
Olteanu, Madalina; Villa-Vialaneix, Nathalie. Using SOMbrero for clustering and visualizing graphs. Journal de la société française de statistique, Tome 156 (2015) no. 3, pp. 95-119. http://geodesic.mathdoc.fr/item/JSFS_2015__156_3_95_0/