Voir la notice de l'article provenant de la source Numdam
The Fisher-EM algorithm has been recently proposed in [ 2 ] for the simultaneous visualization and clustering of high-dimensional data. It is based on a discriminative latent mixture model which fits the data into a latent discriminative subspace with an intrinsic dimension lower than the dimension of the original space. The Fisher-EM algorithm includes an F-step which estimates the projection matrix whose columns span the discriminative latent space. This matrix is estimated via an optimization problem which is solved using a Gram-Schmidt procedure in the original algorithm. Unfortunately, this procedure suffers in some case from numerical instabilities which may result in a deterioration of the visualization quality or the clustering accuracy. Two alternatives for estimating the latent subspace are proposed to overcome this limitation. The optimization problem of the F-step is first recasted as a regression-type problem and then reformulated such that the solution can be approximated with a SVD. Experiments on simulated and real datasets show the improvement of the proposed alternatives for both the visualization and the clustering of data.
L’algorithme Fisher-EM a été récemment proposé dans [ 2 ] pour simultanément visualiser et classer automatiquement des données de grande dimension. Il se base sur un modèle de mélange latent et discriminant qui modélise les données dans un sous-espace de dimension intrinsèque plus petite que celle de l’espace des observations. L’algorithme Fisher-EM est composé d’une étape F qui estime la matrice de projection dont les colonnes engendrent le sous-espace latent. Cette matrice est estimée via un problème d’optimisation, lequel est résolu, dans l’algorithme original, par une procédure de type Gram-Schmidt. Malheureusement, cette procédure souffre dans certains cas d’instabilités numériques qui peuvent engendrer une détérioration de la qualité de la visualisation ou de la classification automatique des données. Pour pallier cette limitation, nous proposons deux alternatives d’estimation du sous-espace latent. Le problème d’optimisation de l’étape F est réécrit tout d’abord comme un problème de régression puis reformulé de telle manière que la solution peut être approchée par une SVD. Des expériences sur des données simulées et réelles montrent l’intérêt des alternatives proposées pour la visualisation et la classification automatique des données.
@article{JSFS_2011__152_3_98_0, author = {Bouveyron, Charles and Brunet, Camille}, title = {On the estimation of the latent discriminative subspace in the {Fisher-EM} algorithm}, journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique}, pages = {98--115}, publisher = {Soci\'et\'e fran\c{c}aise de statistique}, volume = {152}, number = {3}, year = {2011}, mrnumber = {2871179}, zbl = {1316.62082}, language = {en}, url = {http://geodesic.mathdoc.fr/item/JSFS_2011__152_3_98_0/} }
TY - JOUR AU - Bouveyron, Charles AU - Brunet, Camille TI - On the estimation of the latent discriminative subspace in the Fisher-EM algorithm JO - Journal de la société française de statistique PY - 2011 SP - 98 EP - 115 VL - 152 IS - 3 PB - Société française de statistique UR - http://geodesic.mathdoc.fr/item/JSFS_2011__152_3_98_0/ LA - en ID - JSFS_2011__152_3_98_0 ER -
%0 Journal Article %A Bouveyron, Charles %A Brunet, Camille %T On the estimation of the latent discriminative subspace in the Fisher-EM algorithm %J Journal de la société française de statistique %D 2011 %P 98-115 %V 152 %N 3 %I Société française de statistique %U http://geodesic.mathdoc.fr/item/JSFS_2011__152_3_98_0/ %G en %F JSFS_2011__152_3_98_0
Bouveyron, Charles; Brunet, Camille. On the estimation of the latent discriminative subspace in the Fisher-EM algorithm. Journal de la société française de statistique, Tome 152 (2011) no. 3, pp. 98-115. http://geodesic.mathdoc.fr/item/JSFS_2011__152_3_98_0/