Voir la notice de l'article provenant de la source Numdam
We consider univariate Gaussian mixtures theory and applications, and particularly the problem of testing the null hypothesis of homogeneity (one component) against two components. Several approaches have been proposed in the literature during the last decades. We focus on two different techniques, one based on the Likelihood-Ratio Test (LRT), and another one based on estimation of the parameters of the mixture grounded on some specific adaptation of the well-known EM algorithm often called the EM-test. We propose in particular a novel methodology allowing application of the LRT in actual situations, by plugging-in estimates that are assumed known in asymptotic setup. We aim to provide useful comparisons between different techniques, together with guidelines for practitioners in order to enable them to use theoretical advances for analyzing actual data of realistic sample sizes. We finally illustrate these methods in an application to real data corresponding to the number of days between two events concerning ovarian response and lambing for ewes.
Après une présentation générale de la problématique des mélanges, dans le but de déterminer leur nombre de composantes, nous envisageons plus précisément les mélanges gaussiens univariés. Une abondante littérature a été consacrée à ce domaine. Mais les procédures de mise en œuvre des résultats théoriques et les études comparatives des diverses procédures font cruellement défaut. Nous souhaitons apporter une contribution en ce sens, afin de faciliter les applications. Pour tester une hypothèse d’homogénéité contre une hypothèse de mélange à deux composantes, nous avons retenu deux grandes familles de tests : les tests du rapport des vraisemblances (LRT) et les tests EM. Nous proposons notamment pour le LRT une approche par plug-in de certains paramètres supposés connus dans la théorie asymptotique, ce qui rend ces tests utilisables en pratique. Pour les quatre cas de mélanges envisagés ici, nous fournissons les valeurs critiques et comparons les performances de ces tests en termes de puissance. Nous illustrons leur mise en œuvre sur des données réelles qui se rapportent au temps qui sépare les périodes d’ovulation et d’agnelage chez des brebis dans le cadre d’un projet en Région Centre.
@article{JSFS_2019__160_1_86_0, author = {Chauveau, Didier and Garel, Bernard and Mercier, Sabine}, title = {Testing for univariate two-component {Gaussian} mixture in practice}, journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique}, pages = {86--113}, publisher = {Soci\'et\'e fran\c{c}aise de statistique}, volume = {160}, number = {1}, year = {2019}, mrnumber = {3928541}, zbl = {1417.62033}, language = {en}, url = {http://geodesic.mathdoc.fr/item/JSFS_2019__160_1_86_0/} }
TY - JOUR AU - Chauveau, Didier AU - Garel, Bernard AU - Mercier, Sabine TI - Testing for univariate two-component Gaussian mixture in practice JO - Journal de la société française de statistique PY - 2019 SP - 86 EP - 113 VL - 160 IS - 1 PB - Société française de statistique UR - http://geodesic.mathdoc.fr/item/JSFS_2019__160_1_86_0/ LA - en ID - JSFS_2019__160_1_86_0 ER -
%0 Journal Article %A Chauveau, Didier %A Garel, Bernard %A Mercier, Sabine %T Testing for univariate two-component Gaussian mixture in practice %J Journal de la société française de statistique %D 2019 %P 86-113 %V 160 %N 1 %I Société française de statistique %U http://geodesic.mathdoc.fr/item/JSFS_2019__160_1_86_0/ %G en %F JSFS_2019__160_1_86_0
Chauveau, Didier; Garel, Bernard; Mercier, Sabine. Testing for univariate two-component Gaussian mixture in practice. Journal de la société française de statistique, Numéro spécial : analyse de mélanges, Tome 160 (2019) no. 1, pp. 86-113. http://geodesic.mathdoc.fr/item/JSFS_2019__160_1_86_0/