Minimal penalties and the slope heuristics: a survey
[Pénalités minimales et heuristique de pente]
Journal de la société française de statistique, Minimal penalties and the slope heuristics: a survey, Tome 160 (2019) no. 3, pp. 1-106

Voir la notice de l'article provenant de la source Numdam

Birgé and Massart proposed in 2001 the slope heuristics as a way to choose optimally from data an unknown multiplicative constant in front of a penalty. It is built upon the notion of minimal penalty, and it has been generalized since to some “minimal-penalty algorithms”. This article reviews the theoretical results obtained for such algorithms, with a self-contained proof in the simplest framework, precise proof ideas for further generalizations, and a few new results. Explicit connections are made with residual-variance estimators —with an original contribution on this topic, showing that for this task the slope heuristics performs almost as well as a residual-based estimator with the best model choice— and some classical algorithms such as L-curve or elbow heuristics, Mallows’ C p , and Akaike’s FPE. Practical issues are also addressed, including two new practical definitions of minimal-penalty algorithms that are compared on synthetic data to previously-proposed definitions. Finally, several conjectures and open problems are suggested as future research directions.

Birgé et Massart ont proposé en 2001 l’heuristique de pente, pour déterminer à l’aide des données une constante multiplicative optimale devant une pénalité en sélection de modèles. Cette heuristique s’appuie sur la notion de pénalité minimale, et elle a depuis été généralisée en “algorithmes à base de pénalités minimales”. Cet article passe en revue les résultats théoriques obtenus sur ces algorithmes, avec une preuve complète dans le cadre le plus simple, des idées de preuves précises pour généraliser ce résultat au-delà des cadres déjà étudiés, et quelques résultats nouveaux. Des liens sont faits avec les méthodes d’estimation de la variance résiduelle (avec une contribution originale sur ce thème, qui démontre que l’heuristique de pente produit un estimateur de la variance quasiment aussi bon qu’un estimateur fondé sur les résidus d’un modèle oracle) ainsi qu’avec plusieurs algorithmes classiques tels que les heuristiques de coude (ou de courbe en L), C p de Mallows et FPE d’Akaike. Les questions de mise en œuvre pratique sont également étudiées, avec notamment la proposition de deux nouvelles définitions pratiques pour des algorithmes à base de pénalités minimales et leur comparaison aux définitions précédentes sur des données simulées. Enfin, des conjectures et problèmes ouverts sont proposés comme pistes de recherche pour l’avenir.

Keywords: model selection, estimator selection, penalization, slope heuristics, minimal penalty, residual-variance estimation, L-curve heuristics, elbow heuristics, scree test, overpenalization
Mots-clés : sélection de modèles, sélection d’estimateurs, pénalisation, heuristique de pente, pénalité minimale, estimation de la variance résiduelle, heuristique de courbe en L, heuristique de coude, test scree, surpénalisation
@article{JSFS_2019__160_3_1_0,
     author = {Arlot, Sylvain},
     title = {Minimal penalties and the slope heuristics: a survey},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {1--106},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {160},
     number = {3},
     year = {2019},
     mrnumber = {4021408},
     zbl = {1437.62121},
     language = {en},
     url = {http://geodesic.mathdoc.fr/item/JSFS_2019__160_3_1_0/}
}
TY  - JOUR
AU  - Arlot, Sylvain
TI  - Minimal penalties and the slope heuristics: a survey
JO  - Journal de la société française de statistique
PY  - 2019
SP  - 1
EP  - 106
VL  - 160
IS  - 3
PB  - Société française de statistique
UR  - http://geodesic.mathdoc.fr/item/JSFS_2019__160_3_1_0/
LA  - en
ID  - JSFS_2019__160_3_1_0
ER  - 
%0 Journal Article
%A Arlot, Sylvain
%T Minimal penalties and the slope heuristics: a survey
%J Journal de la société française de statistique
%D 2019
%P 1-106
%V 160
%N 3
%I Société française de statistique
%U http://geodesic.mathdoc.fr/item/JSFS_2019__160_3_1_0/
%G en
%F JSFS_2019__160_3_1_0
Arlot, Sylvain. Minimal penalties and the slope heuristics: a survey. Journal de la société française de statistique, Minimal penalties and the slope heuristics: a survey, Tome 160 (2019) no. 3, pp. 1-106. http://geodesic.mathdoc.fr/item/JSFS_2019__160_3_1_0/