Joint selection of wavenumber regions for MidIR and RAMAN spectra and variables in PLS regression using Genetic Algorithms
[Sélection conjointe de régions de spectres MidIR et RAMAN et de variables en régression PLS à l’aide d’Algorithmes Génétiques]
Journal de la société française de statistique, Méthodes statistiques en agronomie, Tome 154 (2013) no. 3, pp. 80-94

Voir la notice de l'article provenant de la source Numdam

Many methods exist for feature selection in PLS regression when there are too many variables. Less methods are available for selecting wavenumber regions for MidIR or RAMAN spectra. In this work, PLS has been coupled with genetic algorithms to allow for the selection of intervals in spectra. This work was motivated by a regression issue about transformation of cassava. Those data consist of three tables: RAMAN spectra, MidIR spectra and physico-chemical variables. The purpose is to adapt to this regression context a strategy previously designed to select intervals in NIR spectra in classification. A new algorithm is proposed to fit such multiblock data in PLS1 regression context. Illustrations on simulated data are performed before application to the real dataset.

De nombreuses méthodes adaptées pour la régression PLS, s’intéressent aux choix de variables explicatives, quand celles-ci sont en nombre trop important. Quand il s’agit de sélectionner des intervalles pour des spectres, la panoplie des techniques est plus réduite. Dans ce travail, PLS a été associée aux algorithmes génétiques pour permettre la sélection d’intervalles dans des spectres. L’origine de ce travail est une problématique de régression pour des données sur la transformation de manioc. Ces données sont constituées de trois tableaux : des spectres RAMAN, MidIR et des variables physico-chimiques. Il s’agit d’adapter au contexte de régression une stratégie précédemment mise au point pour la sélection d’intervalles uniquement pour des spectres NIR en discrimination. Nous avons développé un algorithme génétique spécialement adapté à ce type de données (multitableau), pour le cas de la régression PLS1. Des illustrations sur des données simulées sont proposées avant l’application au jeu de données réel.

Keywords: PLS Regression, Genetic Algorithm, MidIR and RAMAN spectra, Variable Selection, Selection of wavenumber regions
Mots-clés : Méthode PLS, Algorithme Génétique, Spectres MidIR et RAMAN, Choix de variables, Sélection d’intervalles
@article{JSFS_2013__154_3_80_0,
     author = {Grosmaire, Lidwine and Reyn\`es, Christelle and Sabatier, Robert},
     title = {Joint selection of wavenumber regions for {MidIR} and {RAMAN} spectra and variables in {PLS} regression using {Genetic} {Algorithms}},
     journal = {Journal de la soci\'et\'e fran\c{c}aise de statistique},
     pages = {80--94},
     publisher = {Soci\'et\'e fran\c{c}aise de statistique},
     volume = {154},
     number = {3},
     year = {2013},
     mrnumber = {3147067},
     zbl = {1316.62088},
     language = {en},
     url = {http://geodesic.mathdoc.fr/item/JSFS_2013__154_3_80_0/}
}
TY  - JOUR
AU  - Grosmaire, Lidwine
AU  - Reynès, Christelle
AU  - Sabatier, Robert
TI  - Joint selection of wavenumber regions for MidIR and RAMAN spectra and variables in PLS regression using Genetic Algorithms
JO  - Journal de la société française de statistique
PY  - 2013
SP  - 80
EP  - 94
VL  - 154
IS  - 3
PB  - Société française de statistique
UR  - http://geodesic.mathdoc.fr/item/JSFS_2013__154_3_80_0/
LA  - en
ID  - JSFS_2013__154_3_80_0
ER  - 
%0 Journal Article
%A Grosmaire, Lidwine
%A Reynès, Christelle
%A Sabatier, Robert
%T Joint selection of wavenumber regions for MidIR and RAMAN spectra and variables in PLS regression using Genetic Algorithms
%J Journal de la société française de statistique
%D 2013
%P 80-94
%V 154
%N 3
%I Société française de statistique
%U http://geodesic.mathdoc.fr/item/JSFS_2013__154_3_80_0/
%G en
%F JSFS_2013__154_3_80_0
Grosmaire, Lidwine; Reynès, Christelle; Sabatier, Robert. Joint selection of wavenumber regions for MidIR and RAMAN spectra and variables in PLS regression using Genetic Algorithms. Journal de la société française de statistique, Méthodes statistiques en agronomie, Tome 154 (2013) no. 3, pp. 80-94. http://geodesic.mathdoc.fr/item/JSFS_2013__154_3_80_0/