FOREts, Changements globaux, et Adaptation: Simulations et expérimenTations

Fabien GOGE

altIngénieur d'études (IE) CDD

CEFE/CNRS)
Campus du CNRS
1919, route de Mende
34293 Montpellier 5

tél : +33 (0)4 67 61 32 74
Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.

Domaine de recherche: Applications de traitements statistiques sur des données NIRS (Near Infrared Spectroscopy)

Responsable : Richard Joffre

L’analyse dans le proche infrarouge est une technique qui permet de connaître la composition chimique des aliments et matières premières beaucoup plus rapidement que les dosages biochimiques classiques. La fiabilité, le faible coût économique et la non destruction de l’échantillon ont permis à cette méthode de se répandre dans de nouveaux secteurs de recherche et industriels (chimie, agroalimentaire, écologie…). Les domaines de longueur d'onde de rayonnement attribués au proche IR sont 830- 2500 nm, mais certains instruments sont aussi capables de mesurer dans le visible 400 -800 nm. La gamme de l'infrarouge correspond aux harmoniques et aux bandes de combinaisons (somme de fondamentales) ce qui engendre des signaux moins intenses et des bandes plus larges. Il n'est plus possible dans ce contexte de faire de l'expertise comme dans le moyen Infrarouge, c’est à dire de relier directement un pic à une molécule. Par contre à l'aide d'outils statistiques élaborés, on peut faire :

* du qualitatif (déterminer si un produit est conforme ou non...),
* de l'identification (déterminer l'origine du produit, la texture...),
* de la quantification (quantifier des teneurs de constituant, doser...),
* de la détermination de changement (suivre et contrôler l'évolution d'un process...).

Mon principal travail consistait à traiter une base de données sur les sols de la France (RMQS). Le Réseau de Mesure de la Qualité des sols comprend 2200 sites localisés sur une grille régulière de 16×16 km recouvrant les 550 000 km² de la France Métropolitaine. Cette base de données comporte 4 types de données :

· physico-chimiques

· pédologiques (utilisation des terres, type de sol,…)

· microbiologiques (profils RISA)

· spectroscopiques (spectres VisNIR)

Mon travail consistait à explorer les relations entre ces divers ensembles de données. Dans un premier temps, des modèles de prédiction des propriétés physico-chimiques ont été construits à partir des spectres VisNIR en utilisant une approche classique, la PLS régression. Mais, le sol est un produit complexe à analyser par spectrométrie proche infrarouge (SPIR) dû aux interactions des phénomènes chimiques et physiques ainsi que la matrice minérale. Et ces approches PLS n’ont pas permis d’atteindre un seuil considéré comme réellement acceptable en routine dans un réseau de surveillance. D’autres approches statistiques ont donc été testées pour obtenir la meilleure qualité de modèles de prédiction: des approches non linéaires (LS-SVM), des méthodes locales (LWR, LOCAL, CARNAC) et des méthodes non paramétriques (Kernel, BRT). Les méthodes locales améliorent les prédictions et ont une complexité moindre par rapport aux autres types de modèles.

Un deuxième objectif était de décrire et comprendre la variation des données Vis NIR au niveau de la France. En premier lieu, les spectres ont été compressés par ACP et les coordonnées sur les premières composantes ont été krigées. Des cartes de la variation spectrale ont ainsi été obtenues. Ensuite, des arbres de régression ont été construits à partir de toutes les données disponibles (physico-chimiques, matériau parental, classification pédologique) pour prédire les coordonnées de l’ACP et ainsi savoir quelles informations contiennent les spectres VisNIR.

Enfin, un dernier objectif était de mettre en évidence un lien entre les spectres Vis NIR et les données RISA. Un modèle PLS 2 a été appliqué pour prédire les spectres Vis NIR à partir des données RISA et un lien entre ces 2 empreintes du sol a été, pour la première fois, mis en avant.

Logiciels : Matlab, R, Winisii, Access, Idrisi, Statistica

Méthodes Statistiques : Partial Least Square Regression, méthodes locales (LWR, LOCAL, CARNAC), Boosted Regression Tree, LS-SVM, Méthode non paramétrique (Kernel)

Publications :

Robin Pouteau, Serge Rambal, Jean-Pierre Ratte, Fabien Gogé, Richard Joffre, Thierry Winkel. Downscaling MODIS-derived maps using GIS and boosted regression trees: The case of frost occurrence over the arid Andean highlands of Bolivia, Remote Sensing of environment, 115 (2011), 117-129

Gogé Fabien, Joffre Richard, Jolivet Claudy, Ross Ian, Ranjard Lionel. Optimization criteria in sample selection step of local regression for quantitative analysis of large soil NIRS database, Chemometrics and Intelligent Laboratory Systems, 110 (2012), 168-176