Méthodes d'analyse des données écologiques et biogéographiques11/05/03 - © M. Dufrêne |
Lorsqu'on étudie les facteurs écologiques qui expliquent la répartition d'un groupe d'espèces, on est amené à réaliser ce qu'on appelle une analyse gradient. La structure des écosystèmes est complexe : ils sont composés de nombreuses composantes abiotiques et biotiques en interaction. Les méthodes d'ordination jouent dès lors un rôle indispensable. Généralement, on récolte des données de distribution d'espèces et des informations sur les variables écologiques potentielles. Il est évident que les espèces ne réagissent pas à une seule variable écologique et qu'à priori, il est nécessaire de tester différentes variables pour identifier celles qui sont les plus pertinentes ou mieux encore, la combinaison de ces variables qui est responsable d'un patron de distribution. Comme souvent les variables écologiques sont corrélées les unes aux autres, il est indispensable de résumer l'information qu'elles peuvent apporter en unités d'informations indépendantes. On utilise des méthodes d'ordination qui extraient d'un jeu de données quelques axes principaux (gradients de diversité) indépendants de manière à en synthétiser l'information.
On distingue généralement les analyses gradients directes, où le plan d'échantillonnage vise à démontrer le rôle d'une variable écologique particulière, des analyses gradients indirectes où on cherche à expliquer au mieux les gradients de biodiversité avec des variables écologiques disponibles. La seconde approche est généralement celle qui est la plus souvent utilisée. Elle permet de découvrir les variables écologiques essentielles dont le rôle peut être précisé par une approche gradient directe, par la suite.
Lorsqu'on dispose d'ordinations ou de groupes de stations ou de mailles géographiques (OGUs) résultant d'un groupement ou d'une classification a priori, l'interprétation de leur signification avec des variables écologiques indépendantes de celles qui ont servi à les établir est une opération courante.
Pour les ordinations, une approche simple est la mesure de la corrélation entre des variables écologiques décrivant les stations ou les OGUs et leurs coordonnées sur des axes d'ordination. On peut aussi utiliser des régressions multiples pour identifier les combinaisons linaires des variables écologiques qui expliquent le mieux les oppositions de stations, et donc la distribution des espèces sur chaque axe principal.
Corrélation entre l'altitude et les coordonnées des OGUs sur le premier axe d'un AFC réalisée sur les données de distribution des Carabides en Belgique
Pour les groupes de stations, des tests de comparaison de moyennes comme le test de Student ou des ANOVAs permettent d'identifier des variables écologiques qui pourraient expliquer les structures observées.
Etude de cas : Les facteurs écologiques corrélés à la distribution des Oiseaux en Australie
En 1992, Whitehead, Bowman & Tidemann publient une synthèse sur la distribution des Oiseaux dans une des provinces australiennes. Ils souhaitent comprendre la structure de la répartition des Oiseaux et identifier ses déterminants dans le contexte de la désignation de zones protégées d'un grand intérêt biologique. Leur objectif est proposer sur cette base un réseau de sites représentatifs de la diversité du territoire.La matrice avec les données de présence/absence d'Oiseaux (415 espèces) dans une grille d'un degré de latitude et de longitude (123 OGUs) est soumise à une méthode de groupement divisif qui produit une structure hiérarchique. Le territoire étudié se subdivise en deux zones majeures, à la hauteur des 17ème et 18ème parallèles.
![]()
Pour comprendre les déterminants écologiques de cette zonation, les auteurs utilisent des données topographiques, climatiques, floristique (composition de la végétation) et de structure de la végétation (unité de végétation). Ils utilisent pour cela deux approches. La première consiste à comparer les moyennes des différentes variables écologiques pour les différents groupes d'OGUs (ANOVA), la seconde se base sur des analyses de corrélation et de régression entre les variables écologiques et les axes principaux d'une ordination réalisée sur la matrice de distribution des Oiseaux. Ces analyses révèlent une forte zonation latitudinale (corrélation du premier axe principal avec la latitude = -0.94, P < 0.0001), mais aussi l'altitude (r = -0.75, P < 0.0001), et la pluviosité du trimestre le plus chaud (r = 0.95, P < 0.0001). L'association entre la partition obtenue avec l'avifaune et celles basée sur la floristique ou la structure de la végétation est aussi très bonne. Les auteurs ont aussi utilisé une procédure de régressions linéaires multiples pour trouver la combinaison de variables écologiques qui explique le mieux la succession des OGUs sur les premiers axes principaux d'une ordination réalisée sur la matrice de distribution des Oiseaux
La structure régionale obtenue est jugée intéressante puisque qu'elle est cohérente avec d'autres approches indépendantes. Elle confirme le rôle d'une frontière biogéographique significative entre les 17ème et 18ème parallèles, qui s'explique par une transition entre une zone à influence tropicale au nord (forte pluviosité saisonnière) et une zone plus aride avec des pluies sans distribution saisonnière et moins importantes.
Ces résultats confortent les auteurs dans leur proposition d'augmenter de manière significative le réseau de réserves naturelles dans les régions méridionales du territoire étudié car elles sont actuellement pratiquement limitées à la partie tropicale. Le gradient qu'ils ont mis en évidence et les zones de ruptures peuvent être utilisés comme critère de sélection des différentes zones.
Whitehead, P.J., Bowman, M.J.S. & Tideman, S.C., 1992. Biogeographic patterns, environmental correlates and conservation of avifauna in the Northern Territory, Australia. Journal of Biogeography, 19 : 151-161.
L'analyse la plus intéressante pour identifier directement les facteurs écologiques qui régissent la structure d'assemblages d'espèces est l'analyse canonique des correspondances (ACC ou CCA en anglais).
Cette analyse est la meilleure méthode disponible pour révéler les interactions entre facteurs écologiques et gradient de biodiversité. Cette analyse procède comme l'analyse factorielle des correspondances et elle tend donc à maximiser les distances entre les optimums écologiques des espèces. Elle s'arrange toutefois pour que l'ordination des sites qui est obtenue soit la meilleure combinaison linéaire possible avec des variables écologiques.
Si on reprend l'exemple utilisé pour montrer le rôle de l'analyse factorielle des correspondances, on montre que si on utilise une combinaison linéaire arbitraire de l'humidité et des concentrations en phosphates (3 x humidité + 2 x [phosphate]) pour ordonner les sites, on explique déjà beaucoup mieux la distribution des espèces qu'avec le seul facteur humidité.
![]()
Les optimums des différentes espèces sont plus distants les uns des autres mais un important chevauchement des amplitudes d'habitat est encore observé.
La réalisation d'une analyse canonique des correspondances produit l'arrangement des stations qui expliquent le mieux la distribution des espèces tout en étant la meilleure combinaison linéaire avec les variables écologiques disponibles.
![]()
La comparaison avec le graphique obtenu par l'analyse factorielle des correspondances indique que cette analyse ajoute une contrainte : les espèces, et en particulier les espèces D et E, sont moins bien séparées les unes des autres que sur le graphique obtenu avec l'AFC.
Cette analyse permet une identification directe des facteurs écologiques qui sont responsables des structures biologiques. Elle permet en outre d'éliminer des effets de structures indésirables comme des biais du plan d'échantillonnage ou l'autocorrélation spatiale.
(à développer)
Etude de cas : Les facteurs de répartition des Carabides en Belgique
Dufrêne et Legendre (en prep) ont réalisé une étude visant à identifier les facteurs écologiques expliquant la distribution des Coléoptères Carabides en Belgique. La matrice de données utilisée détaille la présence de 376 espèces dans 368 carrés UTM de 10 km de côté, soit un jeu de 24.711 données. Elle a d'abord été soumise aux méthodes de groupement habituelles pour en comprendre la structure. Ensuite, la matrice de données a été confrontée au jeu de données écologiques disponible, soit celui des facteurs topographique, climatiques et géologiques qui a fait l'objet de l'analyse écogéographique.Ce jeu de données de facteurs écologiques a été résumé, grâce à une méthode d'ordination, en 9 variables continues pertinentes, subdivisées en trois groupes : l'altitude, le climat (4 variables) et la géologie (4 variables). Le tableau suivant résume les corrélations entre ces variables et les deux premiers axes d'une ordination du jeu de données de la distribution des Carabides :
Variables
AFC1
AFC2
Altitude
0.865 0.169 CLI 1 (opposition Côte-Ardenne)
0.755 0.196 CLI 2 (opposition Côte-Flandre sablolimoneuse et Campine)
0.257 0.371 CLI 3 (isolement de la Haute-Ardenne)
0.238 0.034 CLI 4 (isolement des zones plus arides)
0.085 0.203 GEO 1 (opposition Côte-Ardenne)
0.882 0.063 GEO 2 (isolement Lorraine belge)
0.029 0.163 GEO 3 (opposition entre OGUs ardennais)
0.019 0.026 GEO 4 (opposition Campine - Flandre maritime)
0.006 0.541 Ce tableau démontre que le principal facteur de répartition des Carabides en Belgique est le gradient topographique complexe* établit par l'altitude, le climat (CLI 1) et la géologie (GEO 1), qui oppose de manière très nette les régions côtière et ardennaise. [* pour une meilleure visualisation de la relation, on présente le graphique de la relation entre l'altitude et les coordonnées des OGUs sur le premier axe de l'AFC réalisée sur les données de distribution des Carabides]. Le second facteur écologique est celui lié à la singularité de la Campine qui s'explique d'abord par des conditions géologiques particulières (dominance de zones sablonneuses pauvres dominées par des landes) plutôt que par des facteurs climatiques régionaux singuliers.
Afin de préciser cette relation entre facteurs écologiques et distribution des Carabides, une analyse canonique des correspondances (ACC) a été réalisée afin de mettre en évidence des axes d'ordination qui maximisent directement les relations éventuelles entre facteurs écologiques et diversité biologique.
Variables
ACC1
ACC2
Altitude
0.897 0.208 CLI 1 (opposition Côte-Ardenne)
0.796 0.297 CLI 2 (opposition Côte-Flandre sablolimoneuse et Campine)
0.220 0.525 CLI 3 (isolement de la Haute-Ardenne)
0.256 0.053 CLI 4 (isolement des zones plus arides)
0.076 0.130 GEO 1 (opposition Côte-Ardenne)
0.912 0.083 GEO 2 (isolement Lorraine belge)
0.034 0.191 GEO 3 (opposition entre OGUs ardennais)
0.019 0.065 GEO 4 (opposition Campine - Flandre maritime)
0.008 0.538 La comparaison avec le tableau précédent indique une amélioration des meilleures corrélations des variables écologiques avec les axes. L'ACC conduit donc réellement à mieux déterminer le rôle des facteurs écologiques dans la distribution d'un groupe d'espèces. Dans ce cas toutefois, elle ne provoque pas de changements majeurs des axes de l'AFC originale. Autrement dit, les axes principaux qui expliquent le mieux la distribution des Carabides sont aussi ceux qui sont le mieux expliqués par les facteurs écologiques disponibles.