Méthodes d'analyse des données écologiques et biogéographiques11/05/03 - © M. Dufrêne |
Les méthodes d'ordination et de groupement décrivent la structure du jeu de relevés botaniques. Le groupement permet de définir des groupes de relevés qui partagent le même cortège spécifique et l'ordination en a défini les grands axes de variation. Il est nécessaire de compléter l'analyse en identifiant les espèces caractéristiques de ces structures. Aucune des méthodes détaillées ci-dessous n'a réellement défini cette relation entre espèces et relevés botaniques. L'analyse factorielle des correspondances n'a fait qu'exquiser cette relation sans la mesurer statistiquement et définir des espèces indicatrices.
Deux approches de ce problème sont présentées ci-dessous. Elles visent toutes deux à identifier au mieux les espèces indicatrices de groupes de relevés botaniques.
Cette méthode est basée sur le principe de l'analyse factorielle des correspondances dont elle dérive directement. Développée au début des années 80, elle a été très rapidement largement popularisée et est encore très souvent utilisée. Elle a le mérite d'organiser de manière simple la matrice de données de départ et d'en identifier la structure majeure. TWINSPAN est toutefois une méthode très compliquée à comprendre dans les détails car de multiples réorganisations de la structure du jeu de données ont lieu au fur et à mesure de l'analyse. On n'en détaillera ici que le principe, pour plus de détails, référez -vous à Kent et Coker (1992), pages 290-303.
Le principe de base est de réaliser une classification hiérarchique des relevés sur la base du premier axe d'une analyse factorielle des correspondances. Le premier axe sert de base pour séparer les relevés en deux groupes. Le programme évalue ensuite le caractère indicateur des espèces en se basant sur le concept de "pseudo-espèce". Comme l'affinité d'une espèce avec un groupe se mesure en terme de présence/absence; TWINSPAN utilise des pseudo-espèces pour évaluer ces présence/absences pour différents niveaux d'abondance relative. Une procédure relativement complexe est mise en oeuvre pour identifier au mieux les niveaux d'abondance qui sont préférentiel d'un des deux groupes de relevés.
La procédure recommence ensuite pour chacun des deux groupes initiaux. Chacun des deux groupes de relevés est lui aussi soumis à une AFC et scindé en deux sous-groupes. A chaque division, le programme identifie les espèces indicatrices.
TWINSPAN souffre de nombreux problèmes mais comme aucune autre alternative n'était disponible jusqu'à récemment, la méthode est toujours largement utilisée.
Depuis cette année, une autre méthode est en cours d'évaluation. Elle repose sur la même approche : on utilise une classification des relevés pour identifier les espèces qui en sont indicatrices. Pour plus de détails : Dufrêne & Legendre, 1997. Species assemblages and indicator species : the need for a flexible asymmetrical approach. Ecological Monographs, 67 : 345-366.
Le principe de la méthode IndVal est simple. Il repose sur la définition du caractère indicateur d'une espèce : une espèce est considérée comme indicatrice si elle est typique d'un groupe de relevés (elle est absente des autres groupes) et si elle est présente dans tous les relevés de ce groupe. Pour prendre en compte cette dualité, un nouvel indice est développé.
Pour chaque espèce i dans chaque groupe de relevés j, on calcule le produit de Aij, soit la moyenne des abondances de l'espèce i dans les sites dans le groupe de relevés j par rapport à tous les groupes, par Bij, soit la fréquence relative d'occurrence de l'espèce i dans les sites du groupe j, comme ceci :
où IndVal est la valeur indicatrice de l'espèce i dans le groupe de relevé j. Aij mesure la spécificité de l'espèce pour un groupe alors que Bij mesure la fidélité de cette espèce à l'intérieur de ce groupe. La valeur indicatrice de l'espèce pour un niveau de la classification des relevés en différents groupes est la plus large valeur d' IndVal observée pour un des groupes.
La spécificité est maximale (100%) quand l'espèce n'occupe qu'un groupe et la fidélité est maximale (100%) lorsque l'espèce est présente dans tous les relevés d'un groupe. La valeur indicatrice de l'espèce est maximale (100%) lorsque la spécificité et la fidélité sont maximales.
Comme cet indice peut se calculer pour les différents niveaux d'une procédure de groupement, on peut identifier le niveau dont l'espèce est la plus indicatrice. En effet, au fur et à mesure que les groupes se divisent, la valeur IndVal d'une espèce indicatrice et spécialiste va d'abord croître jusqu'à atteindre une valeur maximale lorsqu'elle tendra à dominer dans un groupe de relevés et à y les occuper tous. Si ce groupe de relevés se subdivise à son tour, sa valeur indicatrice va commencer à diminuer. Il est donc possible d'identifier rapidement les espèces qui sont sensibles aux grandes structures d'un jeu de données et celles qui seront beaucoup plus spécialistes, typique de petits groupes de relevés. Cette subdivision correspond à un concept répandu en écologie d'espèces généralistes (core species) et d'espèces spécialisées (satellite species).
Cela peut s'illustrer avec l'exemple présenté dans la référence citée plus haut en attendant un exemple botanique. Une série de relevés d'espèces de Carabides (Insectes Coléoptères) sont soumis à une méthode de groupement qui produit la structure présentée sur le dendrogramme précédent.
Les relevés se subdivisent en deux lots en fonction de l'humidité (habitats secs pour les groupes 1 à 6 au niveau 10 et habitats humides pour les groupes 7 à 10). Ensuite, de part et d'autre, les groupes se subdivisent en fonction de la richesse en matière minérale.
L'évolution de l'indice IndVal (blocs blancs dans les quatre graphiques ci-dessous, ordonnée à gauche) au fur et à mesure que les groupes se subdivisent montre souvent de fortes différences entre les espèces.
Il y a d'abord les espèces qui sont présentes presque partout et ont une valeur indicatrice maximale quand tous les relevés humides sont rassemblés en seul groupe, comme Pterostichus diligens.
Dès que ces relevés sont subdivisés en 2 groupes (niveau 4 sur l'abcisse de l'histogramme) la valeur indicatrice commence à diminuer fortement. Il s'agit donc bien d'une espèce généraliste, typique des milieux humides.
Une autre espèce présente aussi dans les milieux humides est Pterostichus nigrita mais sa valeur indicatrice est plus élevée dès que les milieux humides riches comme les étangs et les prairies alluviales se séparent des milieux humides pauvres (niveau 4).
C'est donc une espèce moins généraliste que Pterostichus diligens.
Les espèces plus spécialistes, comme Harpalus rufipes qui est ici typique des pelouses calcaires mésophiles révélées par le groupement au niveau 8, montrent un pattern de distribution de l'histogramme des valeurs indicatrices qui est caractéristiques.
Les plus fortes valeurs sont observées pour les nievaux de groupements élevés, lorsque les groupes sont très bien caractérisés écologiquement.
Enfin, il existe aussi des espèces typiques des niveaux intermédiaires du groupement, qui montrent une augmentation de leur valeur indicatrice qui est suivie ensuite d'une diminution.
Harpalus rubripes, typique de l'ensemble des pelouses calcaires, montre d'abord une forte augmentation de l'indice quand celles-ci se séparent des landes au niveau 3, puis une forte diminution de l'indice, quand les pelouses calcaires se subdivisent en deux groupes au niveau 8.
La valeur indicatrice des espèces pour les différents niveaux est de plus contrôlée par une procédure de permutation aléatoire. Cette procédure réparti aléatoirement les données de présence de l'espèce de nombreuses fois dans les différents groupes et compare pour chaque niveau du groupement, la moyenne de la valeur IndVal obtenue ainsi (blocs gris dans les quatre graphiques ci-dessus) à la valeur IndVal obtenue pour le groupement de départ. Si cette dernière valeur est significativement plus grande (ordonnée de droite, valeur du test de t de Student) que la moyenne des valeurs obtenues au hasard, l'espèce peut être considérée comme réellement indicatrice du niveau du groupement. Ce test est surtout utile pour les espèces qui n'ont pas une fidélité importante.
Comme on dispose d'un indice qui mesure à chaque niveau du groupement la manière dont les espèces sont sensibles ou expliquées par ce groupement, il est possible d'utiliser la somme des valeurs indicatrices de toutes les espèces à chaque niveau pour évaluer quand il faut s'arrêter de subdiviser en groupes. On choisira comme seuil le moment ou la grande majorité des espèces montrent une diminution progressive de leur valeur indicatrice, puisqu'il n'y alors plus grand chose comme information pertinente à ce niveau.
Enfin, la méthode propose aussi une nouvelle présentation du tableau croisant les espèces et les stations qui tient compte des relations hiérarchiques : des espèces sont indicatrices de niveaux élevés du groupement et d'autres de niveaux inférieurs.
Voir http://old.biodiversite.wallonie.be/outils/indval/ pour plus détails.