Méthodes d'analyse des données écologiques et biogéographiques11/05/03 - © M. Dufrêne |
Un tableau croisant les relevés d'espèces dans des sites ou des éléments d'une grille géographique est un tableau multivarié. Chaque espèce ou station ajoutée à ce tableau représente une nouvelle source potentielle de variation. L'analyse de la structure de ce tableau impose une approche multivariée car les données sont multidimensionnelles : chaque station est décrite par la présence et l'absence de plusieurs espèces qui apporte chacune une information sur les relations de ce relevé avec les autres. Symétriquement, l'écologie de chaque espèce est décrite par la manière dont elle occupe, elle domine ou elle est absente des stations.Pour bien comprendre la nature multivariée ou multidimensionnelle de ces données, on prendra un exemple simple établi à partir d'un extrait de trois relevés de végétation réalisé chacun dans trois types de landes :
| |
|
|
|
| Calluna vulgaris - CALVUL |
|
|
|
| Deschampsia flexuosa - DESFLE |
|
|
|
| Vaccinium myrtillus - VACMYR |
|
|
|
| Vaccinium oxycoccos - VACOXY |
|
|
|
| Molinia coerulea - MOLCOE |
|
|
|
| Erica tetralix - ERITET |
|
|
|
Ce tableau est transformé selon l'échelle de van der Maarel sous la forme suivante :
| |
|
|
|
| Calluna vulgaris - CALVUL |
|
|
|
| Deschampsia flexuosa - DESFLE |
|
|
|
| Vaccinium myrtillus - VACMYR |
|
|
|
| Vaccinium oxycoccos - VACOXY |
|
|
|
| Molinia coerulea - MOLCOE |
|
|
|
| Erica tetralix - ERITET |
|
|
|
La représentation multidimensionnelle de ce tableau peut prendre deux formes graphiques : soit on considère que l'espace est défini par des axes "stations" où les espèces sont placées en fonction de leur coefficient d'abondance; soit on considère que l'espace est défini par des axes "espèces" où les stations sont placées en fonction des abondances des espèces qui y sont présentes.Dans le graphique ci-dessus, on a choisi de représenter les espèces dans l'espace "stations", espace qui est alors défini par des axes qui représente chacun une station. Les espèces sont disposées sur le graphique en fonction de leur coefficient de dominance, dans le cas présent l'échelle de van der Maarel.
Cette représentation graphique à l'avantage de montrer très rapidement les relations de proximité écologique entre les espèces. On a choisi ici de présenter les espèces sur un plan formé par les stations A et B. Les espèces qui sont proches sur le graphique (comme Deschampsia flexuosa et Calluna vulgaris) sont des espèces qui présentent une distribution d'abondance similaire dans ces deux stations. Si on trace des droites sur ce dessin entre les différents points "espèces", leur longueur mesure la distance ou la dissimilarité entre les espèces. Plus cette distance sera élevée, plus les espèces auront un patron de distribution différent.
![]()
On identifie aussi immédiatement les espèces qui ont les plus fortes dominances pour chaque station; ce sont celles qui sont situées le plus loin de l'origine des axes. Deschampsia flexuosa et Molinia coerulea sont les deux espèces qui ont les plus fortes abondances pour ces deux stations. Enfin, les espèces qui sont plus typiques ou caractéristiques d'une des stations sont les plus proches de l'axe qui représente cette station. Deschampsia flexuosa, Calluna vulgaris et Vaccinium myrtillus sont ainsi associées à la station A alors que Molinia coerulea et Erica tetralix sont associées à la station B.
Le fait d'ajouter une station à l'inventaire ajoute réellement une nouvelle dimension perpendiculaire aux deux autres, soit un axe qui sortirait de ce document. La position relative des espèces les unes par rapport aux autres doit alors être réévaluée. Avec une valeur de 7, Erica tetralix serait projetée en dehors du plan formé par les stations A et B et montrerait immédiatement sa plus grande affinité avec la station C. De même pour Calluna vulgaris qui est caractérisée par une valeur de 5 pour la station C. Les graphiques à deux dimensions des stations BC et AC permettent de le vérifier mais la meilleure représentation reste un graphique à trois dimensions.
![]()
La représentation en trois dimensions résume immédiatement la structure écologique du tableau montrant à la fois les relations de similarité écologique entre les espèces et la manière dont elles ont des affinités avec l'une ou l'autre des stations.
Lorsque des espèces partagent des contraintes écologiques similaires, elles sont très proches les unes des autres. Si des stations montrent des relevés très similaires, les espèces auront tendance à occuper la diagonale du plan formé par les deux stations. Plus il y a de stations qui partagent le même cortège d'espèces, plus elles forment un agrégat de points "espèces" qui pointe dans la même direction.
C'est l'ensemble de ces agrégats qui donne une structure au nuage de tous les points "espèces", structure qui peut être dégagée par des méthodes analyses multivariées. Il est en effet évident que dès qu'un tableau dépasse le nombre de trois relevés, il est difficile de se le représenter graphiquement. Mathématiquement, il n'y a pas de limites : la géométrie analytique et le calcul matriciel donnent en effet une série d'outils pour résumer et synthétiser l'information contenue dans de tels tableaux.
Avant d'aborder ces méthodes d'analyses multivariées, il est important de bien garder en mémoire la relation symétrique qui existe entre une représentation des espèces dans l'espace défini par des axes "stations" et une représentation des stations dans l'espace défini par des axes "espèces". Si on reprend le premier graphique positionnant les 6 espèces dans l'espace défini par les stations A et B, on construira par exemple un graphique à deux dimensions positionnant les stations qui lui est symétrique lorsque seules deux des six espèces sont considérées.
![]()
Le positionnement des stations A et B dans l'espace défini par les axes "espèces" Deschampsia flexuosa et Molinia coerulea est tout à fait symétrique au positionnement de ces deux espèces dans l'espace défini par les stations A et B. Si les autres espèces sont ajoutées, la position relative des trois stations les unes par rapport aux autres va bouger pour intégrer la variation qu'elles apportent. Le même tableau peut donc être représenté par un nuage à 3 dimensions (stations) dans lequel sont positionnés 6 points "espèces" ou par un nuage à 6 dimensions (espèces) dans lequel sont positionnés les 3 points "stations".
Ce qui est applicable avec un jeu de données de fréquence fonctionne a fortiori aussi avec une matrice de descripteurs écologiques lorsque les unités différentes ont été ramenées à une unité commune comme la standardisation.