¿Pueden los patrones de la comunidad de aves ser...

30
Ordenación contrastante o directo ¿Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas?

Transcript of ¿Pueden los patrones de la comunidad de aves ser...

Ordenación contrastante o directo

¿Pueden los patrones de la comunidad de aves ser explicados por variables ambientales medidas?

Ordenación contrastante o directa

De análisis de gradiente indirecto a directo

Objetivo del análisis es describir la estructura de los datos, factores latentes responsables de esa estructura serán inferidos. in

dire

cto

dire

cto

Extensión de ordenamiento indirecto o no contrastante en el cual la solución se expresan por las variables.

Modelo cercano a respuesta lineal:

• Análisis de Redundancia (RDA)

• RDA basado en distancias (dbRDA)(análisis constrantantes de coordenadas principales,CAP)

Modelo Respuesta unimodal:

• Análisis de correlación Canónica(CCA/DCCA).

Modelos lineales versus unimodales

Características importantes de técnicas de ordenamiento contrastantes

• Objetivo de OC es inferir (como en regresión) patrones en composición de especies de patrones en variables ambientales.

• OC usa dos conjuntos de variables: variables explicativas y respuestas en cada sitio.

• OC se basa en un modelo subyacente de comunidad: por ej, asume que cuando las variables son muestreadas en un rango suficiente, la respuesta será lineal o unimodal.

• Interpretación clásica de OC es como un modelo parsimonioso de cómo la estructura de la comunidad entera está simultaneamente afectada por gradientes ambientales específicos.

• OC identifica cuales variables ambientales son más importantes en la estructura de la comunidad, describe como las variables ambientales están relacionadas y como la comunidad varía a lo largo de los más importantes gradientes.

Características importantes de técnicas de ordenamiento contrastantes

• OC extrae gradientes sintéticos los cuales maximiza la separación entre especies.••Nicho fundamental vs realizado: OC modela estructura, solapamiento y separación de nichos. • Hutchinson (1968) modeló nicho como un hipervolumen en un espacio P p dimensional: OC extráe las dimensiones latentes dominantes del espacio de nicho a través de todas las especies simultantamente.

•La máxima cantidad de separación de nicho está dado por el eigenvalue.

Características importantes de técnicas de ordenamiento contrastantes

Atributos claves de datos de especies a evaluar:

• Suficiencia es la extensión a la cual cada carácter ecológico de especie es descripto con seguridad por los datos.

•Las especies con muy poco registros no son probables seguros ubicados en un espacio ecológico. Podríamos decidir a que nivel de frecuencia de ocurrencia queremos aceptar el error y eliminar las especies por debajo de ese nivel. Por ej. Especies presentes a más del 5% de muestreos.

• Los generalistas abundantes definen fuertes dimensiones de la nube que no tiene patrones sobre ellos. Pueden solapar las especies más raras en algunos tipos de análisis.

• Redundancia es una medida de coordinación ecológica entre variables. Todas las técnicas multivariadas dependen sobre la redundancia. Si todas las especies fueran independientemente distribuidas una proyección canónica en menores dimensiones no sería efectiva.

Paso 1: Seleccionar especies para análisis

Soluciones:

• No transformar

• transformación log o raíz cuadrada recomendada en muchas aplicaciones.

• Transformación binaria para propuestas de comparación

•Si hay dudas hacer las transformaciones y comparar los resultados.

Paso 2: Transformar datos de especies?

Para el caso de distribuciones asimétricas (muchas observaciones con ceros y pocas observaciones con valores grandes) pueden sesgar el ordenamiento.

Paso 2: estandarizar los datos de especies?

Variabilidad de especies

Variabilidad de especies puede tener efecto grande sobre ACC, estandarizar columna total?

Variabilidad de muestra (parcela) puede tener efecto menor en ACC.

Paso 2: estandarizar los datos de especies?

• Distancia Euclideana ( ACP y RDA) es inapropiado para datos de abundancia de especies en filas involucrando abundancias cero.

• Las estandarizaciones muestras (filas) lleva a los ecólogos a usar ACP y RDA lo cual se basa en euclidiana. Normalizar fila, hellinger o chi cuadrado: Recomendado para usar con RDA (ver Legendre and Gallagher 2001)

•Evitar estandarizar para AC y ACC.

• Comparar los resultados

Paso 2: estandarizar los datos de especies?

Paso 3: Determinar el modelo respuesta apropiado

• El objetivo de este paso es determinar si un modelo respuesta unimodal o lineal es apropiado para la comunidad bajo investigación.

CAP puede tomar cualquier medida de disimilitud y performa un mapeo lineal.

RDA se basa sobre distancias euclidianas y performa mapeo lineal.

ACC se basa sobre distancias Chi cuadrado y performa mapeo unimodal.

Longitud gradiente:

• > 4 unimodal

• 3-4 probablemente unimodal

• 2-3 probablemente lineal

• < < 2 lineal

Paso 3: Determinar el modelo respuesta apropiado

Conclusiones:

• Fuerte evidencia por modelo lineal o no lineal no existe.

• Considerar RDA siguiendo datos estandarizados (normalizar filas, hellinguer o chi cuadrado).

Paso 4: Selección de variables independientes

• Como la cantidad de variables explicativas incrementa a mayores cantidades de muestras, resultados tienden a ser dudosos.

Las técnicas contrastantes se hacen cada vez más débiles cuando la cantidad de variables incrementa.

Altas correlaciones entre pares de variables ambientales indican problemas potenciales de mulcolinealidad.

Las relaciones ambiente- especies aparecen fuertes aún si los predictores son cantidades aleatorias.

Se necesita reducir el cjto de variables para ser más parsimonioso.

Soluciones• Incluir sólo variables importantes, basadas en relaciones hipotetizadas a priori.

• Usar procedimiento de selección de variable para seleccionar el mejor subcjto de variables para incluir como contrastantes.

El análisis de correlaciones canónicas (ACC) (Hotelling, 1936) se utiliza para determinar la relación lineal entre dos grupos de variables métricas unas consideradas como variables dependientes y otras como independientes. Vale decir que el análisis aborda el estudio de la asociación entre dos conjuntos o grupos de variables

El ACC provee una medida de correlación entre una combinación lineal de las variables en un conjunto con una combinación lineal de las variables en el otro conjunto.

En un primer paso del análisis, se determina el par de combinaciones lineales con máxima correlación. En un segundo paso, identifica el par con máxima correlación entre todos los pares no correlacionados con el par de combinaciones seleccionadas en el primer paso y así sucesivamente.

Las combinaciones lineales de un par son llamadas variablescanónicas y la correlación entre ellas, es llamada correlación canónica.

Limitaciones y consideraciones de ACC

•El ACC asume correlación del tipo lineal, otras correlaciones pueden pasar desapercibidas y distorsionar el análisis.

•La incorporación y eliminación de variables puede modificarsustancialmente el análisis al igual que la presencia de puntos influyentes.

• En el ACC no se requiere normalidad multivariada a menos que sepretendan obtener errores estándares y pruebas de hipótesis para las correlaciones.

Paso 5: análisis a conducir

• Sacar especies con menos de 5 ocurrencias.

• Abundancias de especies transformadas en log

• Log abundancias de especies normalizadas ( distancia distancia)

• Seleccionar un pequeño subconjunto de las mejores variables independientes.

• Elegir RDA (en combo con distancia chord)

El algoritmo del análisis de correlación canónica

• ACC estima óptimo de especies, coeficientes de regresión, y puntuaciones de sitio usando el modelo de promedios pesados gausianos combinados con regresión.

• Se asumen que los gradientes son combinaciones lineales de las variables ambientales.

• Supuesto clave es de que las distribuciones de especies son unimodales a lo largo de gradientes ambientales.

• Efectividad del ordenamiento Constratante o directo: inercia total, eigenvalues, porcentaje de varianza explicada, test de

significancia, correlación ambiente – especies.

• Interpretando el ordenamiento Constratantecoefiecientes canónicos, correlaciones entre e intra conjunto, biplots de

scores.

El Triplot: muestra vs especies scaling, regla de centroide vs regla de biplot.

Interpretación de las relaciones ambiente – especies.

Paso 6: Interpretación de resultados

Inercia total• Suma de los eigenvalues; “varianza” total en los datos de las especies, algunos de los cuales es cuantificado por las contrastantes ambientales

Eigenvalues• Varianza en la matriz de la comunidad atribuida a un eje particular; mide la importancia del eje de ordenamiento.

Efectividad en la ordenación contrastante

Porcentaje de “varianza” de datos de especies

Proporción de varianza de especies (inercia total)Explicada por cada eje.Computada como eigenvalue/total inercia (registrado como % acumulativo).

Efectividad en la ordenación contrastante

Para datos ecológicos el porcentaje de varianza explicada es usualmente baja, ~ 10%. No preocuparse, como es una característica inherente de datos con fuerte aspecto de presencia/ ausencia.

•Longitud del vector ambiental indica su importancia en el ordenamiento.

• Dirección del vector indica su correlación con cada uno de los ejes.

• ángulo entre vectores indica la correlación entre estas variables ambientales.

• Aproximación entre flecha y especie indica asociación.

Interpretación general de triplot canónico

Coeficientes canónicos estandarizados no son muy útiles en la interpretación

Interpretación de ordenación contrastante

Tanto los coeficientes canónicos y las correlación IntRA-set relacionan a la tasa de cambio en la composición de la comunidad por unidad de cambio en la correspondiente variable ambiental (pero se asume que los coeficientes canónicos de otras variables ambientales permanecen constantes).

Cuando se tienen en cuenta coeficientes canónicos intercorrelacionados tienden a ser inestables (problema de multicolinealidad), se recomiendan los coeficientes correlación IntRA- set ya que no son afectados. Pero si son afectados por outliers (sensibles a valores extremos).

Coeficientes correlación IntRA-set (estructura)

Las correlaciones entre los scores muestras (WA scores) derivados de las correlaciones entre especies y las variables ambientales.

• Tendrían a ser más altas que las correlaciones derivadas de ordenamiento no contrastante.

• Generalmente más bajos que correlaciones IntRA-set.

Coeficientes correlación IntER-set (estructura)

Correlaciones entre variables ambientales y cada eje canónico

Biplot Scores para variables ambientales

Variables ambientales son típicamente representadas como vectores que irradian del centroide del ordenamiento.

Los scores biplot dan coordenadas de las cabezas de los vectores ambientales y se basan en correlaciones IntRA-set

Programa InfoStat

• Adiciona automáticamente a la tabla de datos los valores que asumen cada una de las variables canónicas (score de cada observación sobre cada combinación lineal definiendo una variable canónica).

• Las correlaciones entre las variables originales y las variables canónicas pueden solicitarse desde el menú ANÁLISIS DE CORRELACIÓN.

• El análisis de regresión lineal múltiple entre una variable canónica y todas las variables originales en el conjunto opuesto, puede ser realizado en el menú REGRESIÓN LINEAL.

• Para facilitar la interpretación de la correlación canónica. Gráficos de dispersión de cada variable canónica versus su contraparte en el otro grupo son también recomendados.