Amostragem de SADs - Tutorial

A teoria de amostragem de SADs define as abundâncias das espécies em uma amostra tomada de uma comunidade como o resultado de dois processos:

  • A distribuição de abundâncias na comunidade
  • A distribuição dos indivíduos nas amostras

Os detalhes teóricos estão na página de descrição geral do Projeto SADs.

Este tutorial em R simula amostragens de uma comunidade, para tornar mais concreta a lógica da teoria.

Abundâncias na Comunidade

Vamos imaginar uma comunidade de 200 espécies, cujas abundâncias podem ser aproximadas por uma distribuição log-normal com parâmetros $$\mu = 7.2$$ e $$\sigma = 2$$.

Podemos simular as abundâncias esperadas para as espécies sorteando 200 números de uma log-normal com estes parâmetros:

     ab.comun <- rlnorm(n=200, meanlog=7.2, sdlog=2)

E geramos um histograma deste valores, em escala de log base 2 1) com o comando:

hist(log(ab.comun,base=2),breaks=0:18, xlab="Log2 Abundância", 
     ylab="N de espécies", col="black", main="Comunidade")

Abundâncias de 200 espécies de uma SAD log-normal

Fração Amostrada

Se tomamos uma amostra de uma certa fração do total de indivíduos da comunidade, a abundância esperada de cada espécie será sua abundância na comunidade multiplicada pela fração amostrada. Se uma espécie tem 200 indivíduos na comunidade, é esperado que sua abundância numa amostra de 1% da comunidade seja 2, e assim por diante.

Portanto, para calcular estes valores esperados para cada espécie numa amostra de 1% da comunidade, multiplicamos cada abundância por 0.01:

      ab.exp <- ab.comun*0.01

Isto vai apenas deslocar o histograma de abundâncias para a esquerda:

Abundâncias na comunidade e as esperads numa amostra de 1% dos indivíduos

Função de Amostragem

Os valores das abundâncias não serão exatamente estes esperados devido a flutuações ao acaso na amostra. Assim, precisamos de uma distribuição de probabilidades que defina as probabilidades de termos $$x$$ indivíduos na amostra, dada a abundância esperada.

Amostragem Poisson

Se os indivíduos são amostrados independentemente, podemos representar esta flutuação como uma variável Poisson.

Um exemplo de processo Poisson seria o lançamento de uma parcela em uma área com plantas distribuídas ao acaso. O valor esperado de plantas na parcela é a densidade de plantas multiplicada pela área da parcela, mas há a possibilidade de ter mais ou menos plantas do que este valor, dependendo de onde a parcela caia. Veja um exemplo detalhado desta simulação aqui.

Assim, a distribuição Poisson atribui uma probabilidade a cada valor de abundância, dado apenas o valor esperado, que corresponde ao único parâmetro da Poisson, chamado $$\lambda$$. Por exemplo, se abundância esperada é 2, as probabilidades de ter de zero a 10 indivíduos desta espécie numa amostra Poisson serão:

> dpois(0:5,lambda=2)
[1] 0.13533528 0.27067057 0.27067057 0.18044704 
[2] 0.09022352 0.03608941

Simulando uma amostragem Poisson

Para simular uma amostragem Poisson de nossa comunidade com 200 espécies, sorteamos 200 números de uma Poisson, sendo que o parâmetro $$\lambda$$ para cada sorteio corresponde ao valor de abundância esperada:

     ab.sample.p <- rpois(n=200,lambda=ab.exp)

Neste sorteio podem haver zeros, que representam as espécies não incluídas na amostra. Como estas não são conhecidas pela amostragem, retiramos os zeros com:

     ab.sample.p <- ab.sample.p[ab.sample.p>0]

Amostragem com Agregação

Há muitos casos em que os indivíduos estão agregados por unidade amostral, inclusive no caso de parcelas lançadas para amostrar comunidades vegetais. Neste caso, a Poisson não é um modelo adequado de amostragem, pois presume que as ocorrências dos indivíduos na amostra sejam independentes, o que corresponde a uma distribuição ao acaso no espaço.

A distribuição binomial negativa é muito usada para descrever amostras com agregação. Ela pode ser definida por uma parâmetro que corresponde ao valor esperado, e outro, que regula a intensidade de agregação, e pode ser interpretado como um índice de agregação.

As probabilidades de termos zero a cinco indivíduos em uma amostra binomial negativa com valor esperado de dois, e índice de dispersão de 0,1 2) são:

> dnbinom(0:5,mu=2,size=0.1)
[1] 0.73752725 0.07024069 0.03679274 0.02452850 
[5] 0.01810437 0.01413865

Comparadas com a Poisson para o mesmo valor esperado, amostras com pelo menos um indivíduo são bem menos prováveis. Para entender melhor porque, veja aqui.

Simulando uma amostragem Binomial Negativa

Para simular uma amostragem com agregação de nossa comunidade com 200 espécies, sorteamos 200 números de uma Binomial Negativa, sendo que o parâmetro $$\mu$$ para cada sorteio corresponde ao valor de abundância esperada, e o índice de dispersão baixo (0,1):

     ab.sample.nb <- rnbinom(n=200,mu=ab.exp,size=0.1)

Novamente, retiramos os valores zero da amostra, pois são “invisíveis” para quem está amostrando:

     ab.sample.nb <- ab.sample.nb[ab.sample.nb>0]

Avaliando o Efeito da Amostragem

Agora podemos comparar as distribuições de abundâncias das duas amostras simuladas com a da comunidade, com histogramas:

par(mfrow=c(1,3))
hist(log(ab.comun,base=2),breaks=0:18, xlab="Log2 Abundância", 
     ylab="N de espécies", col="black", main="Comunidade")
hist(log(ab.sample.p,base=2),breaks=0:18, xlab="Log2 Abundância", 
     ylab="N de espécies", col="black", main="Amostra Poisson")
hist(log(ab.sample.nb,base=2),breaks=0:18, xlab="Log2 Abundância", 
     ylab="N de espécies", col="black", main="Amostra Binomial Negativa")
par(mfrow=c(1,1))

SAD da comunidade e distribuições de abundância em amostras Poisson e Binomial Negativa

Conclusões

Com estas simulações mostramos que as distribuições de abundâncias que observamos não são as mesmas que as das comunidades, pois elas provêm de amostras. Experimente repetir as simulações variando número de espécies, a SAD da comunidade, proporção da comunidade amostrada e intensidade de agregação, para investigar o impacto de cada um destes fatores.

A mensagem geral é que para inferir sobre as SADs nas comunidades, temos que incluir em nossos modelos os processos amostrais. Isto foi feito por Fisher et al. (1943) para deduzir a distribuição de série logarítmica, e por Preston (1948) para propor a idéia da “linha de véu” da log-normal em uma amostra. Pielou (1977) e Green & Plotkin (2007) formalizaram este procedimento. Um resumo das deduções destes autores está aqui, e em Prado (2009, pdf abaixo).

Referências

[1943, article]
Fisher, R. A., Corbet, A. S., & Williams, C. B. (1943). The relation between the number of the species and the number of individuals in a random sample from animal population. Journal of Animal Ecology, 12, 42-58.
[2007, article | www]
Green, J. L., & Plotkin, J. B. (2007). A statistical theory for sampling species abundances. Ecology Letters, 10, 1037-1045.
[1977, book]
Pielou, E. C. (1977). Mathematical Ecology. New York: John Wiley and Sons.
[1948, article]
Preston, F. (1948). The commonness, and rarity, of species. Ecology, 254-283.
[2010, article | prado_2010.pdf]
Prado, P. I. (2010). Distribuições de Abundâncias de Espécies: avanços analíticos para entender um padrão básico em ecologia. Ciência e Ambiente, no prelo.

1) esta escala são as oitavas de Preston
2) índices de dispersão abaixo de um na binomial negativa descrevem distribuições com muita agregação.
tutoriais/tut-sampling-sad.txt · Última modificação: 2011/08/25 21:32 por prado
Alterações recentes · Índice · Mostrar código fonte · Autenticar-se
watch movies