====== Teoria da Amostragem de SADs ====== Este é um resumo da aplicação da Teoria da Amostragem a modelos de distribuição de abundância de espécies. Uma descrição mais detalhada, com um exemplo de dedução dos modelos, está em {{:prado:prado2009_ca.pdf|Prado (2009)}}. A formalização da teoria aplicada a SADs é de Pielou (1977) e Green & Plotkin (2007). Uma introdução geral a modelos hierárquicos está em Royle & Dorazio (2008) ===== Motivação ===== Para descrever as abundâncias das espécies em uma amostra precisamos de um modelo hierárquico (//sensu// Royle & Dorazio 2008) que combine dois processos: * A distribuição das abundâncias das espécies na comunidade. * A amostragem da comunidade. ===== Abundâncias na Comunidade ===== Com a premissa de que as abundâncias de cada espécie são variáveis aleatórias independentes e que seguem a mesma distribuição de probabilidades (uma [[http://en.wikipedia.org/wiki/Iid|i.i.d.]]), podemos descrevê-las com uma única [[http://en.wikipedia.org/wiki/Probability_distribution|função de distribuição probabilística]]. As abundâncias das espécies são variáveis discretas, mas se aceitamos que na comunidade há uma grande quantidade de indivíduos, uma aproximação para uma variável contínua é razoável. Acrescentando esta premissa, nosso modelo para a distribuição de abundâncias das espécies na comunidade será uma a distribuição de probabilidades de uma variável aleatória contínua, uma **função de densidade probabilística** ([[http://en.wikipedia.org/wiki/Probability_density_function|pdf]]), que chamaremos de $$f(n)$$, sendo $$n$$ o número de indivíduos de uma espécie tomada ao acaso da comunidade. ===== Função de Amostragem ===== Amostras ao acaso de uma fração da comunidade terão números diferentes de indivíduos. Se a abundância de uma espécie na comunidade é $$n$$ e uma fração $$a$$ da comunidade é amostrada ao acaso, o número esperado de indivíduos na amostra é $$a*n$$. No entanto, a variação ao acaso imposta pela amostra faz com que algumas amostras tenham menos ou mais do que o valor esperado, mas espera-se que valores muito diferentes do esperado sejam menos prováveis dos que os valores próximos. Portanto, o número de indivíduos de cada espécie em uma amostra é também uma **variável aleatória**, que podemos descrever com uma função de distribuição de probabilidades. Como o número de indivíduos na amostra pode ser pequeno, vamos modelar esta variável aleatória como uma [[http://en.wikipedia.org/wiki/Discrete_probability_distribution|variável discreta]], que descreve a probabilidade de que a abundância $$X$$ na amostra seja um certo valor $$x$$, **dada uma certa abundância** $$n$$ na comunidade: $$g(x|\ n)=P(X=x|\ n)$$ ===== Combinando os Dois Modelos ===== A probabilidade de que uma espécie tenha uma certa abundância $$n$$ na comunidade e uma certa abundância $$x$$ na amostra dado $$n$$ é o produto das probabilidades destes dois eventos independentes: $$f(n)*g(x\ |n)$$ Então uma mesma abundância na amostra pode ocorrer para várias abundâncias na comunidade. Como cada abundância na comunidade é um evento excludente das demais, a soma de suas probabilidades será a probabilidade da ocorrência de um certo número de indivíduos na amostra. Trata-se, então, de somar todos os produtos do produto acima. Como a função $$f(n)$$ é contínua, esta soma torna-se uma integral: $$h(x)=c int_0^oo\ f(n)*g(x\ |n)\ $$d$$n$$ Solucionando a integral e multiplicando-a por uma constante de integração $$c$$((isto é necessário para garantir que a integral da função resultante seja um, para que ela seja uma função de probabilidade)) temos $$h(x)$$, que é a função de densidade de probabilidade das abundâncias de cada espécie na amostra, dados os modelos que descrevem as abundâncias na comunidade e o processo amostral. Ela pode ser definida de modo a preservar os parâmetros da SAD da comunidade. Com isso, podemos obter estimativas de máxima verossimilhança destes parâmetros da comunidade a partir das observações obtidas na amostra. ===== Bibliografia ===== @ARTICLE{Green2007, author = {Jessica L. Green and Joshua B. Plotkin}, title = {A statistical theory for sampling species abundances}, journal = {Ecology Letters}, year = {2007}, volume = {10}, pages = {1037 - 1045}, owner = {paulo}, timestamp = {2008.12.16}, url={http://www3.interscience.wiley.com/journal/118545784/abstract} } @BOOK{Pielou1977, title = {Mathematical Ecology}, publisher = {John Wiley and Sons}, year = {1977}, author = {Pielou, E. C.}, address = {New York}, owner = {paulo}, timestamp = {2008.12.20} } @ARTICLE{Prado2009, author = {Prado, P I}, title = {Distribuições de Abundâncias de Espécies: avanços analíticos para entender um padrão básico em ecologia}, journal = {Ciência e Ambiente}, year = {2009}, volume = {39}, pages = {121 -- 136}, file={:prado:prado2009_ca.pdf} } @book{royle2008, title={Hierarchical modeling and inference in ecology: the analysis of data from populations, metapopulations and communities}, author={Royle, J.A. and Dorazio, R.M.}, year={2008}, publisher={Academic Press} } ===== Outras Informações ===== * Um [[tutoriais:tut-sampling-sad|Tutorial em R]] para simular o efeito da amostragem sobre SADs. * [[projetos:sad|Página Principal do Projeto SADs]], que desenvolve e aplica modelos de distribuição de abundâncias usando a Teoria da Amostragem.