Ferramentas de Utilizador

Ferramentas de Site


planeco:roteiro:10-glm

Diferenças

Esta página mostra as diferenças entre as duas revisões da página.

Links para esta vista de comparação

Ambos os lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
planeco:roteiro:10-glm [2017/03/28 19:12] – [Ajustando o modelo cheio] adalardoplaneco:roteiro:10-glm [2025/05/06 18:24] (Atual) adalardo
Linha 1: Linha 1:
 +====== Aviso ======
 +
 +
 +
 +===== ** Essa versão está desatualizada ** =====
 +
 +
 +**Entre em [[http://labtrop.ib.usp.br/doku.php?id=cursos:planeco:start| Novo site da disciplina]]
 +
 +**
 +
 +
 +
 +
 +
 ====== Modelo Lineares Generalizados ====== ====== Modelo Lineares Generalizados ======
  
Linha 16: Linha 31:
 O preditor linear está baseado na estrutura linear que temos visto nos modelos. Para uma variável preditora: O preditor linear está baseado na estrutura linear que temos visto nos modelos. Para uma variável preditora:
  
-$$ \eta = \alpha + \beta x$$+$$ \eta = \alpha + \beta  x$$
  
 A função de ligação é o que relaciona o preditor linear com a esperança: A função de ligação é o que relaciona o preditor linear com a esperança:
Linha 110: Linha 125:
  
  <WRAP center round box 60%>  <WRAP center round box 60%>
- * utilize a familia quasipoisson e  
- * siga em frente simplificando o modelo para o mínimo adequado  
- * interprete o modelo selecionado 
  
 +  * utilize a familia quasipoisson e 
 +  * siga em frente simplificando o modelo para o mínimo adequado 
 +  * interprete o modelo selecionado
 +
 +</WRAP>
 +
 +===== GLM Binomial =====
 +
 +Os modelos de proporção ou de resposta binária (presença/ausência, vivo/morto, sucessos/falhas) são modelados, normalmente, com estrutura do erro binomial.  Nesses casos os limite dos valores da variável resposta é bem definido: entre 0 e 1. Essa característica faz com que o erro apresente uma estrutura  que aumenta e depois diminuí, e normalmente o máximo de desvios é encontrado nos valores intermediários.
 +
 +===== Função de ligação =====
 +
 +A função de ligação para modelos com resposta binária ou proporção é chamada de ''logit'' ou ''log odds-ratio''.
 +Pode ser definida como:
 +
 +$$ p = \log{(\frac{a+bx}{1-(a+bx)})} $$
 + 
 +
 +===== Exemplo: passaro na ilha =====
 +
 +O conjunto de dados que vamos usar, {{ :planeco:roteiro:isolation.txt |}} tem como variável:
 +<WRAP center round box 60%>
 +**__//Conjunto de dados: ''isolation.txt''//__**
 +
 +  * incidence: presença/ausência da espécie de ave (reprodução)
 +  * area: área total da ilha ($km^2$)
 +  * isolation: distância do continente (km)
 +</WRAP>
 +
 +
 +<WRAP center round important 60%>
 +** Use os mesmos passos do modelo anterior no Rcmdr **
 +  * lembre-se que a ''family'' nesse caso é ''binomial''
 +  * o procedimento para a sobre-dispersão é o mesmo que no exemplo anterior
 +  * 
 +</WRAP>
 +
 +==== Hipótese ====
 +
 +O objetivo do estudo que gerou esses dados é saber se a ocorrência da ave (reprodução) está relacionada com o isolamento e tamanho da ilha.
 +
 +    * abra os dados ''isolation.txt'' no Rcmdr (a separação de campo é espaço)
 +    * monte o model cheio com todas a variáveis preditoras e interações
 +    * simplifique o modelo para o mínimo adequado
 + 
 +==== Interpretação do resultado ====
 +
 +O modelo prevê a ocorrência da ave na escala de logaritmo da chance (log odds-ratio). Para interpretar tanto os coeficientes quanto os valores previsto é necessário aplicar a função inversa do ''logit'':
 +
 +$$logit^{-1}(\hat{y}) = \frac{1}{1+\frac{1}{e^{\hat{y}}}} $$ 
 +
 +  * calcule o predito pelo modelo e os coeficientes na escala original
 +  * interprete o efeito do tamanho e distância na ocorrência da espécie
 +
 +
 +===== Modelo Linear Misto  =====
 +
 +Para construir modelos onde as observações têm dependência espacial ou temporal, é preciso contemplar a variável com dependência como variável aleatória.
 +
 +<WRAP center round box 80%>
 +**__//Pacotes para modelos mistos//__**
 +
 +Os pacotes para trabalhar os modelos mistos no R não são instalados junto com os pacotes básicos como os que contem as funções ''lm'' e ''glm''
 +Os dois principais pacotes para realizar modelos misto são: ''lme4'' e ''nlme''. Ambos funcionam muito bem para a grande parte do modelo que usamos, mas diferem um pouco quanto à sintaxe.  Nesse roteiro iremos usar o ''lme4''. Antes de iniciar o roteiro, instale e carregue o pacote com os seguintes comandos:
 +
 +<code>
 +install.packages("lme4")
 +library(lme4)
 +</code>
 + 
 +</WRAP>
 +
 +
 +Para um modelo onde a relação entre a preditora e a resposta não mudam, mas há um efeito relacionado aleatório relacionado à localidade ou o objeto da medida, construímos usamos o LMM da seguinte forma.
 +<WRAP center round box 80%>
 +  * baixe o arquivo {{ :planeco:roteiro:rikz.txt |}}
 +  * ajuste um modelo com a variável aleatória ''Beach'' afeta apenas o intercepto
 +  * compare o modelo com e sem a preditora ''NAP'' para tomar a decisão de qual modelo reter
 +  * interprete o resultado do modelo mínimo adequado
 +
 +</WRAP>
 +
 +
 +<code>
 +lmm01r <- lmer(Richness ~ NAP + (1|Beach), data=praia, REML =  FALSE)
 +lmm00r <- lmer(Richness ~ 1 + (1|Beach), data=praia, REML = FALSE)
 +anova(lmm00r, lmm01r)
 +lmm01 <- lmer(Richness ~ NAP + (1|Beach), data=praia, REML =  TRUE)
 +summary(lm001)
 +
 +</code>
 +
 +Para incluir a variável aleatória ''Beach'' também na inclinação é preciso mudar o termo de interação
 +$$(1|Beach) $$
 +para:
 +
 +$$(1 + NAP|Beach) $$
 + 
 +<WRAP center round box 60%>
 +  * construa o modelo com a variável aleatória ''NAP'' afetando o intercepto e a inclinação 
 +  * interprete o resultado
 + 
 </WRAP> </WRAP>
  
  
planeco/roteiro/10-glm.1490728331.txt.gz · Última modificação em: 2024/01/09 18:38 (edição externa)