Ferramentas de Utilizador

Ferramentas de Site


planeco:roteiro:07-class

Diferenças

Esta página mostra as diferenças entre as duas revisões da página.

Links para esta vista de comparação

Ambos os lados da revisão anteriorRevisão anterior
Próxima revisão
Revisão anterior
planeco:roteiro:07-class [2017/03/22 17:46] amzmartiniplaneco:roteiro:07-class [2024/01/09 18:38] (Atual) – edição externa 127.0.0.1
Linha 1: Linha 1:
 +ESSA PAGINA NAO ESTÁ EM USO, ESTÁ APENAS DE BACKUP COMO VERSÃO ORIGINAL PARA AS VERSÕES R E RCMDR DO ROTEIRO
 +
 ====== Testes Clássicos ====== ====== Testes Clássicos ======
  
Linha 103: Linha 105:
 </code> </code>
  
-4) Ajuste um modelo de regressão linear simples usando a função //lm()// e inspecione o resumo do modelo usando a função //summary()//, que fornece informações importantes sobre o modelo, incluindo os valores brutos dos resíduos:+4) Ajuste um modelo de regressão linear simples usando a função //lm()// e inspecione o resumo do modelo usando a função //summary()//, que fornece informações importantes sobre o modelo, incluindo os valores brutos dos erros/resíduos (//residuals//):
 <code> <code>
 lm.xy<-lm(y~x) lm.xy<-lm(y~x)
Linha 112: Linha 114:
  
 ====Checando as premissas==== ====Checando as premissas====
-Ok, agora que você entendeu como são calculados os resíduos, vamos trabalhar com conjuntos de dados maiores para podermos entender como checar as premissas da análise de regressão linear de uma maneira um pouco mais realista:+Ok, agora que você entendeu como são calculados os erros/resíduos, vamos trabalhar com conjuntos de dados maiores para podermos entender como checar as premissas da análise de regressão linear de uma maneira um pouco mais realista:
  
 Baixe os arquivos de dados para o seu diretório: Baixe os arquivos de dados para o seu diretório:
Linha 163: Linha 165:
 </code> </code>
  
-Avalie visualmente a relação entre as variáveis com esse gráfico //scatterplot//:+Avalie visualmente a relação entre as variáveis com gráfico //scatterplot//:
 <code> <code>
 scatterplot(BIOMASSA_PEIXES_HERB~BIOMASSA_ALGAS, data=algas.peixes) scatterplot(BIOMASSA_PEIXES_HERB~BIOMASSA_ALGAS, data=algas.peixes)
Linha 174: Linha 176:
 </code> </code>
  
-Use a função "names()" para conhecer todas as informações que estão disponíveis sobre esse modelo:+Use a função "names()" para saber quais são as informações que estão disponíveis sobre esse modelo:
 <code> <code>
 names(lm.algas.peixes) names(lm.algas.peixes)
 </code> </code>
  
-Se você quiser olhar detalhadamente alguma dessas informações, basta escrever o //nome_do_modelo$nome_da_informação//. Então, vamos olhar especificamente os resíduos:+Se você quiser olhar detalhadamente alguma dessas informações, basta escrever o //nome_do_modelo$nome_da_informação//. Então, vamos olhar especificamente os erros/resíduos:
 <code> <code>
 lm.algas.peixes$residuals lm.algas.peixes$residuals
 </code> </code>
  
-memso pode ser feito para conhecer os valores ajustados (//fitted.values//), os coeficientes a e b (//coef//), etc.+mesmo pode ser feito para conhecer os valores ajustados (//fitted.values//), os coeficientes a e b (//coef//), etc.
  
-===Como saber se os resíduos seguem uma distribuição normal?===+===Como saber se os erros/resíduos seguem uma distribuição normal?===
 Lembre dos métodos usados no tutorial de [[planeco:roteiro:05-descr|ANÁLISES EXPLORATÓRIAS DE DADOS]]. Escolha um dos métodos disponíveis para avaliar a normalidade dos dados e aplique a mesma lógica para a distribuição dos erros/resíduos. Lembre dos métodos usados no tutorial de [[planeco:roteiro:05-descr|ANÁLISES EXPLORATÓRIAS DE DADOS]]. Escolha um dos métodos disponíveis para avaliar a normalidade dos dados e aplique a mesma lógica para a distribuição dos erros/resíduos.
  
Linha 207: Linha 209:
 </code> </code>
  
-===Como saber se a variância dos resíduos é constante?===+===Como saber se a variância dos erros/resíduos é constante?===
 Para qualquer valor de X (ou de //Yobservado//, ou de //Yestimado//) os valores máximos e mínimos dos resíduos devem ser similares. Então, podemos fazer um gráfico em que relacionamos os valores de //Yestimado// (ou seja, os valores de Y que são indicados pela reta de regressão) e os valores dos //Resíduos// para cada //Yestimado// Para qualquer valor de X (ou de //Yobservado//, ou de //Yestimado//) os valores máximos e mínimos dos resíduos devem ser similares. Então, podemos fazer um gráfico em que relacionamos os valores de //Yestimado// (ou seja, os valores de Y que são indicados pela reta de regressão) e os valores dos //Resíduos// para cada //Yestimado//
  
Linha 223: Linha 225:
  
 **Como você interpreta esse gráfico? **Como você interpreta esse gráfico?
-Você nota algum padrão na distribuição dos resíduos?**+Você nota algum padrão na distribuição dos erros/resíduos?**
  
 O mesmo gráfico (//Resíduos// X //Yestimado//) que é utilizado para avaliar se a variância é constante (homoscedasticidade), também pode ser utilizado para checar se existe alguma assimetria, algum viés (positivo ou negativo) ou alguma tendência de que a relação seja melhor definida por uma curva do que por uma reta.  O mesmo gráfico (//Resíduos// X //Yestimado//) que é utilizado para avaliar se a variância é constante (homoscedasticidade), também pode ser utilizado para checar se existe alguma assimetria, algum viés (positivo ou negativo) ou alguma tendência de que a relação seja melhor definida por uma curva do que por uma reta. 
Linha 244: Linha 246:
 Além de testar as premissas, também é importante fazer um diagnóstico para verificar se existem //outliers// e se eles afetam muito o resultado da análise de regressão. Além de testar as premissas, também é importante fazer um diagnóstico para verificar se existem //outliers// e se eles afetam muito o resultado da análise de regressão.
  
-Para medir a influência de uma observação usamos uma medida denominada **"Distância de Cook"** que é calculada para cada observação e leva em consideração o resíduo da observação e a //leverage//, que pode ser traduzida como "alavancagem". A //leverage// indica o quanto um dado valor de X influencia o valor de //Yestimado//. Se o valor dos //Resíduos// for plotado contra o valor de //leverage//, os pontos que possuírem as maiores //leverage// e também resíduos grandes (positivos ou negativos) serão os pontos com maiores influências.  +Para medir a influência de uma observação usamos uma medida denominada **"Distância de Cook"** que é calculada para cada observação e leva em consideração o erro/resíduo (//**e**//e a //leverage// (//**hii**//) da observação, que pode ser traduzida como "alavancagem". A //leverage// indica o quanto um dado valor de X influencia o valor de //Yestimado// 
-Valores altos de Distância de Cook significam que se esse ponto for retirado das análisesa inclinação da reta de regressão pode mudar muito.+ 
 +{{ :planeco:roteiro:distancia_cook_equacao_portugues.png?300 |}} 
 + 
 +<WRAP center round tip 90%> 
 +Valores altos de Distância de Cook significam que se esse ponto for retirado das análises, a inclinação da reta de regressão pode mudar muito. Veja o exemplo abaixo, do livro de Quinn & Keough (2008), mostrando o efeito de três diferentes pontos sobre a inclinação da reta. 
 +{{ :planeco:roteiro:figuraleverageq_k.jpg?300 |}} 
 +</WRAP> 
 + 
 + 
 +Se o valor dos //Resíduos// for plotado em relação ao valor de //leverage//, os pontos que possuírem as maiores //leverage// e também erros/resíduos grandes (positivos ou negativos) serão os pontos com maiores **Distâncias de Cook** e consequentementecom maiores **influências** sobre os parâmetros da reta. 
  
 Devido ao tempo escasso, não vamos construir esse gráfico passo-a-passo. Vamos usar uma função mágica do R que vai mostrar 4 gráficos de diagnóstico de uma só vez e incluirá esse gráfico para que você possa analisar. Devido ao tempo escasso, não vamos construir esse gráfico passo-a-passo. Vamos usar uma função mágica do R que vai mostrar 4 gráficos de diagnóstico de uma só vez e incluirá esse gráfico para que você possa analisar.
planeco/roteiro/07-class.1490204796.txt.gz · Última modificação em: 2024/01/09 18:38 (edição externa)