planeco:roteiro:07-class
Diferenças
Esta página mostra as diferenças entre as duas revisões da página.
Ambos os lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
planeco:roteiro:07-class [2017/03/22 16:53] – amzmartini | planeco:roteiro:07-class [2024/01/09 18:38] (Atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ESSA PAGINA NAO ESTÁ EM USO, ESTÁ APENAS DE BACKUP COMO VERSÃO ORIGINAL PARA AS VERSÕES R E RCMDR DO ROTEIRO | ||
+ | |||
====== Testes Clássicos ====== | ====== Testes Clássicos ====== | ||
Linha 93: | Linha 95: | ||
Agora vamos checar no R com esses mesmos dados: | Agora vamos checar no R com esses mesmos dados: | ||
- | 1) Crie um diretório para você | + | 1) Crie um diretório |
- | 1) Abra o R | + | 2) Abra o R no seu computador e mude o diretório de trabalho para o diretório que você criou, usando o menu **// |
- | 2) Crie as variáveis x e y: | + | 3) Crie as variáveis x e y: |
< | < | ||
x<- c(1, | x<- c(1, | ||
Linha 103: | Linha 105: | ||
</ | </ | ||
- | 3) Ajuste um modelo de regressão linear simples | + | 4) Ajuste um modelo de regressão linear simples |
< | < | ||
lm.xy< | lm.xy< | ||
Linha 112: | Linha 114: | ||
====Checando as premissas==== | ====Checando as premissas==== | ||
- | Ok, agora que você entendeu como são calculados os resíduos, vamos trabalhar com conjuntos de dados maiores para podermos entender como checar as premissas da análise de regressão linear de uma maneira um pouco mais realista: | + | Ok, agora que você entendeu como são calculados os erros/resíduos, vamos trabalhar com conjuntos de dados maiores para podermos entender como checar as premissas da análise de regressão linear de uma maneira um pouco mais realista: |
+ | |||
+ | Baixe os arquivos de dados para o seu diretório: | ||
- | Baixe os arquivos de dados: | ||
* {{ : | * {{ : | ||
* {{ : | * {{ : | ||
* {{ : | * {{ : | ||
* {{ : | * {{ : | ||
+ | |||
+ | |||
+ | <WRAP center round info 90%> | ||
+ | **Descrição dos conjuntos de dados:** | ||
+ | |||
+ | Um grupo de pesquisadores vem trabalhando há muito tempo com peixes da família Rivulidae que ocorrem em lagos temporários. Esses peixes crescem e se reproduzem nesses lagos temporários durante o período de chuvas e seus ovos ficam dormentes durante o período de seca. | ||
+ | |||
+ | Do total de lagos temporários existentes, foram sorteados 20 lagos e na época chuvosa os seguintes dados foram coletados: | ||
+ | * - Biomassa de algas | ||
+ | * - Biomassa de insetos aquáticos | ||
+ | * - Volume do lago | ||
+ | * - Biomassa de peixes herbívoros | ||
+ | * - Biomassa de peixes insetívoros | ||
+ | * - Número de indivíduos adultos da espécie mais abundante (// | ||
+ | |||
+ | - O primeiro conjunto de dados (algas_peixes.csv) foi obtido com o objetivo de analisar se a biomassa de algas existente nos lagos influencia a biomassa de peixes herbívoros e se essa relação é linear. | ||
+ | |||
+ | - O segundo conjunto de dados (algas_peixes2.csv) foi obtido com o mesmo objetivo anterior, mas em outros 20 lagos diferentes | ||
+ | |||
+ | - O terceiro conjunto de dados (insetos_peixes.csv) foi obtido com o objetivo de analisar se a biomassa de insetos existente nos lagos influencia a biomassa de peixes insetívoros e se essa relação é linear. | ||
+ | |||
+ | - O quarto conjunto de dados (vol_inds.csv) foi obtido com o objetivo de analisar se o volume de água de cada lago afeta o número de indivíduos da espécie // | ||
+ | |||
+ | </ | ||
Linha 127: | Linha 155: | ||
O primeiro passo é ajustar um modelo de regressão linear aos dados obtidos. | O primeiro passo é ajustar um modelo de regressão linear aos dados obtidos. | ||
- | Inicialmente vamos trabalhar com o conjunto de dados algas_peixes.csv | + | |
+ | Inicialmente vamos trabalhar com o conjunto de dados //algas_peixes.csv// | ||
Importe o arquivo para o R e conheça os dados: | Importe o arquivo para o R e conheça os dados: | ||
Linha 136: | Linha 165: | ||
</ | </ | ||
- | Avalie visualmente a relação entre as variáveis | + | Avalie visualmente a relação entre as variáveis |
< | < | ||
scatterplot(BIOMASSA_PEIXES_HERB~BIOMASSA_ALGAS, | scatterplot(BIOMASSA_PEIXES_HERB~BIOMASSA_ALGAS, | ||
</ | </ | ||
- | Ajuste um modelo de regressão linear para as variáveis: | + | Ajuste um modelo de regressão linear para as variáveis, usando a função //lm()//: |
< | < | ||
lm.algas.peixes< | lm.algas.peixes< | ||
Linha 147: | Linha 176: | ||
</ | </ | ||
- | Agora vamos olhar especificamente os resíduos: | + | Use a função " |
+ | < | ||
+ | names(lm.algas.peixes) | ||
+ | </ | ||
+ | Se você quiser olhar detalhadamente alguma dessas informações, | ||
< | < | ||
lm.algas.peixes$residuals | lm.algas.peixes$residuals | ||
</ | </ | ||
- | ===Como saber se os resíduos seguem uma distribuição normal?=== | + | O mesmo pode ser feito para conhecer os valores ajustados (// |
+ | |||
+ | ===Como saber se os erros/resíduos seguem uma distribuição normal?=== | ||
Lembre dos métodos usados no tutorial de [[planeco: | Lembre dos métodos usados no tutorial de [[planeco: | ||
Linha 174: | Linha 209: | ||
</ | </ | ||
- | ===Como saber se a variância dos resíduos é constante? | + | ===Como saber se a variância dos erros/resíduos é constante? |
Para qualquer valor de X (ou de // | Para qualquer valor de X (ou de // | ||
Linha 190: | Linha 225: | ||
**Como você interpreta esse gráfico? | **Como você interpreta esse gráfico? | ||
- | Você nota algum padrão na distribuição dos resíduos? | + | Você nota algum padrão na distribuição dos erros/resíduos? |
O mesmo gráfico (// | O mesmo gráfico (// | ||
Linha 211: | Linha 246: | ||
Além de testar as premissas, também é importante fazer um diagnóstico para verificar se existem // | Além de testar as premissas, também é importante fazer um diagnóstico para verificar se existem // | ||
- | Para medir a influência de uma observação usamos uma medida denominada **" | + | Para medir a influência de uma observação usamos uma medida denominada **" |
- | Valores altos de Distância | + | |
+ | {{ : | ||
+ | |||
+ | <WRAP center round tip 90%> | ||
+ | Valores altos de Distância de Cook significam que se esse ponto for retirado das análises, a inclinação da reta de regressão pode mudar muito. Veja o exemplo abaixo, do livro de Quinn & Keough (2008), mostrando o efeito de três diferentes pontos sobre a inclinação da reta. | ||
+ | {{ : | ||
+ | </ | ||
+ | |||
+ | |||
+ | Se o valor dos // | ||
Devido ao tempo escasso, não vamos construir esse gráfico passo-a-passo. Vamos usar uma função mágica do R que vai mostrar 4 gráficos de diagnóstico de uma só vez e incluirá esse gráfico para que você possa analisar. | Devido ao tempo escasso, não vamos construir esse gráfico passo-a-passo. Vamos usar uma função mágica do R que vai mostrar 4 gráficos de diagnóstico de uma só vez e incluirá esse gráfico para que você possa analisar. |
planeco/roteiro/07-class.1490201619.txt.gz · Última modificação em: 2024/01/09 18:38 (edição externa)