Este é um exercício sobre Máxima Verossimilhança, utilizando os dados de presença e ausência.
Objetivos:
i) Obter estimativa de parâmetros psi e p com base em método de máxima verosimilhança;
ii) Representar graficamente a superfície de verosimilhança.
1) Construa uma base de dados fictícia.
Esta base de dados pode ser compreendida como uma matriz [i,j], com número i de linhas e j de colunas.
Como tratam-se de dados de presença e ausência, vamos representar as ausências por zeros, e as presenças por um.
Exemplo:
local | t1 | t2 | t3 | t4 | t5 | Soma |
1 | 0 | 0 | 0 | 0 | 0 | 0 |
2 | 1 | 0 | 0 | 1 | 1 | 3 |
3 | 1 | 1 | 0 | 0 | 0 | 2 |
4 | 0 | 1 | 0 | 1 | 0 | 2 |
5 | 0 | 0 | 1 | 1 | 1 | 3 |
6 | 1 | 0 | 0 | 0 | 0 | 1 |
7 | 0 | 1 | 1 | 1 | 1 | 4 |
8 | 0 | 0 | 0 | 0 | 0 | 0 |
9 | 1 | 0 | 0 | 0 | 0 | 1 |
10 | 0 | 0 | 0 | 0 | 0 | 0 |
11 | 0 | 0 | 0 | 0 | 0 | 0 |
2)Pensar em um modelo simples de ocorrência com dois parâmetros:
psi é a probabilidade de ocorrência, relativa aos locais (LINHAS);
p é a detecção (condicionada à ocorrência), relativa ao momento da amostragem (COLUNAS);
Faça uma somatória para as linhas, correspondendo ao número de detecções da espécie em cada localidade (coluna soma).
Quando a soma das observações em uma localidade é zero, ou seja a espécie não foi observada em nenhum dos tempos, o cálculo da verossimilhança é proporcional à probabilidade dela não ter sido detectada ou à probabilidade dela não ocorrer na área, definido nesse caso como:
probabilidade de não ser detectada + probabilidade de não ocorrer
=psi*((1-p)^5)+(1-psi)
Quando a soma das observações em uma localidade é maior que zero, ou seja a espécie foi observada em pelo menos uma das observações, o cálculo é proporcional à probabilidade de ocorrer na localidade e a probabilidade dela ser detectada o número de vezes em que foi (soma) e a probabilidade de não ser detectada o número de vezes que não foi (1-soma):
=psi*(p^soma)*((1-p)^(5-soma))
A somatória dos logarítmos desses valores, multiplicada por -1, é o valor de Log verossimilhança (LogLike).
Agora, calcule o valor de log verossimilhança para uma das possibilidades hipotéticas de estimativa dos parâmetros, por exemplo: psi=0.5 e p=0.3
O próximo passo é fazer o calculo do Loglike para combinações de valores de p e psi possíveis.
Crie uma outra tabela na mesma planilha onde a primeira linha contem os valores possíveis de psi e na primeira coluna os valores de p.
Faça agora para a primeira célula uma fórmula para o cálculo do LogLike para os valores que definem a primeira linha e a primeira coluna.
DICA: para que a fórmula seja depois estendida para as outra células, quando colocar na formula o p, utilize a indexação da posição dele com $ antes da letra da coluna ($B1), no caso do psi faça ao contrário fixe a linha (C$1).
Estenda a fórmula para toda a tabela. Confira o valor da posição psi=0.5 e p=0.3 para ver se é igual ao calculado da primeira parte do exercício. Caso contrário um dos dois cálculos apresenta problema.
Faça uma representação gráfica dos valores de verossimilhança encontrados para cada combinação de psi e p. Utilize a ferramenta de gráfico de superfície do R.
Veja o exemplo da aula na planilha ex1_loglike_alunos.xls
Para ver uma das formas de fazer esse script no R acesse
exercicio1.pdf.
Varie o conjunto hipotético de dados (tabela com 0 e 1) pensando em valores de psi e p e veja se sua intuição quanto ao valor de psi e p dos dados hipotéticos se aproxima à estimativa LogLike.