Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior |
mod1:mat_apoio:class [2010/08/31 15:22] – Links to mod1:restr:euclid changed to mod1:mat_apoio:euclid adalardo | mod1:mat_apoio:class [2024/01/11 15:21] (atual) – edição externa 127.0.0.1 |
---|
====== Classificação ====== | ====== Classificação ====== |
{{:mod1:restr:class2.jpeg?150 |}}Os métodos de classificação agrupam as parcelas conforme a similaridade na composição em grupos. Isso pode ser muito interessante para verificarmos se há conjuntos discretos de objetos, no nosso caso parcelas. Para tanto precisamos primeiro calcular um índice que nos diga o quanto cada parcela é similar as outras. A primeira parte desse exercicio é como calcular medidas de distância e similaridade na nossa amostra em seguida usamos um método de agrupamento dessas parcelas para finalmente apresentar os dados graficamente em um dendrograma. | {{:mod1:mat_apoio:class2.jpeg?200 |}}Os métodos de classificação agrupam as parcelas conforme a similaridade na composição em grupos. Isso pode ser muito interessante para verificarmos se há conjuntos discretos de objetos, no nosso caso parcelas. Para tanto precisamos primeiro calcular um índice que nos diga o quanto cada parcela é similar as outras. A primeira parte desse exercicio é como calcular medidas de distância e similaridade na nossa amostra em seguida usamos um método de agrupamento dessas parcelas para finalmente apresentar os dados graficamente em um dendrograma. |
| |
====== Similaridade & Distância ====== | ====== Similaridade & Distância ====== |
{{:mod1:restr:similaridade.jpg?200 |}} | {{:mod1:mat_apoio:similaridade.jpg?200 |}} |
Existem uma infinidade de índices utilizados na ecologia para medir a similaridade ou dissimilaridade (distância) entre objetos. Para a comparação entre parcelas podemos ter normalmente dois tipos de dados referentes às espécies: presença ou abundância. Quando a natureza da informação é apenas a presença fazemos uso de indices quantitativos, o mais intuitivo é o de **Jaccard**, que nos diz a proporção de espécies que é compartilhada pelas parcelas. | Existem uma infinidade de índices utilizados na ecologia para medir a similaridade ou dissimilaridade (distância) entre objetos. Para a comparação entre parcelas podemos ter normalmente dois tipos de dados referentes às espécies: presença ou abundância. Quando a natureza da informação é apenas a presença fazemos uso de indices quantitativos, o mais intuitivo é o de **Jaccard**, que nos diz a proporção de espécies que é compartilhada pelas parcelas. |
| |
| |
===== Comparando Abundâncias ===== | ===== Comparando Abundâncias ===== |
{{:mod1:restr:abundanciaarv.jpeg?150 |}}Quando queremos comparar não só a presença qualitativa das espécies, mas suas abundâncias precisamos usar um índice quantitativo. Uma das maneiras de pensar nesses indices é pela medida de distância, ou seja pelo quanto uma parcela se diferencia da outra medida pela diferença entre as abundâncias das espécies. Caso esteja interessado veja a explicação da [[mod1:mat_apoio::euclid|distância euclidiana]] que é bastante intuitiva geometricamente. No nosso caso vamos usar um índice conhecido como Bray-Curtis. | {{:mod1:mat_apoio:abundanciaarv.jpeg?200 |}}Quando queremos comparar não só a presença qualitativa das espécies, mas suas abundâncias precisamos usar um índice quantitativo. Uma das maneiras de pensar nesses indices é pela medida de distância, ou seja pelo quanto uma parcela se diferencia da outra medida pela diferença entre as abundâncias das espécies. Caso esteja interessado veja a explicação da [[mod1:mat_apoio::euclid|distância euclidiana]] que é bastante intuitiva geometricamente. No nosso caso vamos usar um índice conhecido como Bray-Curtis. |
sendo: | sendo: |
| |
Consegue identificar padrões nesses dados? | Consegue identificar padrões nesses dados? |
Faça o mesmo para a comunidade discreta, mas guarde o resultado em um objeto de nome //sim.disc1//. | Faça o mesmo para a comunidade discreta, mas guarde o resultado em um objeto de nome //sim.disc1//. |
Chegamos nas matrizes de similiaridades, o primeiro passo da | Chegamos nas matrizes de similiaridades, o primeiro passo da nossa classificação. |
| |
| |
===== Agrupamento ===== | ===== Agrupamento ===== |
{{:mod1:restr:clusterbaloon.jpeg?150 |}}Há vários métodos e algorítmos(([[http://pt.wikipedia.org/wiki/Algoritmo]])) para agrupar os objetos em uma análise de classificação. Primeiro precisamos decidir se queremos iniciar juntando os elementos (aglomerativa) ou se queremos tomar todo o conjunto de objetos e ir separando em grupos (divisiva). No nosso caso vamos iniciar com as parcela como unidades e vamos montando grupos sucessivamente a partir daqueles já formados. Isso se chama análise de classificação (ou agrupamento) hierarquica aglomerativa. Apesar do nome feio, não há nada de complicado na lógica da análise. Vamos acompanhar passo a passo. | {{:mod1:mat_apoio:clusterbaloon.jpeg?150 |}}Há vários métodos e algorítmos(([[http://pt.wikipedia.org/wiki/Algoritmo]])) para agrupar os objetos em uma análise de classificação. Primeiro precisamos decidir se queremos iniciar juntando os elementos (aglomerativa) ou se queremos tomar todo o conjunto de objetos e ir separando em grupos (divisiva). No nosso caso vamos iniciar com as parcela como unidades e vamos montando grupos sucessivamente a partir daqueles já formados. Isso se chama análise de classificação (ou agrupamento) hierarquica aglomerativa. Apesar do nome feio, não há nada de complicado na lógica da análise. Vamos acompanhar passo a passo. |
| |
*1. Vamos procurar entre os pares de parcelas, aquela que tem mais similaridade | *1. Vamos procurar entre os pares de parcelas, aquela que tem mais similaridade |
| |
max(sim.cont1) | max(sim.cont1) |
sim.cont1==max(sim.cont1) | sim.cont1==max(sim.cont1) |
| |
==== Primeira Ligação ==== | ==== Primeira Ligação ==== |
{{:mod1:restr:firstcall.jpeg?150 |}} | {{:mod1:mat_apoio:firstcall.jpeg?150 |}} |
Vamos agora procurar o maior valor e depois saber qual o par de parcelas que apresenta essa similiaridade: | Vamos agora procurar o maior valor e depois saber qual o par de parcelas que apresenta essa similiaridade: |
max1=max(sim.cont1,na.rm=TRUE) | max1=max(sim.cont1,na.rm=TRUE) |
Agora temos que tomar uma outra decisão: como esse grupo agora formado irá se ligar aos outras parcelas? | Agora temos que tomar uma outra decisão: como esse grupo agora formado irá se ligar aos outras parcelas? |
Podemos decidir que ele irá se ligar aos outros pelo valor da máxima similaridade de seus componentes (ligação máxima), ou pela minima. Vamos usar a média do grupo: | Podemos decidir que ele irá se ligar aos outros pelo valor da máxima similaridade de seus componentes (ligação máxima), ou pela minima. Vamos usar a média do grupo: |
g1.n1=strsplit(nome.par[maior1[1,2]]," ")[[mod1:restr:1]][2] | g1.n1=strsplit(nome.par[maior1[1,2]]," ")[[1]][2] |
g1.n2=strsplit(nome.par[maior1[1,1]]," ")[[mod1:restr:1]][2] | g1.n2=strsplit(nome.par[maior1[1,1]]," ")[[1]][2] |
g1.nome=paste("g", paste(g1.n1,g1.n2, sep=",")) | g1.nome=paste("g", paste(g1.n1,g1.n2, sep=",")) |
g1.nome | g1.nome |
maior2=which(grupo1==max(grupo1,na.rm=TRUE), arr.ind=TRUE) | maior2=which(grupo1==max(grupo1,na.rm=TRUE), arr.ind=TRUE) |
maior2 | maior2 |
g2.n1=strsplit(rownames(grupo1)[maior2[1,2]]," ")[[mod1:restr:1]][2] | g2.n1=strsplit(rownames(grupo1)[maior2[1,2]]," ")[[1]][2] |
g2.n2=strsplit(rownames(grupo1)[maior2[1,1]]," ")[[mod1:restr:1]][2] | g2.n2=strsplit(rownames(grupo1)[maior2[1,1]]," ")[[1]][2] |
g2.nome=paste(paste("g",g2.n1,sep="_"),g2.n2, sep=",") | g2.nome=paste(paste("g",g2.n1,sep="_"),g2.n2, sep=",") |
g2.nome | g2.nome |
maior3=which(grupo2==max(grupo2,na.rm=TRUE), arr.ind=TRUE) | maior3=which(grupo2==max(grupo2,na.rm=TRUE), arr.ind=TRUE) |
maior3 | maior3 |
g3.n1=strsplit(rownames(grupo2)[maior3[1,2]]," ")[[mod1:restr:1]][2] | g3.n1=strsplit(rownames(grupo2)[maior3[1,2]]," ")[[1]][2] |
g3.n2=strsplit(rownames(grupo2)[maior3[1,1]]," ")[[mod1:restr:1]][2] | g3.n2=strsplit(rownames(grupo2)[maior3[1,1]]," ")[[1]][2] |
g3.nome=paste(paste("g",g3.n1,sep="_"),g3.n2, sep=",") | g3.nome=paste(paste("g",g3.n1,sep="_"),g3.n2, sep=",") |
g3.nome | g3.nome |
| |
==== Agora é só você... ==== | ==== Agora é só você... ==== |
{{:mod1:restr:abundasarney.jpeg?120 |}} | {{:mod1:mat_apoio:abundasarney.jpeg?200 |}} |
| |
Agora é por sua conta. Vamos usar as suas comunidades virtuais para ver como elas são classificadas. Abaixo apresentamos o código básico a seguir. Onde está escrito "minha.com" deve colocar o nome do objeto onde guardou a amostra da sua comunidade virtual contínua e discreta. Troque também os nomes que tenha **"*. minha"** para guardar os resultados, note que esses nomes de objetos não devem ter " ", enquanto alguns argumentos necessariamente precisam. | Agora é por sua conta. Vamos usar as suas comunidades virtuais para ver como elas são classificadas. Abaixo apresentamos o código básico a seguir. Onde está escrito "minha.com" deve colocar o nome do objeto onde guardou a amostra da sua comunidade virtual contínua e discreta. Troque também os nomes que tenha **"*. minha"** para guardar os resultados, note que esses nomes de objetos não devem ter " ", enquanto alguns argumentos necessariamente precisam. |