Ferramentas do usuário

Ferramentas do site


bie5782:00_mini_curso:start

Mini Curso

O objetivo desse mini-curso1) é apresentar aos alunos conceitos básicos sobre a linguagem e sua sintaxe. Esse mini-curso foi estruturado para atividades de 8 horas, divididas em dois dias. O primeiro dia é centrado na lógica do ambiente de programação em linha de comando (CLI: Command Line Interface) e o segundo dia na utilização de ferramentas avançadas através da interface gráfica Rcommander. Em grande parte, o material aqui apresentado é um recorte do material contido no nosso wiki EcoR

Professores

Monitores

Aula Relâmpago Há em nosso material algo que chamamos de Aula Relâmpago que é parte das atividades preparatórias do curso integral. Sugerimos que faça essa atividade após finalizar esse mini curso.

O repositório

O CRAN (The Comprehensive R Archive Network) é o repositório oficial do R. Lá encontrarão todo o material necessário para utilizar essa ferramente de análise e apresentação gráfica de dados. Nossa primeira atividade é navegar nesse repositório:

  • digite R CRAN no google e encontre a página oficial do R;
  • leia o Task Views 2) do Envirometrics;
  • usar Search > Rseek buscar 'square root' e 'pca';
  • em Packages buscar EcoVirtual e depois entrar na sua dependência RcmdrPlugin.EcoVirtual

Sintaxe e operações básica no R

A sintaxe básica do R é:

nomeobjeto <- nomedafuncao(argumento1, argumento2, argumento3, …)

Uma forma de ler essa linha de código é: estou atribundo ao objeto nomedoobjeto o resultado da função nomedafuncao com as seguintes configurações: argumento1, argumento2, …

Uma função executa uma tarefa ou conjunto de tarefas acopladas. Normalmente, mas não necessariamente, a função atua em um objeto de dados que é definido nos primeiros argumentos. Funções podem conter funções, rode o exemplo abaixo:

## função para construir sequencias
seq(from=0, to =100, by=10)

## para construir um gráfico!
plot(x=seq(from=0, to=100, by=10), y= seq(to=100, from =0, by=10)*5)

## note que podemos usar funções dentro de funções para construir os argumentos!

A tradução do código acima é:

  1. faça um sequencias de valores de 0 a 100 a intervalos regulares de 10 unidades;
  2. faça um gráfico onde os valores de x são uma sequência de valores que vão de 0 a 100 em intervalos de 10 e y é a mesma sequência onde cada valor foi multiplicado por 5

A última linha de código acima pode ser desmembrado da seguinte forma, tendo a mesma tradução, ou seja executando a mesma tarefa:

meux <- seq(from=0, to=100, by=10)
meuy <- seq(to=100, from =0, by=10)*5
plot(x=meux, y=meuy, pch=16)

Esse novo código podemos traduzir como: criar o ojbeto meux com uma sequência de valores de 0 a 100 com intervalos de 10; criar o objeto meuy com uma sequência de valores iguais a anterior multiplicado por 5; em seguida faça um gráfico com os valores de meux no eixo x e meuy no eixo y, representados no gráfico pelo simbolo 16 (circulo preenchido).

Para a inclusão dos argumentos na função há duas maneiras que podem ser combinadas:

  • colocar o nome dos argumentos, como feito acima;
  • usar os argumentos na ordem definida na função sem indicar o nome;
plot(meux, meuy)
  • usar ambos critérios:
plot(meux, pch=16, y = meuy)

Note que no último caso os argumentos nomeados não precisam estar na ordem definida na documentação da função. Sim, você deve estar perguntando Como raios vou saber a sequência dos argumentos de uma função . Simples OLHE O HELP

UM ERRO COMUM

Quando chamamos um função sem incluir o parênteses o que temos como resultado é que o R mostra o código da função, que nada mais é que um texto. Digite ls no console do R! O que aparece é o código da função ls()

Atribuições

Um conceito importante é o de atribuir o resultado de uma operação a um objeto. Para isso é necessário utilizar os símbolos de atribuição = ou <- . Retorne ao tópico acima e tente reconhecer quando um resultado de uma operação foi atribuído a um objeto e quando foi apenas retornado no console do R. Essa diferença é importante!

O que devo salvar?

Os usuários de programas padrões (editor de texto, planilhas eletrônicas, pacotes estatísticos) normalmente estão preocupados em salvar sua sessão de trabalho a todo momento com receio de perder algo. Para o bom usuário do R a sessão de trabalho no R não é o mais importante. Como trabalhamos no código ou script associado ao R e não diretamente nele, o código contém toda a sequencia de comandos que foram utilizados e portanto todo o nosso trabalho. O que o bom usuário do R deve se preocupar é em salvar o código e os dados. É só o que precisamos para reproduzir todo o trabalho de manipulação, análise e visualização de resultados.


O Código é Tudo!

Usuário Linux A instalação do R no LINUX não inclui uma interface como a do Windows ou do MAC, para que o usuário escolha a sua.

Há várias opções de editores e interfaces de desenvolvimento (IDEs), veja dicas e linques na seção de material de apoio.

Se você usa LINUX, pode seguir este tutorial com qualquer editor ou IDE.

Um dos primeiros hábitos que você deve adquirir para trabalhar com o R é não digitar os comandos diretamente na linha de comando, e sim em um arquivo texto, que chamamos de script ou código. Na interface R-GUI do Windows e do MAC há um editor de códigos, que você pode manter aberto, juntamente com a janela do R.

A figura abaixo é uma captura de tela do R-GUI do Windows, mas no MAC o editor é similar, e você pode manter a mesma lógica de uma janela de código aberta acima da janela do R:

Janelas do r e do script

Carregue para seu diretório de trabalho este script.

Execute o R e abra o script com a opção do menu “Arquivo/Abrir script”:

abra o arquivo de código

Vá para a janela do script, coloque o cursor na primeira linha e tecle Ctrl-r. O comando é enviado ao R. Faça o mesmo com as duas linhas seguintes.

Para Usuários de MAC Para enviar comandos do editor de código do R-GUI para o R utilize “Comand+Enter”.

Selecione as cinco primeiras linhas com o cursor e tecle Ctrl-r. Os comandos são enviados ao R.

CTRL-R envia comandos do script

Agora modifique os dados, alterando a segunda e terceira linhas do script para:

area <- c(300, 350, 961, 295, 332, 47,  122, 11, 53, 2749)
riqueza <- c(1, 7, 20, 7, 8, 4, 8, 3, 5, 23)

Salve o script com estas modificações.

Envie todo o script para o R. Você pode fazer isto de duas maneiras:
1. Na janela do editor de código, marque todo o script com “Ctrl-a” e depois envie-o para o R com “Ctrl-r”
OU
2. Na janela do R digite o comando:

source("regressao.r")

OBS: Este comando só funcionará se o arquivo regressao.r estiver no diretório de trabalho.
Por padrão, o source não mostra na tela nem os comandos executados nem seus resultados, mas todos os objetos foram criados. Verifique os objetos que foram criados por estes comandos no workspace do R:

ls()

Se você quiser ver todos os comandos e resultados use:

source( "regressao.r" , echo=TRUE , print.eval=TRUE )

Consulte a ajuda do comando source para entender os argumentos echo e print.eval.

Agora vamos simular a perda dos objetos: saia do R, respondendo “NÃO” à pergunta “Salvar Área de Trabalho”3).

Abra o R de novo. Tudo perdido? Não! Com o código salvo você pode executá-lo novamente, e recuperar todo o trabalho ;-).

Escolha seu Editor de Código

O editor de códigos do R-GUI no Windows e no Mac é bastante simples e costuma ser uma boa opção inicial para usuários deste sistema. Para esta disciplina ele é suficiente, mas logo que você se acostume com o R é bom buscar um editor ou ambiente integrado de programação com mais recursos.

No Linux não uma há uma GUI padrão para o R, e esta escolha já tem que ser feita de início.

Ou seja, mais cedo ou mais tarde você terá que avaliar as opções de editores de código ou ambientes de programação e escolher uma que lhe agrade.

Na página de material de apoio há uma seção com várias dicas sobre interfaces para o R para lhe ajudar.

3) não faça isto normalmente!!!, detalhes na apostila
· 2009/03/09 04:08

Você já aprendeu que o código é tudo!, mas o código comentado é ainda melhor!. Um ótimo hábito para quem está programando é comentar as linhas de códigos. Para iniciantes é interessante comentar todos os comandos, ajuda a fixar o que foi feito e ajuda muito quando estiver procurando algo que já fez parecido um dia. Para comentar linhas ou parte do código utilize o simbolo # como exemplificado no código abaixo:

#####################
## Código da primeira aula do mini-curso R 2015
#####################
##Tutorial
area <- c(303, 379, 961, 295, 332, 47,  122, 11, 53, 2749) # criando objeto com as áreas dos fragmentos
riqueza <- c(3, 10, 20, 7, 8, 4, 8, 3, 5, 23) # criando objeto com as riquezas associadas
area   # mostra os dados do objeto area criado acima
riqueza # mostra os dados do objeto riqueza criado acima
summary(area)  # cria um resumo dos dados contidos no objeto area
summary(riqueza)    # cria um resumo dos dados contidos no objeto riqueza
mean(x=area)     # calcula a média dos dados de area
varea <- var(area)  # calcula a variância dos dados de area e guarda no objeto varea
varea    # mostra a variância calculada acima
sqrt(varea)   # calcula a raiz quadrada do objeto varea 
sd(x=area)    # calcula o desvio padrão dos valores que estão no objeto area
plot(x=area, y=riqueza, xlab="Area (ha)", ylab="Número de Espécies")  # faz um gráfico do riqueza por área

## Fim!

A Melhor Maneira de Executar o R no Windows

Antes de começar um novo projeto de análise, crie um diretório para ele, com o menu “Arquivo/Novo/Pasta” do windows explorer.

crie um diretório de projeto

Em seguida execute o R a partir do atalho na área de trabalho ou na barra de ferramentas.

Verifique qual é o diretório de trabalho que o R está usando, com o comando:

getwd()

E você verá que ao abrir o R desta maneira ele sempre começará com um mesmo diretório de trabalho, possivelmente em “Meus Documentos”, e.g.:

[1] "C:/Documents and Settings/Administrador/Meus documentos"

Para mudar o diretório de trabalho use:

setwd("C:/Documents and Settings/Administrador/Meus documentos/temp1")

IMPORTANTE: as barras devem ser no padrão Linux, ou seja, o inverso do usado em Windows.

Verifique se mudança funcionou, com um novo comando getwd:

getwd()

Se seu diretório de trabalho é o desejado, verifique que está vazio, com o comando:

dir()

E também verifique se o workspace está vazio com

ls()

Agora baixe o arquivo letras.rdata para o diretório de trabalho, e carregue-o no workspace do R com o comando:

load("letras.rdata")

Verifique agora seu workspace, e salve-o:

ls()
save.image()

Crie alguns outros objetos em seu workspace:

pares <- c(2,4,6,8)
impares <- c(1,3,5,7,9)
todos.os.numeros <- c(pares,impares)

Agora saia do R, tomando o cuidado de salvar de novo seu workspace.

Para trabalhar novamente no mesmo projeto, abra o diretório correspondente com o Windows Explorer e clique no arquivo .RData:

clique no arquivo .RData

IMPORTANTE: certifique-se de que o diretório está com a opção de exibir arquivos ocultos, ou você não verá o arquivo .RData:

ligue exibição arquivos ocultos

Verifique se todos os objetos da última seção estão em seu workspace:

ls()

Outra solução é criar um atalho para o projeto, indicando o diretório de trabalho na caixa de propriedades do atalho:

atalho para o projeto

Você pode manter um atalho para cada projeto em andamento em sua área de trabalho.

Para Usuários de LINUX

Em LINUX não há estes problemas, pois basta executar o R na linha de comando (shell) a partir do diretório de trabalho (veja na apostila).

Com o uso de editores de código fica ainda mais fácil, consulte o guia que há em nosso material de apoio.

· 2009/03/09 04:08

Socorro

A primeira resposta ao aluno que perguntar algo é: Você olhou a documentação do help?. O usuário do R adora mostrar o que sabe e ajudar os iniciantes, mas isso não é o melhor caminho para aprender. Queremos ajudá-lo a resolver os problemas quando encontrá-los e para isso vamos indicar os caminhos e cabe ao aluno exercitá-los. A documentação do R, em um primeiro momento, é árida e muitas vezes difícil de entender. Leia com atenção, as respostas estão lá! Entretanto, é preciso familiaridade com a terminologia e um pouco de intimidade com a linguagem. Isso, só se adquire praticando!

Crie o bom hábito de ler a documentação de todas as funções que utilizar, SEMPRE LEIA O HELP!

help

Vamos olhar a documentação das funções que usamos acima. Há dois jeitos de fazê-lo, usando a função help(“nomedafunção”) ou o atalho ?”nomedafunção”

help(c)
## a função c é uma das mais usadas, serve para concatenar valores em um objeto. 

?source

Encontrando as funções

Para acessar o help é necessário saber o nome da função. Caso não tenha ideia do nome de uma função básica, por exemplo, a raiz quadrada, a melhor opção é usar o RCard (R Reference Card), a segunda é buscar no google, como a letra R é pouco informativa use combinada com “R language” ou “R CRAN”

help.start

A função help.start abre a página de help do programa no seu navegador. Nela encontrará toda a documentação que é instalada junto com o R, além das funções dos pacotes que foram instalados na sua máquina. Para inicia-lo digite

## abrindo a ajuda do R no navegador
help.start()

Atividade

  • Procure pelo pacote graphics e entre nos tópicos graphics-package e plot;
  • Procure o pacote sudoku;
  • Vá no site do CRAN e

Instalando e carregando pacotes

Existem mais de 7 mil pacotes no R-CRAN, Você já viu como buscá-los no repositório. Agora vamos entender dois conceitos básico na linguagem que muita gente confude: instalar e carregar. Para usar as ferramentas (geralmente funções) de um pacote é preciso antes que ele esteja no seu computador instalado. Para isso usamos a função install.packages(). Para usar um pacote instalado é necessário carregá-lo na sua sessão do R usando a função library().

Pacotes

Pacotes são conjuntos de funcionalidades (funções e dados) distribuídos em conjunto para realizar tarefas específicas. Por exemplo, o pacotes vegan carrega na sua área de trabalho (deixa disponível para uso) um conjunto de ferramentas para análises de dados de ecologia de comunidade. Para usar os pacotes disponíveis no R 4) é necessário entender as diferenças entre baixar (download) o pacote do repositório e carregar em sua área de trabalho. Para baixar algum pacote disponível no repositório CRAN do R é necessário utilizar o comando install.packages() com o nome do pacote entre ”” dentro do parenteses5).

install.packages("vegan")

Outra forma é usar o menu da interface gráfica e selecionar . Siga as instruções: (1) selecione o repositório mais próximo (p.ex: Brazil(SP1)) e em seguida navegue na barra de pacotes e selecione o que deseja. Se não houver nenhuma mensagem de erro, significa que o download do pacote foi realizado com sucesso.

Caso o pacote esteja instalado ele aparecerá entre os hiperlinks da página de ajuda hipertexto da função help.start(). Entre na página do pacote e navegue pelas opções e funções que forem de seu interesse. Escolha uma função (decorana) e em seguida tente apresentar o ajuda dela pelo R:

help.start()
help(decorana)

A mensagem (ou algo similar): “No documentation for ‘decorana’ in specified packages and libraries…”, significa que a sua sessão do R não encontrou a documentação referente a função, apesar do pacote estar instalado em nosso computador. Isso aconteceu porque não carregamos a função em nossa área de trabalho, para cada projeto, precisamos carregar aqueles pacotes que vamos necessitar (normalmente nas primeiras linhas de comando do nosso código):

library(vegan)

example(vegan)

Podemos imaginar a nossa sessão do R como uma bancada de trabalho em uma oficina, cercada por vários armários que contém as ferramentas que precisamos para realizar uma tarefa. Dependendo da tarefa que vamos realizar (arrumar uma moto, construir uma cadeira…) abrimos os armários que contem as ferramentas necessárias à tarefa desejada e apenas esses (função library()). Caso não tenhamos as ferramentas necessárias para uma tarefa específica (consertar um relógio), precisamos ir na loja de ferramentas (repositório) e comprar conjunto de ferramentas de relojoeiro (função install.packates(“watch”) que vem em um armário que colocamos ao lado dos outros em nossa oficina.

4) “Currently, the CRAN package repository features 5217 available packages.” — Alexandre Adalardo de Oliveira 2014/02/17 14:31
5) a princípio todas as palavras que escrevemos sem aspas no R ele busca como sendo objetos presentes em nossa área de trabalho ou pacotes carregados ou instalados
· 2009/03/06 18:41

Operações Matemáticas

As operações matemáticas simples são apresentadas abaixo, reproduza os comandos para se familiarizar com o código:

4+5
4*5
2/4
2^4

As regras de precedência são as mesmas da aritmética básica:

2 + 4 * 5
(2 + 4) * 5
2 + 2^2 * 5
(2 + 2)^2 * 5

## tente fazer a operação abaixo em uma calculadora!!

1 - (1 + 10^(-15))

Operações matemáticas comuns

sqrt(9)   # Raiz Quadrada
abs(-1)  # Módulo ou valor absoluto
abs(1)
log(10)   # Logaritmo natural ou neperiano
log(10, base = 10) # Logaritmo base 10
log10(10)   # Também logaritmo de base 10
log(10, base = 3.4076) # Logaritmo base 3.4076
exp(1)       # Exponencial

Operações com Vetores

Estude os resultados dos comandos nos três exemplos abaixo, para entender as operações com vetores.

a <- 1:10
b <- -(1:10)
sum(a+b)
a <- seq(from=0, to=1, length = 9)
b <- seq(from=0, to=0.5, length = 9)
a/b
b/a
1+b/a
(1+b)/a
a <- rep( c(1,2), each=3 )
b <- rep( c(3,4), 6)
a+b

Gerando dados

Vimos que a função c() serve para concatenar valores em um objeto. Vamos usá-la para gerar alguns objetos e introduzir a função ls() que lista todos os objetos criados na nossa sessão até o momento:

A1 <- c(1,2,3)
A2 <- c(10,20,30)
b <- c(A1,A2)
ls()

Consulte a página de ajuda da função ls:

help(ls)

Onde você verá a explicação para o argumento pattern. Execute, então, este comando:

ls(pattern="A")

Para mudar os nomes de objetos e apagar os antigos, experimente:

a.1 <- A1
a.2 <- A2
ls()
rm( list=c("A1","A2") )
ls()

Que tem o mesmo efeito de:

rm(list=ls(pattern="A"))

Ou de

rm(A1,A2)

Verifique!

Criando sequencias de valores

Uma das vantagens da linguagem R é que ela opera em vectores, como vimos acima nas funções matemáticas. Para gerar sequencias de valores podemos usar o c(), mas existem outras funções básicas para agilizar a geração de sequências. Execute as linhas de código abaixo e veja a documentação relacionada a cada função:

1:10
(1:10) * 10

seq(from=0, to=100, by=10)
seq(from=0, to=100, len=10)

rep("A", times=10)
rep(c("A", "B", "C"), times=10)
rep(c("A", "B", "C"), each=10)

## nao criamos nenhum objeto até agora!
## vamos guardar a próxima sequência em um objeto:

seqABC <- rep(c("A", "B", "C"), times=c(2,3,5))
seqABC

paste(seqABC, 1:4, sep="_")

Entendeu essa última função? Veja a documentação do paste().

Lógica vetorial

Vetores são a estrutura básica do R, procure sempre raciocinar em vetores e operações vetorias. Por exemplo, para calcular 2 elevado a expoentes de 0 a 10, a lógica de operação escalar é :

2^0
2^1
2^2 
2^3
...

A lógica da operação vetorial é:

2^(0:10)

ou

2^seq(from=0,to=10, by=1)

Tipos de vetores

Já fizemos vetores de duas naturezas: numéricos e caracteres. A diferença entre os dois é que o numérico podemos operar matematicamente, caracteres apenas manipular com funções específicas para isso. Veja o código abaixo e veja se entende o que acontece:

Classes Date

Crie objetos com a datas do tri e tetracampeonatos mundiais do Brasil6):

copa.70 <- "21/06/70"
copa.94 <- "17/07/94" 

Qual a diferença em dias entre estas datas? A subtração retorna um erro (verifique):

copa.94 - copa.70

Isto acontece porque os objetos são caracteres, uma classe que obviamente não permite operações aritméticas:

class(copa.70)
class(copa.94)

Mas o R tem uma classe para datas, que é Date. Faça a coerção dos objetos para esta classe, verifique se a coerção foi bem sucedida, e repita a subtração:

copa.70 <- as.Date(copa.70,format="%d/%m/%y")
copa.94 <- as.Date(copa.94,format="%d/%m/%y")
class(copa.70)
class(copa.94)
copa.94 - copa.70

NOTA: o argumento format da função as.Date informa o formato em que está o conjunto de caracteres que deve ser transformado em data, no caso dia/mês/ano (%d/%m/%y), todos com dois algarismos. Veja a ajuda da função para outros formatos.

6) fonte: FIFA
· 2009/03/09 04:08

numbers, integers, characters & as.Date

Além dos vetores

Além dos vetores, outros tipos de objetos são muito utilizados no R, os mais importantes são: (1) matrizes; (2) data frames e (3) listas. As funções para criar esses objetos são: matrix(), data.frame() e list(). Matrizes e data frames são estruturas retangulares de dados, a diferença entre elas é que matriz só recebe um tipo de natureza de dados (números, caracteres, ou vetor lógico que veremos mais a frente). A lista pode acomodar qualquer natureza de dados em diferentes formas.

Veja o código abaixo para entender esses objetos:

a=1:5
a
b=factor(rep(c("a","b","c"), each=3))
b
c=data.frame(sec=c("XIX", "XX", "XXI"),inicio=c(1801,1901,2001))
c
d = matrix(round(runif(36,0,6)),ncol=8)
d
minha.lista = list(um.vetor=a, um.fator=b, um.data.frame=c, uma.matriz= d)
minha.lista

Atributos dos objetos

Os objetos possuem atributos, dois deles já vimos: (1) a classe a que pertence e (2) a natureza das variáveis que o compõem.

Estrutura de um objeto

Essa é uma das funções mais importantes para diagnosticar um objeto. Fornece informações importantes sobre sua estruturação. Antes de rodar o código abaixo, verifique se os objetos estão na sua área de trabalho.

## verficando se quais objetos estão presentes na área de trabalho:

ls()

## verificando a estrutura dos objetos

str(minha.lista)
str(minha.lista$um.data.frame)
str(d)

Dimensões de um objeto

As dimensões de um objeto são um atributo importante. Nos indica quanta informação está contida e como esta estruturada. Ela é fornecida pela str(), mas pode ser acessada pelas funções length() e dim().

length(b)
length(minha.lista)
dim(minha.lista$um.data.frame)


Extraindo e Modificando

Para modificar algum elemento de um objeto, use a lógica visualizar & modificar. Primeiro visualize o elemento, certificando-se que é ele que deseja modificar ou remover. O mesmo código para visualizar é utilizado em associação à atribuição ( = < - ) para modificar o elemento desejado.

Indexadores

O indexadores definem a posição de um elemento em um objeto e a forma de usá-los depende da classe de objeto que pretende manipular.

########################
## Indexacao "[]" &  "$"
########################
x=LETTERS[1:6]
x
x[1]
x[1:3]
x[c(1,1,3,5)]
x[-2]
x[-c(2,4)]

### INDEXAÇÃO COM LÓGICA #####
ALTURA=c(1.85, 1.78, 1.92, 1.63, 1.81, 1.55)
ALTURA
SEXO = factor(rep(c("M","F"),each=3))
SEXO
PESO <- c(80, 100, 115,  70,  65,  50)
PESO

## OPERAÇÕES LÓGICAS
ALTURA >= 1.8
SEXO=="M"

homens.altos <- (ALTURA > 1.8) & (SEXO=="M")
homens.altos

PESO[homens.altos]


### ALTERANDO SUCONJUNTOS ######

ALTURA
ALTURA > 1.8
ALTURA[ALTURA > 1.80]
ALTURA[ALTURA > 1.80] <- c(1.86, 1.93, 1.82)
ALTURA

### CRIANDO UM DATA FRAME ######

pessoas <- data.frame(alt = ALTURA, sex = SEXO) 
pessoas
pessoas$peso
pessoas$peso <- c(80, 100, 115,  70,  65,  50)
pessoas
pessoas$peso[2]
pessoas[2, 3]
pessoas[, "sex"]
pessoas[c(1, 4, 5), "alt"]

Lendo dados e salvando resultados

read.table

A melhor forma de ler um arquivo de dados é tranformá-lo em arquivo texto onde os campos são separados por algum caractere, o mais comum é virgula e ponto-virgula (.csv); ou tabulação (.txt). Um cuidado que precisamos ter ao ler arquivos é com relação ao simbolo de decimal. Em português, usamos a virgula, o que pode confundir com a separação de caractere do arquivo .csv e portanto precisa ser informado à função read.table.

Veja os principais opções de argumentos da função read.table:

argumento estado significado
header TRUE primeira linha é nome das variáveis
sep “\t” separador tabulação
sep ” ” separador espaço
sep ”;” separador ponto-virgula
dec ”.” simbolo ponto
dec ”,” simbolo vírgula
as.is TRUE não transforma variável em fator

Exercício

  • Salve o arquivo Conjunto de Dados: Insetos galhadores (Simulação) no seu diretório de trabalho;
  • Abra-o no Excel;
  • Salve como texto, separado por tabulação;
  • Leia o arquivo com read.table e guarde no objeto galha;
  • Verifique se a estrutura de galha está correta.

Salvando dados

Para salvar um conjunto de dados há dois formatos básicos no R. Podemos salvar o arquivo como texto, usando a função write.table ou como arquivo de dados do R usando a função save. Esse último tem o formato .RData e a desvantagem de não poder se lido em outro programa. A vantagem do .RData é que pode guardar estruturas complexas de de dados e resultados, inclusive salvar todos os objetos de uma área de trabalho.

Exercício

  • Verifique os objetos presentes na sua área de trabalho usando a função ls();
  • Confirme que há o objeto chamado pessoas, caso não haja retorne ao tópico extraindo_e_modificando para recriá-lo;
  • salve o objeto com a função save, consulte o help para entender os argumentos:
save(pessoas, file="pessoas.RData")
  • tente abrir o aquivo criado
  • faça o mesmo usando o write.table e crie o arquivo pessoas.csv, separado por tabulação e sem nome de linhas 7)
  • abra esse arquivo no Excel

save.image

Para salvar todos os objetos de sua área de trabalho, use a função save.image.

  • salve seu código do script no arquivo codeAula1.r;
  • salve todos os objetos da sua área de trabalho no arquivo minicurso1.RData;
  • * remova todos os objetos da sua área de trabalho;
rm(list = ls())
  • feche o R;
  • abra o R pelo arquivo criado acima minicurso.RData;
  • verifique que objetos existem na área de trabalho;
  • feche novamente o R;
  • abra o seu script codeAula1.r em uma sessão vazia do R;
  • rode todo o script acima na sessão do R;
  • verifique os objetos da sua área de trabalho;

Não se perca!

Respire fundo!
Sabemos que é muita coisa para aprender no mesmo dia.
É preciso praticar!

Cada um dos tópicos que vimos até aqui está explicado em mais detalhes no material do curso. Para cada um deles temos um tutorial, um capítulo da apostila online e um série de exercícios. Uma boa estratégia é estudar os tópicos utilizando a sequência: tutorial, apostila e exercício!

Vamos revisar alguns conceitos visto até agora. Agora é com o professor!

Manipulando dados

Funções para usar funções

Uma maneira inteligente de usar o R é automatizar tarefas usando as funções que executam outras funções nos dados, dependendo da classe do objeto. A família de funções apply opera dessa forma. Vamos testá-la, usando o data frame pessoas. Siga o script abaixo tentando entender cada passo, comente seu código, além dos comentários já incluídos para lembrar do que as funções fazem. Lembre-se sempre olhe a documentação das funções no help.

#################
## familia apply
#################

ls()
str(pessoas)

#altura media  por sexo
tapply(X = pessoas$alt, INDEX= pessoas$sex, FUN= mean)
tapply(X = pessoas$alt, INDEX= pessoas$sex, FUN= sd)
## quantos homens e mulheres?
table(pessoas$sex)
table(pessoas$sex, pessoas$alt>1.70)
## qual a media de altura e peso (independente do sexo)
apply(pessoas[,c(1,3)], 2, mean)

## e essa ultima?
aggregate(x = pessoas[,c(1,3)], by = list(pessoas$sex), FUN = mean)
## veja o help da funcao


Gráficos

O R é muito bom para fazer gráficos, aqui vamos apresentar algumas funcionalidade do pacote básico graphics. Existem outros pacotes que produzem gráficos mais refinados por padrão, porém, quase tudo pode ser feito apenas com as funções do pacote gráfico. Três conceitos são importantes para controlar e formatar o seu gráfico: funções de alto nível, funções subordinadas e parâmetros gráficos . Existem várias opções de pacotes para a elaboração de gráficos no R. Aqui vamos apresentar a lógica do pacote graphics que é carregado automaticamente na sessão do R. Outros pacotes como grid, latice e ggplot2 estão presentes na distribuição de instalação do R, mas não são carregados automaticamente. Apesar de ser um pacote de funções básicas é possível fazer gráficos muito elaborados apenas usando as ferramentas contidas no graphics. Três elementos são importantes para entender a lógica do graphics: (1) funções de alto nível; (2) funções subordinadas e (3) parâmetros graficos.

Funções de alto nível

As funções de auto nível são responsáveis pela estruturação básica de um gráfico, abrem o dispositivo de apresentação (a janela gráfica) e constroem os elementos básicos do gráfico. As funções subordinadas incluem elementos em um gráfico ativo. Veja a diferença rodando o código abaixo:

#############################
## graficos
## funcoes de alto nivel: abrem o dispositivo de tela 
example(plot)
example(contour)
example(hclust)
### demos
demo(image)
demo(persp)
#########################
## funcoes subordinadas
example(points)
example(segments)
example(rect)
example(axis)
example(colors)
####################

Parâmetros do dispositivo gráficos

Os parâmetros do dispositivo gráfico por sua vez muda a estrutura do dispositivo gráfico antes de abrí-lo. Deve ser usado antes rodar uma função gráfica de alto nível. Para interagir com os parâmetros gráficos utilizamos a função par(). Veja o help dessa função:

?par

UM GRÁFICO

Vamos usar o código de um gráfico 8) para entender como elaborar um gráfico no R. Primeiro, vamos mudar os parâmetros do gráfico antes de iniciar, mudamos cada parâmetro em um linha para que possa buscar no help informações para entender o que o parâmetro significa e completar os comentários em cada linha.

########## dados ####################
riqueza <- c(15,18,22,24,25,30,31,34,37,39,41,45)
area <- c(2,4.5,6,10,30,34,50,56,60,77.5,80,85)
box <- c(10,13,12,14,15,12,14,15,20,23,22,21,26,27,28,25)
z <- c(50,42,33,29,25,19,17,15,10,11,8,9)
samples <- rep(1:4,each=4)
model <- lm(riqueza~area)
model1 <- glm(z~area, poisson)
######################################
# mudando parametros do grafico
par(mfrow=c(2,1)) # divide o dispositivo grafico em paineis: duas linhas e uma coluna
par(mar=c(3,5,2,2)) # complete aqui o que esse comando significa
par(cex.axis=1.3) # ... 
par(cex.lab=1.5) # ...
par(family="serif") # ...
par(las=1) # ...
par(tcl=0.3) # ...
par(mgp=c(2,0.3,0)) # ...
par(bty="u") # ...

Siga fazendo o gráfico utilizando o código abaixo procurando entender cada função e argumento utilizado. Comente as linhas.

plot(riqueza~area, xlab="Area (ha)", ylab="Riqueza de especies\n de aves", cex=1.5, pch=16,  ylim=c(8, 50), xaxp=c(0,100,4), col="firebrick3")
text(10,50, "a", cex=1.8)
abline(model, lwd=1.5,col="firebrick3")
#par(new=TRUE)
points(z~area, cex=1.5, pch=17, col="mediumblue")  
axis(4)
xv<-seq(0,100,0.2)
yv<-exp(predict(model1,list(area=xv)))
lines(xv,yv, lwd=1.5, lty=2, col="mediumblue")

Interação com o gráfico

Algumas 9) funções são interativas. A funcao locator retorna as coordenadas cartesianas da posição do cursor do mouse quando o botão é apertado. Note que o R fica esperando que esse evento ocorra e ele deve acontecer no painel ativo da janela gráfica no espaço entre os eixos x e y. Vamos utilizá-la para colocar uma legenda na janela ativa do gráfico.

xy <- locator(1)

## clique em uma posicao no espaco entre os  eixos x e y do painel ativo

legend(xy, legend=c("sub-bosque", "matriz"), pch=c(16, 17), col=c("firebrick3","mediumblue") , bty="n")

Vamos continuar o gráfico, agora passando para o segundo painel da janela. Isso ocorre automaticamente quando utilizarmos uma função de auto nível. Antes disso, vamos mudar os parâmetros desse novo painel usando a função par.

Comente o código Para fixar e facilitar quando estiver procurando algum dos comandos utilizados nessa atividade para a construção do seu próprio gráfico, comente as linhas de código!

par(mar=c(5,5,0.5,2))
par(bty="l")
boxplot(box~samples,names= c("", "", "", ""),col="grey")
mtext(c("Tipo 1", "Tipo 2", "Tipo 3", "Tipo 4"),side= 1,cex=1.3,line=0.3,at=c(1,2,3,4))
mtext("Diversidade genética", side=2, cex=1.5, line=2.5, las=0)
mtext("Morfotipo", side=1, cex=1.7, line=3)
text(0.7,28, "b", cex=1.8)


Modelos Lineares

############################
##### lm() ANOVA
############################
## dados
## producao agricula em diferentes tipos de solo
are=c(6,10,8,6,14,17,9,11,7,11) # solo arenoso
arg=c(17,15,3,11,14,12,12,8,10,13) # solo argiloso
hum=c(13,16,9,12,15,16,17,13,18,14) # solo humico
planta=c(are,arg,hum) # juntando os dados
#### criando um fator que representa os solos ###
fator.solo=as.factor(rep(c("are", "arg", "hum"),each=10))
############################
aov.solo<-aov(planta~fator.solo) # funcao para fazer uma anova (aov)
summary(aov.solo)
### mesmo modelo usando o lm()
lm.solo<-lm(planta~fator.solo)
summary(lm.solo)
anova(lm.solo) ## funcao para calcular a tabela de anova do modelo
##################################
##### regressao linear
##################################
library(MASS) # carrega o pacote MASS
data(Animals) # ativa os dado Animals do pacote MASS
str(Animals) # 28 observacoes de tamanho do corpo e peso do cerebro de diferentes animais
plot(brain~body,data=Animals)
## parece nao haver relacao!
plot(brain~body,data=Animals, log="xy")
## agora sim! 
plot(log(brain) ~ log(body), data = Animals)
### criando um modelo de log(brain) ~ log(body)
anim.m1 <- lm(log(brain)~log(body),data=Animals)
## colocando a linha do modelo no grafico dos dados
abline(anim.m1, col="red")
## resultados do modelo
summary(anim.m1)
1) criado por — Alexandre Adalardo de Oliveira 2015/10/05 para o mini-curso da semana temática da biologia - IBUSP
2) menu da barra à esquerda da página
7) veja o help!
8) autoria de Cristina Banks
9) poucas no pacote graphics
/home/bie5782/www/data/pages/bie5782/00_mini_curso/start.txt · Última modificação: 2015/10/07 11:30 por adalardo