Exercícios de Leitura e Manipulação de Dados
Distância entre cidades
Releia1) o tópico sobre matrizes na seção sobre entrada de dados da apostila online.
Abaixo as distâncias por estradas entre quatro cidades da Europa, em quilômetros:
Atenas a Madri: 3949
Atenas a Paris: 3000
Atenas a Estocolmo: 3927
Madri a Paris: 1273
Madri a Estocolomo: 3188
Paris a Estocolmo: 1827
Construa uma matriz de distâncias com esses valores.
Compare sua matriz com o objeto eurodist
, disponível no pacote datasets
.
DICA: as funções lower.tri
, upper.tri
e diag
podem lhe ajudar.
Criação de um data frame
Imagine um experimento em que hamsters de dois fenótipos (claros e escuros) recebem três tipos diferentes de dieta, e no qual as diferenças dos pesos (g) entre o fim e o início do experimento sejam:
| DIETA A | DIETA B | DIETA C |
CLAROS | 0.1 , 1.1 , 3.7 | 5.7, -1.2, -1.5 | 3.0, -0.4, 0.6 |
ESCUROS | 1.5, -0.1, 2.0 | 0.6, -3.0, -0.3 | -0.2, 0.3, 1.5 |
Crie um data frame com esses dados, na qual cada hamster seja uma linha, e as colunas sejam as variáveis cor, dieta e variação do peso.
Qual a media por dieta e por fenótipo?
DICA: Use as funções de gerar repetições para criar os vetores dos tratamentos.
Criando uma Matriz
Crie um objeto da classe matriz com 5 colunas e 3 linhas contendo uma amostra de uma distribuição normal de média 10 e variância 3,6.
Mude os nomes das linhas para “L1” a “L3” e das colunas para “C1” a “C5”.
Dica: A função
paste combinada com funções de repetições podem lhe poupar trabalho.
Calcule a média e a variância por colunas e depois por linhas. Guarde os resultados em um dataframe , cujas colunas são a média e a variância de cada subconjunto dos dados.
Lendo e Salvando seus dados
Leia um arquivo de dados de sua autoria e faça um sumário das variáveis independentes. Caso tenha variáveis qualitativas faça tabelas de contagem para cada uma e duas a duas. Caso não tenha dados, poderá ir a campo ou utilize alguns dos dados da área
Arquivos de dados do nosso wiki
.
Dica: veja o help da função
read.table()
Faça uma seleção de um estado de atributo de um vetor fator dos seus dados e salve em um objeto (uma espécie, uma localidade…), mantendo o objeto original intacto. Em seguida selecione apenas três colunas no objeto resultante e salve em um arquivo de formato .txt, separado por tabulação e sem nome de linhas. Lembre-se de olhar o help antes de surtar! Para verificar se o arquivo está correto abra-o no EXCEL, URGG!
Classes de Objetos
O pacote “datasets” contém vários conjuntos de dados para uso em treinamento com a linguagem R.
O conjunto “iris” é distribuído de duas formas diferentes, nos objetos iris
e iris3
. São quatro medidas de flores de três espécies de Iris (Iridaceae).
Quais são as classes desses dois objetos?
Calcule a média de cada uma das quatro medidas por espécie, dos dois objetos. DICAS: as funções da família apply
e a função by
irão te ajudar.
Os nomes das variaveis estão em inglês. Mude-os para português no objeto iris
. DICA: Como tudo mais no R, os resultados da função names
podem ser armazenados em um objeto.
Acrescentando Dados de Síntese
-
Verifique o conteúdo do objeto resultante, com a função summary
.
Acrescente uma nova coluna ao data frame resultante, com a soma das biomassas de folhas e do tronco de cada árvore.
Acrescente outra coluna, com o valor da área basal de cada árvore.
Calcule a área basal total por talhão e salve em um objeto
Calcule a média da área basal por talhão
Selecione apenas os dados relativos à árvores com mais de 10 cm de diâmetro
Salve em um arquivo txt, separado por tabulação.
UFA!