Sou bióloga com mestrado e doutorado em Ecologia pela UFRJ. Na minha tese analisei como diferentes fatores antrópicos influenciam os mamíferos no Pampa gaúcho. Atualmente sou professora na Universidade Federal da Fronteira Sul, campus de Cerro Largo - RS, e tenho interesse em ecologia e conservação de mamíferos.
Exercícios preparatórios (tabela de exercícios): tabelaexerc.r
Exercicio 7.2 exercicio7dois.r
Exercicio 7b exercicio7b.r
Exercicio 9 exercicio9dois.r
Proposta A: Partição de variância utilizando modelos lineares generalizados O pacote vegan possui a função varpart, que realiza partição de variância utilizando RDA. A minha proposta é construir uma função que realize partição de variância utilizando modelos lineares generalizandos - GLMs. Nesta função, um dos argumentos seria um vetor contendo a variável dependente, outro contendo duas ou mais matrizes (provavelmente com máximo de 4) com as quais serão construídos os modelos. No primeiro passo será calculada a variância explicada por cada modelo. Após, será calculada a variância explicada pelo aditivo dos modelos, por exemplo: modelo A + modelo B. Após o calculo de todos os aditivos, utilizando subtração simples será possível calcular a variância explicada por cada modelo unicamente e de forma compartilhada.
Proposta B: Gráfico de médias e desvio padrão Esta proposta pretende facilitar a criação de gráficos de média e desvio padrão. A ideia é construir uma função que plote as médias e os desvios padrões ligados a essa média utilizando as funções de baixo nível de segments, arrows ou lines. Apenas um argumento seria obrigatório, o vetor com os dados para serem plotados, porém como argumentos não obrigatórios teríamos um vetor de nível para comprar médias entre esses níveis, e outro argumento para escolher se será utilizado desvio padrão (default) ou outro tipo de medida de dispersão. Um gráfico semelhante foi construído no exercício 5.
Daniela, sua proposta A me parece bem interessante, mas acho que alguns pontos poderiam ser melhor esclarecidos: 1) porque um máximo de apenas quatro variáveis? 2) a função incluirá apenas modelos aditivos com duas variáveis independentes, ou modelos aditivos com três ou quatro variáveis serão permitidos? 3) a função permitirá interações? Nesse caso, interações envolvendo até quantas variáveis?
Minhas sugestões são: 1) permitir qualquer numero de variáveis; 2) incluir todos os modelos aditivos possíveis; 3) excluir interações ou permitir apenas interações de duas variáveis. Para te ajudar a escrever essa função consulte:
?formula
?expand.grid
?combn
Já a proposta B é interessante, mas eu acho simples demais. Minha sugestão é prosseguir com o plano A, mas apenas se você já tiver alguma noção de por onde começar a trabalhar. Caso contrário, dê uma vitaminada no plano B dando mais opções para o usuário (diferentes medidas de tendência central e dispersão, diferentes opções gráficas, essas coisas).
Sugestão dos monitores: 1) permitir qualquer numero de variáveis; 2) incluir todos os modelos aditivos possíveis; 3) excluir interações ou permitir apenas interações de duas variáveis.
Modificação da proposta:
1) Na proposta original imagina realizar a partição de variância para um máximo de até 4 matrizes por simplificação. Imagino que numa análise de partição de variância muitos modelos por vezes só ficam confusos e não mais explicativos. Um ponto importante e que em cada matriz pode haver quantas variáveis o usuário quiser, por esse motivo pretendo manter o máximo de quatro matrizes.
2) O número de modelos aditivos possíveis vai depender do número de modelos (matrizes) inclusas. Sendo que serão calculados os aditivos para todas as combinações de modelos de dois a dois, de três a três e o aditivo total, com os quatro modelos (quatro matrizes).
3) As interações podem ser permitidas dentro de cada matriz (cada modelo), mas não entre modelos. Por exemplo: estou tentando entender o que explica o padrão de riqueza de árvores numa região, para isso tenho um conjunto de variáveis relativa às características do solo (modelo 1), outra matriz relativa a exposição solar (modelo 2), outra matriz relativa a altimetria (modelo 3) e por último uma matriz com dados de antropização da área (modelo 4). Posso prever interações entre as variáveis dentro do modelo 1, como interação entre umidade e nutrientes do solo, mas não interação entre as variáveis do modelo 1 e do modelo 2. Caso a interação entre a umidade do solo e exposição solar seja necessária, é necessário criar um modelo onde essas variáveis estejam dentro do mesmo modelo. Faço essa opção por simplificação. Para facilitar a interpretação dos resultados.