Índice
- O Curso R
-
- Tutoriais
-
- Apostila
-
- 6. Testes de Hipótese (em preparação!)
- Exercícios
-
- Material de Apoio
-
- Área dos Alunos
-
- Cursos Anteriores
-
IBUSP
Outras Insitutições
Linques
Visitantes
Outras Insitutições
Doutorado em Ecologia na USP - Defesa química em opiliões da família Gonyleptidae
exerc._de_funcoes_matematicas_.r
exerc_leitura_man_de_dados_incomp_.r
exerc_leitura_man_de_dados_comp_.r
exerc._anal._explor._incomp_.r
exerc._teste_hip._sim._incomp_.r
exerc._teste_hip._sim._comp_.r
Proposta de trabalho final (Plano A):
Como acabo de ingressar no doutorado e o tema geral da minha tese é defesa química, achei interessante, mesmo ainda não tendo dados para analisar, fazer meu projeto final do R com algo relacionado ao assunto, de modo que quando eu tiver os dados coletados, essa experiência com o R me ajudará na analise.
A proposta geral é investigar os custos da defesa química. Os opiliões produzem secreções defensivas formada por um conjunto de substancias. Na especie em questão a secreção possui uma mistura de 3 substâncias. Um conjunto de opiliões será submetido a restrição alimentar (MAL alimentado) e o outro será BEM alimentado, a secreção será removida ANTES e DEPOIS do inicio do experimento. A hipótese é que os opiliões com restrições alimentares produzirão menor volume de secreção ou diminuirão de forma diferenciada a produção dos três compostos quimicos já que os custos energéticos para a produção de cada um destes compostos também podem ser diferentes. O objetivo é avaliar o efeito da dieta (BEM e MAL alimentado) na concentração das diferentes substância (3), ANTES (como controle) e DEPOIS pelos opilões.
FUNÇÃO: Calcular a diferença relativa na quantidade de substância produzida ANTES e DEPOIS do tratamento, tanto no volume total da secreção, quanto por cada tipo de substância, entre os indivíduos que foram BEM alimentados e MAL alimentados. Depois de calculada a diferença relativa, eu vou comparar média das diferenças para a produção de cada substância e a média das diferenças do volume total da secreção entre BEM alimentado e MAL alimentado.
A previsão é que de uma forma geral os opiliões MAL alimentados produzirão um menor volume de secreção que os opiliões BEM alimentados, mas que o efeito da restrição alimentar sobre os compostos não será uniforme.
#######################
Proposta de trabalho final – plano B
Baseada na mesma proposta de seguir com projetos relacionados ao meu doutorado, eu gostaria de propor um plano B relacionado ao primeiro capitulo da minha tese, algo simples mas que acredito que não dê errado.
Acutisoma longipes é um opilião que tem cuidado maternal, produzem muitos ovos, grandes e ricos em vitelo, que são postos em um único evento de oviposição e, em seguida, recebem cuidado maternal por até 60 dias. Devido ao grande investimento maternal espera-se que a alocação de energia para a produção de ovos comprometa outras atividades, incluindo a produção de substâncias defensivas. Portanto, fêmeas reprodutivas devem produzir um volume menor de secreção quando ameaçadas do que fêmeas não reprodutivas e, por conta dessa redução, devem estar mais expostas a predadores. O objetivo é saber se existe uma demanda energética conflitante entre a eficácia da defesas químicas e a produção de ovos nessa espécie? Para isso, serão selecionadas fêmeas em 3 fases do ciclos reprodutivos: (a) fase não reprodutiva (sem ovo e sem prole),(b) fase de produção de ovos e © fase de cuidado parental.
Teste com aranhas (Trechaleoides biocellata)
As aranhas serão coletados mantidas em recipientes individuais no laboratório e depois de 6 dias serão oferecidos grilos. No momento que em este for capturado, a aranha será apresentada a um dos três estímulos descritos a seguir: (1), a secreção glandular de uma fêmea não reprodutiva aplicada diretamente sobre as quelíceras; (2), a secreção glandular de uma fêmea reprodutiva, aplicada diretamente sobre as quelíceras; (3), controle, as aranhas serão estimuladas apenas água destilada aplicados diretamente sobre as quelíceras.
FUNÇÃO: Vou usar uma função para descobrir se ESTÁGIO REPRODUTIVO da fêmea afeta a CAPTURA DE PRESA pela aranha. A hipótese nula é de que os ESTÁGIOS REPRODUTIVOS das fêmeas não afetarão a probabilidade de CAPTURA DA PRESA pela aranha. A hipótese alternativa é que se a produção de um volume menor de secreção compromete a capacidade das fêmeas reprodutivas repelirem potenciais predadores,por isso a frequência de aranhas que soltam os grilos deve ser maior no tratamento (1) do que no tratamento (2) e no controle (3).
As duas hipóteses estão muito bem formuladas e embasadas. Entretanto, creio que estão muito específicas e carecem de generalidade. Os dois problemas podem ser resolvidos com um script simples. Uma pergunta útil é como a função pode servir para outros pesquisadores com problemas similares em situações diferentes? Sugiro tentar formalizar esta generalidade melhor, além de definir de maneira mais clara quais são as informações de entrada e saída da função. Um dica útil é tentar definir quais as tarefas menores que a função irá realizar. Não deve ser uma tarefa trivial, a função deve resolver um problema complexo e/ou trabalhoso de maneira a facilitar o trabalho do analista. Procure achar um balanço entre simplicidade e complexidade de maneira a caber no prazo para entregar a proposta.
Proposta A
Desde que terminou a disciplina andei pensando em como poderia melhorar minha função pois quero continuar com a mesma linha de pensamento. Sei que o objetivo da função é fazer algo que seja o mais geral possível para que outros pesquisadores possa usufruir da minha função. Dessa forma, pensei que minha função poderia ser mais abrangente se fosse colocada da seguinte maneira:
Minha função visa a fazer um uma ANOVA de três fatores com amostras repetidas (Dados de entrada) sendo um deles uma variável aleatória (Bloco- no meu caso terrários) e as outras duas fixas ( no meu caso tempo e disponibilidade de alimento) as variável resposta (no meu caso quantidade de secreção). Porque alguns tratamentos podem afetar a variância e não a media minha função também calculara pra cada bloco e os compara entre tempo e tratamentos diferentes. Ao final vou gerar um gráfico com as medias e o coeficiente de variação . Os meus dados de saída da função será o resultado da Anova e o gráfico.
Em alguns caso, para pesquisadores que estão trabalhando com ANOVA, é tão interessante saber se os fatores resultam em diferenças na media quanto se esses mesmos fatores resultam em diferenças no coeficientes de variação.
Montar uma função para fazer uma anova específica é basicamente usar a função genérica com argumentos particulares, e não é muito emocionante. A questão de diferenças na variação é mesmo muito importante e negligenciada. Há também uma certa dificuldade dos usuários em entender a lógoica de uma ANOVA em blocos. Assim, seria bem mais interessante uam função que retornasse gráficos exploratórios que mostrassem a estrutura de variação dos dados intra e entre blocos e fatores fixos, permitindo que o usuário avalie se há diferenças entre médias e variâncias. Abandonando a parte do teste estatístico vc pode se concentrar mais em implementar a análise exploratória.
grafmvar package:unknown R Documentation Graficos exploratorios de medias e variancias Description: Retornar tres graficos exploratorios que mostram a estrutura de variacao dos dados intra e entre Blocos e entre fatores fixos (tratamento), permitindo que o usuario avalie se há diferença entre medias e variancias. Usage: grafmvar=function(k)## k=data.frame Arguments: dados : um data.frame com dados coletatos em blocos, sendo a primeira coluna os blocos, a segunda coluna a variavel fixa e a terceira coluna a variavel resposta Details: Em ANOVA em bloco analises exploratorias são de grande importancia para comprencao do resultado, principalmente para quando ha interecao entre blocos e fatores. Neste caso eh importante compreender a estrutura da variancia entre blocos dentro de um mesmo tratamento. Para isso essa funcao ajuda a visualisar a variacao dos dados em diferentes niveis. Warning: Tomar cuidado ao usar a funcao ORDER na hora de organizar os dados. Ela deve organizar todos as colunas juntas. Author(s): Tais M Nazareth taismng@gmail.com References: Crawley, M.J. (2007) The R Book. John Wiley & Sons Ltd, West Sussex, UK. See Also: order for Exemplo: exemplo <- data.frame(Bloco=(as.integer(rep(1:10,each=5))),Dieta=as.factor(rep(c("pobre","rico"),each=25)),Tamanho=as.integer(c(rnorm(25,mean=5,sd=1.5),rnorm(25,mean=7.5,sd=1.5)))) grafmvar(exemplo)
grafmvar=function(k,...) { k2=k[order(k[,2]),] nbloco=table(k2[,1]) media.geral=mean(k[,3]) par(mfrow=c(2,2)) plot(1:nrow(k), k2[,3], ylim=c(0,max(k2[,3])), pch=rep(c(15:15+length(unique(k[,2]))),each=nrow(k)/length(unique(k[,2]))), col=rep(2:1, each=nrow(k)/length(unique(k[,2]))), main="Variação Entre Tratamentos", ylab="Variavel Resposta", xlab="Amostra") for(i in 1:nrow(k)) { lines(c(i,i), c(k2[,3][i], media.geral), col=rep(1, each=nrow(k)[i])) } abline(h=media.geral) medias.tratamento=aggregate(k2[,3], list(k2[,2]),mean) plot(1:nrow(k), k2[,3], ylim=c(0,max(k2[,3])), pch=(rep(c(15:15+length(unique(k[,2]))),each=nrow(k)/length(unique(k[,2])))), col=rep(1:length(unique(k[,1])), each=length(unique(k[,1]))/length(unique(k[,2]))), main="Variação Entre Blocos", ylab="Variavel Resposta", xlab="Amostra") for(n in 1:nrow(k)) { lines(c(n,n), c((rep(medias.tratamento[1:2,2], each=nrow(k)/length(unique(k[,2]))))[n], k2[,3][n]), col=rep(1, each=nrow(k))[n]) } a= 1 h= (aggregate(k2[,2],list(k2[,1]),unique)) h= (table(h[,2])) h= as.numeric(h) h=rep(c(1:nrow(medias.tratamento)),each=h) for(z in 1:length(nbloco)) { lines(c(a,a+nbloco[z]-1),c(medias.tratamento[h[z],2], medias.tratamento [h[z],2]),col=1) a= a+nbloco[z] } medias.bloco=aggregate(k2[,3], list(k2[,1]),mean) order.medias=medias.bloco[order(medias.bloco[,2]),] plot(1:nrow(k),k2[,3],ylim=c(0,max(k2[,3])),pch=k2[,1], col=k2[,1],main=" Variação Intra Blocos ",ylab="Variavel Resposta", xlab="Amostra") for(j in 1:nrow(k)) { lines(c(j,j), c((rep(order.medias[,2], each=length(unique(k[,1]))/length(unique(k[,2]))))[j], k2[,3][j]), col=k2[,1][j]) } bl= 1 for(y in 1:length(nbloco)) { lines(c(bl,bl+nbloco[y]-1),c(order.medias[y,2], order.medias[y,2]),col=1) bl= bl+nbloco[y] } } grafmvar(k)