Índice
- O Curso R
-
- Tutoriais
-
- Apostila
-
- 6. Testes de Hipótese (em preparação!)
- Exercícios
-
- Material de Apoio
-
- Área dos Alunos
-
- Cursos Anteriores
-
IBUSP
Outras Insitutições
Linques
Visitantes
Outras Insitutições
Licenciado em biologia da Universidade Distrital Francisco Jose de Caldas na Colômbia. Mestrado em Biologia Animal na área de concentração em Biodiversidade Animal na Universidade Estadual de Campinas (UNICAMP). Atualmente Doutorando em Biologia Animal na UNICAMP.
Meu projeto de pesquisa no doutorado é sobre mecanismos de coexistência em comunidade de aranhas. Trabalhei com ecologia populacional, diversidade de aranhas orbiculares e com interações planta-aranha.
pheno.correla package: nenhum (ver details) R Documentation Analises fenológico de uma variável resposta numérica temporal e correlação desta variável com variáveis preditoras temporais Description: A função analisa se há sincronia entre uma variável resposta temporal e outras variáveis explicativas temporais. Alem disso, a função realiza testes circulares para saber se os dados registrados (variável resposta e preditoras) são homogéneos ao longo do ano ou se tem uma tendencia ou direção para um mês no ano. Usage: pheno.correla(x,rmNA=TRUE) Arguments: x: Objeto de classe data-frame contento os dados brutos. As colunas devem ter a mesma quantidade de observações (ver Details). rmNA: argumento logico para colocar se o data-frame tem ou não dados faltantes nas colunas. Details: O data-frame inserido (x) deve ter exatamente 6 colunas. A primeira coluna deve ser de classe categórica contendo o ano ou os anos de estudo, a segunda coluna sera categórica contendo os meses, a terceira coluna sera a variável resposta temporal numérica, quarta quinta e sexta coluna serão variáveis numéricas temporais (por exemplo, temperatura, precipitação, etc.) que serão correlacionadas com a variável resposta. Todas as colunas deveram ter a mesma longitud de dados. O data-frame deve ter um número de linhas igual ou maior a 12. Ou seja, deve existir no mínimo um ano de estudo sendo cada mês uma observação. Para que a função rode corretamente, é necesario que os meses introducidos na coluna dois sejam as letras minusculas alfabéticas organizadas (ver "exemplos") da seguinte forma: janeiro = a fevereiro = b março = c abril = d . . . outubro = j novembro = k dezembro = l posteriormente a função mesma trocara esas letras pelos nomes dos meses nos resultados e nos gráficos finais que o usuario/a obterá. Com o data-frame inserido corretamente, a função irá calcular a média das variáveis resposta e preditoras por mês e o valor de correlação entre as variáveis mediante o o coeficiente de correlação de Spearman. Posteriormente, serão calculados alguns parámetros circulares necesarios para criar os gráficos e necesarios para observar possíveis padrões nos dados (ex. Teste de Kuiper e de Rayleigh). Os gráficos e os testes circulares precisaram do pacote "circular". No entanto, a função detetara se o usuario/a tem ou não o pacote. Se ele/ela não tem o pacote, a função instalara o pacote "circular" para as analises pertinentes. Value: comp1: Data-frame com as seguintes colunas: primeira coluna mostrando que variável preditora esta sendo correlacionada com a variável resposta; segunda coluna mostrando o valor do coeficiente de correlação entre as variáveis (valores desde -1 até 1). comp2: lista com os seguintes valores: (1) Media dos valores numéricos de todas as variareis (resposta e preditoras) por mês. (2) Valores dos testes circulares de Rayleigh, Kuiper e comprimento do vetor medio (que indica a força da direção dos dados) para as variáveis resposta e preditoras. comp3: Gráfico circular dos dados da variável resposta e preditoras indicando os valores por mês e o vetor medio. Author(s): German Antonio Villanueva Bonilla References: -Hudson, I.L., & Keatley, M.R. (2009). Phenological research: methods for environmental and climate change analysis. Springer Science & Business Media. -Sokal, R.R., Rohlf, F.J.. (1994). Biometry: the Principles and Practice of Statistics in Biological Research. W. H. Freeman and Company, New York. -Zar, J.H. (1998). Biostatistical Analysis. Prentice Hall, Upper Saddle River, New Jersey -https://pt.wikipedia.org/wiki/Coeficiente_de_correla%C3%A7%C3%A3o_de_postos_de_Spearman. -https://pt.wikipedia.org/wiki/Teste_de_Kuiper Examples: ##(1) Exemplo de um data-frame com valores aleatorios em todas as variáveis ## e com dados faltantes em algumas colunas (NAs). abundancia=c(30,34,33,33,45,60,56,68,89,88,130,130,runif(12,90,130)) temperatura=c(5,20,20,23,25,27,30,35,48,49,40,41,runif(12,41,80)) precipitacao=c(2,5,7,13,14,23,23,25,36,38,40,47,runif(12,47,81)) presas=c(6,6,7,20,23,22,30,36,48,46,55,55,runif(12,55,80)) ano=rep(c("2015","2016"),each=12) meses=rep(letters[1:12],2) meses data=data.frame(ano,meses,abundancia,temperatura,precipitacao,presas) str(data) data[1,3]=NA data[3,3]=NA data[4,5]=NA data pheno.correla(data,rmNA=TRUE) ########### #(2) Este exemplo de data-frame tem a coluna presas (variável preditora) ##com valores altos em fevereiro e janeiro para ver a mudança no ##gráfico circular abundancia=c(30,34,33,33,45,60,56,68,89,88,130,130,runif(12,90,130)) temperatura=c(5,20,20,23,25,27,30,35,48,49,40,41,runif(12,41,80)) precipitacao=c(2,5,7,13,14,23,23,25,36,38,40,47,runif(12,47,81)) presas=c(6,6,7,20,23,22,30,36,48,46,55,55,runif(12,55,80)) ano=rep(c("2015","2016"),each=12) meses=rep(letters[1:12],2) presas1=c(58,200,10,3,2,10,11,10,9,10,40,1,55,160,2,5,7,13,14,23,23,10,40,1) data2=data.frame(ano,meses,abundancia,temperatura,precipitacao,presas1) data2 pheno.correla(data2,rmNA=TRUE) ############ #(3)Este exemplo tem um ano e um mês de dados (13 observações). É para mostrar ##que a função roda com um número de observações igual ou maior a 12 observações ##que representaria um ano ou mais de dados. ##Alem disso, os valores para as variáveis preditoras "temp" e "pre" tem uma ##distribuição normal para mostrar como fica os gráficos circulares. ano=rep(2011,each=13) mes=c(letters[1:12],"a") abu=runif(13,80,180) prec=runif(13,80,180) temp=rnorm(13,25,2) pre=rnorm(13,130,2) dinamic1=data.frame(ano,mes,abu,prec,temp,pre) dinamic1 pheno.correla(dinamic1,rmNA=TRUE) ######## #(4)Exemplo com mais de dois anos de estudo ano2=rep(2011,each=30) mes2=c(rep(letters[1:12],2),letters[1:6]) abu2=runif(30,80,180) prec2=runif(30,80,180) temp2=rnorm(30,25,2) pre2=rnorm(30,130,2) dina2=data.frame(ano2,mes2,abu2,prec2,temp2,pre2) dina2 pheno.correla(dina2,rmNA=TRUE)
pheno.correla=function (x,rmNA=TRUE) #os argumentos da função aceitaram um data-frame (x) e a remoção dos dados faltantes (NA) { #Decidi colocar aqui uma mensagem que falei como deve ser introducidos os dados para qeu rode corretamente e para que os testes e as respostas sejam as desejadas. warning("Para que a função rode de forma correta o data.frame deve ter seis colunas. \nA primeira coluna deve ser classe categorica contendo o ano ou os anos de estudo, \nA segunda coluna sera categorica contendo os meses representadas por letras minusculas consecutivas sendo janeiro(a),fevereiro(b),março(c).....novembro(k),dezembro(l) \nA terceira coluna sera a variável resposta temporal numerica, \nA quarta quinta e sexta coluna serão variáveis numéricas temporais (por exemplo, temperatura, precipitação, etc.) que serão correlacionadas com a variável resposta. \n Todas as colunas deveram ter a mesma longitud de dados.") if(rmNA==TRUE) #Aqui estoy falando que se "rmNA" é verdadeiro delete os dados faltantes (NA). { dados=(na.omit(x)) #Criando um objeto que omita do data-frame os NA dim <- dim(x)-dim(dados) #para saber o numero total de NA excluidos do data-frame n.NA <- dim[1] #numero de NA excluidos do data-frame cat("Valores NA excluídos\n",n.NA,"\n","\n") #aqui vou colocar na que apareça na área de trabalho a mensagem de quantos valores NA foram excluidos } else #aqui se ya foram excluidos os NA ou se não teve necesidade de excluir nada { dados=x #o novo data-frame sem valores NA para fazer todas as analises warning("Se o seu data.frame tiver valores faltantes, a função não irá rodar. O argumento rmNA deve ser verdadeiro\n", call.=FALSE,immediate.=TRUE) } ##para todas as correlações eu decidi fazer "spearman" como metodo porqeu ele não precisa da premisa de correlação linear entre as variaveis numericas relacionadas, e segundo a literatura, é mais robusto para as analises. spear.co1=cor(dados[,3],dados[,4],method ="spearman") #primeiro teste de correlação entre a vaiavel resposta e a primeira variavel preditora numerica. spear.co2=cor(dados[,3],dados[,5],method ="spearman") #segundo teste de correlação entre a vaiavel resposta e a segunda variavel preditora numerica. spear.co3=cor(dados[,3],dados[,6],method ="spearman") #terceiro teste de correlação entre a vaiavel resposta e a terceira variavel preditora numerica. variavel.correlacionada=c(names(dados[4]), names(dados[5]),names(dados[6])) #criando o objeto com as varaiveis correlacionadas valor.teste=c(spear.co1,spear.co2,spear.co3) #criando o objeto om os valores dos testes corre.total=data.frame(variavel.correlacionada,valor.teste) #data-frame com os valores finales e nomes dos testes de correlação #agora vou verificar na função se esta instalado o packote "circular" que sera utilizado para realizar os graficos circulares das variaveis resposta e preditoras #Criei a função 'instalados' para verificar se o pacote 'circular' já está instalado ou não. (esta parte da função foi baseada no script da Leticia Zimback) instalados <- function(pacotes) { is.element(pacotes, installed.packages()[,1]) #a função 'is.element' é para conseguir obter um vetor com o nome dos pacotes instalados. } if(instalados("circular")==FALSE) #aqui se não esta instalado o pacote circular a função instalara { install.packages("circular") #aqui instala o pacote com a função "install.packages" } if(instalados("circular")==TRUE) #se o pacote ja esta instalado ele le o pacote { require("circular", quietly=TRUE) #aqui ele esta lendo o pacote circula ja instalado } #agora vou comezar tirar os valores necesarios para fazer os calculos para o plot e testes de uniformidad circular mean.abund= round(tapply(dados[,3],dados[,2],mean),0) #aqui eu crie um objeto com a media da abundancia por mes porqeu sera necessario para plotar no grafico circular mean.abund1=as.data.frame.table(mean.abund) #Aqui transformei o vector anterior para um data-frame qeu sera apresentado como resultado junto com os outros dados mean.abund1$Var1=levels=c("jan","fev","mar","abr","mai","jun","jul","ago","set","out","nov","dez") #aqui eu troquei as letras que representam os meses por os nomes abreviados dos meses mean.var1= round(tapply(dados[,4],dados[,2],mean),0) #aqui eu crie um objeto com a media da variavel 1 por mes porqeu sera necessario para plotar no grafico circular mean.var1.1=as.data.frame.table(mean.var1) #Aqui transformei o vector anterior para um data-frame qeu sera apresentado como resultado junto com os outros dados mean.var1.1$Var1=levels=c("jan","fev","mar","abr","mai","jun","jul","ago","set","out","nov","dez") #aqui eu troquei as letras que representam os meses por os nomes abreviados dos meses mean.var2= round(tapply(dados[,5],dados[,2],mean),0) #aqui eu crie um objeto com a media da variavel 2 por mes porqeu sera necessario para plotar no grafico circular mean.var2.1=as.data.frame.table(mean.var2) #Aqui transformei o vector anterior para um data-frame qeu sera apresentado como resultado junto com os outros dados mean.var2.1$Var1=levels=c("jan","fev","mar","abr","mai","jun","jul","ago","set","out","nov","dez") #aqui eu troquei as letras que representam os meses por os nomes abreviados dos meses mean.var3= round(tapply(dados[,6],dados[,2],mean),0) #aqui eu crie um objeto com a media da variavel 3 por mes porqeu sera necessario para plotar no grafico circular mean.var3.1=as.data.frame.table(mean.var3) #Aqui transformei o vector anterior para um data-frame qeu sera apresentado como resultado junto com os outros dados mean.var3.1$Var1=levels=c("jan","fev","mar","abr","mai","jun","jul","ago","set","out","nov","dez") #aqui eu troquei as letras que representam os meses por os nomes abreviados dos meses #vou cria agora alguns vetores necesarios para o plot circular angulo=seq(0,330,by=30) #vetor de doze números espaçados igualmente que serão posicionados radialmente na circunferência angulo.rad=rad(angulo) #é depois o vetor anterior foi transformado em radianes abund.feno=circular(rep(angulo.rad,mean.abund),units=c("radians"),rotation="counter") #transformação do vetor que tem a media do valor numerico resposta por mes em um vetor circular que possa ser ploteado media.abun=mean(abund.feno) #Calculei a média para obter o vetor que indica a direção das observações na variavel resposta. var1.feno=circular(rep(angulo.rad,mean.var1),units=c("radians"),rotation="counter") #transformação do vetor que tem a media do valor numerico preditor 1 por mes em um vetor circular que possa ser ploteado media.var1=mean(var1.feno) #Calculei a média para obter o vetor que indica a direção das observações na variavel preditoria 1. var2.feno=circular(rep(angulo.rad,mean.var2),units=c("radians"),rotation="counter") #transformação do vetor que tem a media do valor numerico preditor 2 por mes em um vetor circular que possa ser ploteado media.var2=mean(var2.feno) #Calculei a média para obter o vetor que indica a direção das observações na variavel preditoria 2. var3.feno=circular(rep(angulo.rad,mean.var3),units=c("radians"),rotation="counter") #transformação do vetor que tem a media do valor numerico preditor 3 por mes em um vetor circular que possa ser ploteado media.var3=mean(var3.feno) #Calculei a média para obter o vetor que indica a direção das observações na variavel preditoria 3. meses <- c("jan","fev","mar","abr","mai","jun","jul","ago","set","out","nov","dez") #este vetor criado é para colocar como label no grafico crclar par(mfrow=c(2,2)) #aqui eu dividi a janela grafica em 4 porque são quatro graficos qeu serão feitos: (1)variavel resposta;(2)variavel preditora 1;(3)variavel preditora 2;(4)variavel preditora 3 par(mar=c(1,1,1,1)) #para que os graficos tiveram espaço suficiente eu coloquei margens ben estreitas ##nos graficos eu coloquei como nome principal o nome que aparece na coluna da variavel resposta ou preditora segundo corresponda ##Para todos os diagramas de rosa, os argumentos são: (1)conjunto de dados de classe circular; (2)"bins" é o numero de divisões que tera o circulo; (3)"add" é para adicionar este diagrama em um grafico ja existente; (4)"axes" aqui eu coloquie FALSE para qeu não coloque nada ##Para todos os graficos, a função arrows.circular tem como argumentos: (1)os dados circulares como media; (2)"shrink" indica o comprimento da linha; (3)a cor da linha, neste caso vermelho; (4)e finalmente o comprimento das pontas da seta graficada. #plot (1) com a abundancia por mes (variavel resposta numerica temporal) comprimento.vector.r1=rho.circular(abund.feno) #o comprimento do vetor médio que indica a direção das observações. Este valor vai de 0 até 1, onde 1 indica grande acumulo ou tendencia dos dados para uma direção certa. No grafico o vetor sera maior enquanto o valor seja maior tambem. plot(abund.feno,axes=F,main="Fenologia") #Plot circular dos dados da variavel resposta ja transformados, neste grafico nos outros qeu não coloque os eixos para depois eu trocar pelo vetor "meses" criado anteriormente axis.circular(at=circular(rad(angulo)),labels=meses,units=c("radians")) #aqui coloquie no eixo do grafico circular os meses do vetor ants criado e falei para colocar no formato de radianes para qeu coincida rose.diag(abund.feno,bins=12,add=T,axes=F) #Plotei este diagrama em rosa para visualizar dentro do grafico circular antes ploteado os valores numericos da variavel resposta por cada mes (na verdade a média dos valores por cada mes) arrows.circular(x=media.abun, shrink=comprimento.vector.r1, col="red",length=0.1) #Esta função plota um vetor na direção média dos dados no grafico anterior, entre maior o comprimento da linha maior sera a tendencia dos dados para um mes no ano #plot (2) com os dados da variavel numero 1 por mes (variavel preditora numerica temporal que estaria na coluna 4) comprimento.vector.r2=rho.circular(var1.feno) #o comprimento do vetor médio que indica a direção das observações. Este valor vai de 0 até 1, onde 1 indica grande acumulo ou tendencia dos dados para uma direção certa plot(var1.feno,axes=F,main=names(dados[4])) #Plot circular dos dados da variavel preditora 1 ja transformados axis.circular(at=circular(rad(angulo)),labels=meses,units=c("radians")) #Igual que no outro grafico, aqui coloquei os meses como eixos rose.diag(var1.feno,bins=12,add=T,axes=F) #igual que no diagrama de rosa anterior, plotie os valores da primeira variavel preditoria por mes no grafico circular. arrows.circular(x=media.var1, shrink=comprimento.vector.r2, col="red",length=0.1) #Como no anterior, aqui tambem estara la linha (vetor medio) em vermelho qeu indicara a direção dos dados no grafico circular. #plot (3) com os dados da variavel numero 2 por mes (variavel preditora numerica temporal que estaria na coluna 5) comprimento.vector.r3=rho.circular(var2.feno) #o comprimento do vetor médio que indica a direção das observações. Este valor vai de 0 até 1, onde 1 indica grande acumulo ou tendencia dos dados para uma direção certa plot(var2.feno,axes=F,main=names(dados[5])) #Plot circular dos dados da variavel preditora 2 ja transformados axis.circular(at=circular(rad(angulo)),labels=meses,units=c("radians")) #Igual que no outro grafico, aqui coloquei os meses como eixos rose.diag(var2.feno,bins=12,add=T,axes=F) #igual que no diagrama de rosa anterior, plotie os valores da segunda variavel preditoria por mes no grafico circular. arrows.circular(x=media.var2, shrink=comprimento.vector.r3, col="red",length=0.1) #Como no anterior, aqui tambem estara la linha (vetor medio) em vermelho qeu indicara a direção dos dados no grafico circular. #plot (4) com os dados da variavel numero 3 por mes (variavel preditora numerica temporal que estaria na coluna 6) comprimento.vector.r4=rho.circular(var3.feno) #o comprimento do vetor médio que indica a direção das observações. Este valor vai de 0 até 1, onde 1 indica grande acumulo ou tendencia dos dados para uma direção certa plot(var3.feno,axes=F,main=names(dados[6])) #Plot circular dos dados da variavel preditora 3 ja transformados axis.circular(at=circular(rad(angulo)),labels=meses,units=c("radians")) #Igual que no outro grafico, aqui coloquei os meses como eixos rose.diag(var3.feno,bins=12,add=T,axes=F) #igual que no diagrama de rosa anterior, plotie os valores da terceira variavel preditoria por mes no grafico circular. arrows.circular(x=media.var3, shrink=comprimento.vector.r4, col="red",length=0.1) #Como no anterior, aqui tambem estara la linha (vetor medio) em vermelho qeu indicara a direção dos dados no grafico circular. par(mfrow=c(1,1)) #Aqui coloquei de novo o painel do grafico com uma coluna e uma linha só. #Agora vou fazer os testes de uniformidade ##o primeiro é saber se os dados tem uma distribuição normal circular (analoga com a distribuição normal de campana de Gauss). #para isso eu testo essa normalidade com o teste de melhor ajuste circular (análogo com o Teste de Kolmogorov-Smirnov), que seria o teste de Kuiper. #Valores do teste acima do valor crítico, indicam a existência de um padrão e menor abrangência fenológica. kuiper.abund=kuiper.test(abund.feno, alpha=0.05) ##Aqui é testado se as medias das observações são iguais, se não são rejeito a hipoteses nula (uniformidade). Hipoteses alterna é que existe uma tendencia dos dados é não uma homogeneidae. kuiper.var1=kuiper.test(var1.feno, alpha=0.05) ##Aqui fazo o mesmo para testar a uniformidade da primeira variavel preditora kuiper.var2=kuiper.test(var2.feno, alpha=0.05) ##Aqui fazo o mesmo para testar a uniformidade da segunda variavel preditora kuiper.var3=kuiper.test(var3.feno, alpha=0.05) ##Aqui fazo o mesmo para testar a uniformidade da terceira variavel preditora #Agora vou fazer o teste de Rayliegh para saber se existe uma direção ou tendencia dos dados e se é significativa ou não. rayleigh.abun=rayleigh.test(abund.feno) #teste de rayleigh para a varivel resposta temporal, valores inferiores no p= 0.05 indicam qeu existe uma tendencia dos dados hacia uma direção rayleigh.var1=rayleigh.test(var1.feno) #teste de rayleigh para a varivel preditoria 1 rayleigh.var2=rayleigh.test(var2.feno) #teste de rayleigh para a varivel preditoria 2 rayleigh.var3=rayleigh.test(var3.feno) #teste de rayleigh para a varivel preditoria 3 ##Agora vou fazer uma lista com os resultados qeu eu acho importantes (testes de correlação, circulares, etc para o usuario ver. ##posteriormente, coloquie os nomes dentro da lista dos resultados list.mean=list(corre.total,mean.abund1,mean.var1.1,mean.var2.1,mean.var3.1,kuiper.abund,kuiper.var1,kuiper.var2,kuiper.var3,rayleigh.abun,rayleigh.var1,rayleigh.var2,rayleigh.var3,comprimento.vector.r1,comprimento.vector.r2,comprimento.vector.r3,comprimento.vector.r4) names(list.mean)=c("Coeficiente de correlação de Spearman da variavel resposta","abundancia media por mês", names(dados[4]), names(dados[5]),names(dados[6]),"Teste Kuiper para variavel resposta","Teste Kuiper para variavel preditora 1","Teste Kuiper para variavel preditora 2","Teste Kuiper para variavel preditora 3","Teste Rayleigh para variavel resposta","Teste Rayleigh para variavel preditora 3","Teste Rayleigh para variavel preditora 3","Teste Rayleigh para variavel preditora 3","Comprimento do vetor medio da variavel resposta","Comprimento do vetor medio da variavel preditora 1","Comprimento do vetor medio da variavel preditora 2","Comprimento do vetor medio da variavel preditora 3") ##Para finalizar a função return mostra na área de trabalho a o vetor lista que eu anteriormente criei com os resultados relevantes da função. return(list.mean) }