metaR

# Janaina Silva Fortirer, 2018

############################################################################################################################
#FUNCAO CALCULA MEDIA PADRONIZADA POR ESTUDO, INTERVALO DE CONFIANCA E CRIA UM GRAFICO FOREST PLOT PARA META ANALISE
metaR<- function(metadata){

############################################################################################################################  
#VERIFICA OS PARAMETROS

# verifica se a classe dos valores da primeira coluna eh 'factor' 
if (class(metadata[,1]) == "factor")
{  
  metadata[,1] <- as.character(metadata[,1])# se sim, modifica a classe para caracter. obs. eh necessario que o nome dos autores estejam em caracter para serem utilizados na legenda do grafico
}
# verifica se a quantidade de linhas do data.frame eh menor que 2
if ((sum(row(metadata))) < 2)
{
  stop("To calculate effect size by meta-analysis must have at least 2 studies, with least 2 'row'") # para e exibe mensagem de erro ao usuario
}
# verifica se existe algum NA nos dados
if (sum(rowSums(is.na(metadata))) > 0)
{
 stop("The 'metadata' must not 'NAs'") # se sim, exibe mensagem de erro ao usuario
}
# verifica se argumento metadata eh do tipo data.frame
if(!is.data.frame(metadata)) 
{
 stop ("The argument metadata must be a 'data.frame'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 1 foi inserido corretamente
if (colnames(metadata[1]) != "Author") 
{
 stop ("The name in row 1 and column 1 must be 'Author'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 2 foi inserido corretamente
if (colnames(metadata[2]) != "Year") 
{
 stop ("The name in row 1 and column 2 must be 'Year'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 3 foi inserido corretamente
if (colnames(metadata[3]) != "Ncontrol") 
{
  stop ("The name in row 1 and column 1 must be 'Ncontrol'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 4 foi inserido corretamente
if (colnames(metadata[4]) != "Ntreated") 
{
  stop ("The name in row 1 and column 1 must be 'Ntreated'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 5 foi inserido corretamente
if (colnames(metadata[5]) != "MeanControl") 
{
  stop ("The name in row 1 and column 5 must be 'MeanControl'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 6 foi inserido corretamente
if (colnames(metadata[6]) != "MeanTreated") 
{
  stop ("The name in row 1 and column 6 must be 'MeanTreated'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 7 foi inserido corretamente
if (colnames(metadata[7]) != "Sdcontrol")
{
  stop ("The name in row 1 and column 7 must be 'SDcontrol'") # Para funcao e exibe mensagem de erro.
}
# Verifica se o nome na linha 1 e coluna 7 foi inserido corretamente
if (colnames(metadata[8]) != "Sdtreated") 
{
  stop ("The name in row 1 and column 7 must be 'SDtreated'") # Para funcao e exibe mensagem de erro.
}

############################################################################################################################
#INICIO DO CALCULO DA ESTATISTICA DE INTERESSE (EFFECT SIZE - 'd')
  
# calculo df (grau de liberdade) para calcular effect size 'd'
metadata$df <- with(metadata, (Ntreated + Ncontrol -2))
  
# calculo do fator de correcao (J), que sao sempre menor que 1.0 
# J geralmente tem valores proximos de 1.0, a menos que o df (grau de liberdade) seja < 10 (Hedges, 1981).
# formula para fator de correcao "J" (Hedges and Olkin, 1985)
metadata$J <- with(metadata, (1 - 3/(4 * (df) - 1))) 

# calculo do efeito de interesse 'd', que eh a diferenca entre as medias padronizada do resultado para cada estudo,
# formula de Hedges and Olkin, 1985. 
metadata$d <- with(metadata, (MeanTreated - MeanControl)/sqrt(((Ntreated - 1) * Sdtreated^2 + (Ncontrol - 1) * Sdcontrol^2)/(Ntreated + Ncontrol - 2)) *J ) 
  
# calculo da variancia de 'd' (formula: Hedges and Olkin, 1985)
metadata$var.d <- with(metadata, ((Ntreated + Ncontrol/Ntreated * Ncontrol) + (d^2 /2 * (Ntreated + Ncontrol))))
  
# o calculo da variancia tem importancia para a estatistica do efeito de interesse, 
# porem como o 'd' teve uma metrica quadratica, a interpretacao nao eh muito intuitiva
# por isso eh recomendado por (Borenstein et al. 2009) usar o erro padrao que esta na mesma escala que o 'd'
  
# Entao, iremos calcular do erro padrao de 'd'
metadata$SE.d <- with(metadata, sqrt(var.d))
  
###########################################################################################################################
# CALCULO DO INTERVALO DE CONFIANCA

# Nestas equacoes 1.96 eh o valor 'Z' correspondente aos limites de confianca de 95%, 
# isso permite o erro de 2.5% em cada extremidade da distribuicao (Borenstein et al. 2009).
  
# calculo do intervalo de confianca lower (CI - 95% )
metadata$CI.lower <- with (metadata, (d - 1.96 * SE.d))
  
  
# calculando o intervalo de confianca upper (CI - 95% )
metadata$CI.upper <- with(metadata, (d + 1.96 * SE.d))
  
############################################################################################################################
# CALCULO DA ESTATISTICA 'Z'

# Existe uma relacao  entre o valor p de 'Z' e o intervalo de confianca,
# sendo que o valor p sera menor que 0,05 (se e somente se) o intervalo de confianca nao incluir o valor nulo.
# ou seja, se a media e o intervalo de confianca nao passar pelo valor zero.

# calculo da estatistica 'Z' (Borenstein et al. 2009).  
metadata$Z <- with(metadata, d/SE.d) 
  
############################################################################################################################
# AJUSTE DOS PARAMETROS PARA A LEGENDA DO LADO ESQUERDO DO GRAFICO

# agrupa a coluna 'Author' com a coluna 'Year', separado por virgula
metadata$AuthorYear <- apply( metadata[ , 1:2 ] , 1 , paste , collapse = ", " )
  
# calcula 'Ntotal' das amostras de cada estudo
metadata$Ntotal <- apply(metadata[,3:4],1, sum)
  
# coloca os valores da coluna 'Ntotal' entre parenteses
metadata$Ntotal.parenteres <- with(metadata, paste0("(",Ntotal,")"))

# agrupa em uma coluna, a coluna com 'AuthorYear' e 'Ntotal.parenteses'
metadata$left.legend <- apply (metadata[, c(17,19)], 1, paste, collapse = " ")

############################################################################################################################
# AJUSTE DOS PARAMETROS PARA A LEGENDA DO LADO DIREITO DO GRAFICO

# arredonda o valor da media padronizada de 'd' para duas casas decimais
metadata$d.round <- round(metadata$d,2)
 
# arredoda valor do CI.lower
metadata$CI.lower.round <- round(metadata$CI.lower,2)
  
# arredonda valor do CI.upper
metadata$CI.upper.round <- round(metadata$CI.upper,2)

# agrupa a coluna com os valores da media padronizada com as colunas do intervalo de confianca  
metadata$d.CI <- with(metadata, paste0(d.round, " [", CI.lower.round, "; ", CI.upper.round, "] "))
  
############################################################################################################################
# CRIA GRAFICO META ANALISE

# este algoritmo foi inspirado na aula 5b. Graficos avancados
# http://ecologia.ib.usp.br/bie5782/doku.php?id=bie5782:03_apostila:10-graficos02
# porem, foram realizadas varias mudancas para que o grafico ficasse adequado com a proposta da funcao

# cria uma matriz que sera a area do grafico
layout(matrix(c(1,2), ncol=2, nrow=1), width=c(8, 2))

# mostra matriz criada
layout.show(2)

# estabelece os valores da margem do grafico
par (mar=c(5, 10 ,4, 4)) 
  
# plota area do grafico, com os limites de xlim e ylim determinados pelos valores do intervalo de confinca e os valores 
# da media, e ajusta alguns parametros da legenda do grafico
plot(x=NULL, y=NULL, xlim=c(min(metadata$CI.lower -1), max(metadata$CI.upper + 1)), ylim=c(1, nrow(metadata)), type="n", yaxt="n",
     ylab="", xlab="Standardised mean difference (95% CI)",bty= "n", main = "Author, year (total sample)                                                                              SMD [95% CI]", cex=1)

# cria legenda do lado direito (side 2), com os nomes dos autores de cada estudo, ano e o N amostral total (controle + tratamento) para cada estudo
axis(side=2, at=rev(c(1:nrow(metadata))), labels=c(metadata$left.legend), las=2, lwd = 0)

# cria legenda do lado esquerdo (side 4), com os valores da media padronizada, calculada com a diferenca entre os estudos
# e o intervalo de confianca de 95% calculado, com minimo e maximo
axis(side=4, at=rev(c(1:nrow(metadata))), labels=c(metadata$d.CI), las=2, lwd = 0)

# cria linha pontilhada vertical na posicao zero do eixo 'x' 
abline (v=0, lty=2) 

# coloca ponto no valor que foi calculado a media padronizada da diferenca entre os estudos  
points (x=c(metadata$d), y=rev(c(1:nrow(metadata))), pch=19 , cex=2) 

# coloca uma barra vertical no minimo e maximo dos intervalos de confianca  
points (x=c(metadata$CI.lower, metadata$CI.upper), y=rep(rev(c(1:nrow(metadata))), times=2), pch= "|" )
  
# cria segmentos com o minimo e maximo do intervalo de confianca
segments(x0=c(metadata$CI.lower), y0=rev(c(1:nrow(metadata))),x1=c(metadata$CI.upper),y1=rev(c(1:nrow(metadata))))
  
# salva grafico estilo forest plot
png(filename = "metaR_forestplot.png",width = 900, height = 900, units = "px", pointsize = 12,bg = "transparent")

# fim, citacao aula 5b. Graficos avancados

# seleciona apenas as colunas para o data.frame de saida para o usuario
metadata.print <- with(metadata,metadata[,1:16])

# salva na area de trabalho do usuario o forest plot gerado pela funcao
write.table(metadata.print, "metaR_data.csv",sep = ";",col.names = NA, row.names = TRUE)

# salva tabela de saida para usuario com as colunas adicionais que foram realizadas os calculos estatisticos para 
# analise dos estudos na meta-analise

# retorna para o usuario a tabela com os dados que foram inseridos e adicionados pelos calculos pela estatistica de interesse
return(metadata.print)

}

# FIM FUNCAO

###########################################################################################################################
# REFERENCIAS UTILIZADAS PARA O DESENVOLVIMENTO DA FUNCAO

# Adalardo, A. O, e colaboradores. (2018).http://ecologia.ib.usp.br/bie5782/doku.php?id=start
# Crawley, M.J. (2007). The R Book. Imperial College London at Silwood Park, UK
# Curtis, P.S. (1996). A meta-analysis of leaf gas exchange and nitrogen in trees grown under elevated carbon dioxide. Plant, Cell and Environment
# Hedges, L.V., Olkin, I. (1985). Statistical Methods for Meta-Analysis.United Kingdom Edition 
# Koricheva, J., Gurevitch, H., Mengersen. (2013). Handbook of Meta-analysis in ecology and evolution. Princeton University Press.

# Além, das duvidas tiradas no forum, leitura do material disponibilizado e 
# conversas com os colegas da disciplina.
# http://ecologia.ib.usp.br/bie5782/doku.php?id=start