Mestranda em Bioinformática, USP.
Pesquiso sobre mudanças climáticas e os efeitos nos parâmetros ecofisiológicos na vegetação brasileira. Mediante a estudo de revisão sistemática, meta-análise e experimentos em laboratório.
Além disso, tenho interesses em educação popular, recursos tecnológicos à educação, Big Data, Machine Learning, Blockchain, empreendedorismo social…
Clique aqui para acessar meus exercícios
A meta-análise é um conjunto de métodos estatísticos para comparar quantativamente resultados de diferentes estudos e que abordam uma mesma questão1). Também determina se o efeito de interesse (média da população) existe em uma condição particular (tratamento), comparando-o com as diferentes pesquisas realizadas. Além de auxiliar na síntese e fornecer um panorama dos resultados sobre determinado tema.
O pesquisador precisa realizar uma etapa anterior a meta-analise, que é a revisão sistemática. Para procurar os trabalhos já realizados que abordam a pergunta que se quer responder. O resultado dessa pesquisa é organizado em uma tabela (exemplo de tabela). A partir dos dados anotados na tabela, é possível verificar o efeito de interesse de cada estudo. Esses efeitos combinados podem estimar uma grande média do tamanho do efeito e um intervalo de confiança, e por fim testar se esse efeito geral é diferente de zero.
Para facilitar a visualização dos diferentes resultados obtidos, a proposta da função é gerar um gráfico com a média e calcular o intervalo de confiança para cada estudo.
Veja as fórmulas utilizadas para calcular a média e o intervalo de confiança na função:2)
Description
A função cria um gráfico com a média e calcula o intervalo de confiança.
Usage
metaR (data, namoc, namot, mc, mt, sdc, sdt, measure = mean, replace = TRUE)
Arguments
data
= data.frame contendo as variáveis dos argumentos.namoc
= integer, com o número réplicas do grupo controle.namot
= integer, com o número réplicas do grupo tratamento.mc
= numeric, média do grupo controle.mt
= numeric, média do grupo tratamento.sdc
= numeric, desvio padrão do grupo controle.sdt
= numeric, desvio padrão do grupo tratamento.measure
= logical, indica que a estatística de interesse é a média entre os grupos.replace
= logical, indica que todos os valores serão substituídos.Verificando os parâmetros
data
é um data.frame Se não, escreve: “O argumento data precisa ser um data.frame.”namoc
é um número inteiro e maior que 3? Se não, escreve: “O argumento namoc
precisa ser um número inteiro e > 3.”namot
é um número inteiro e maior que 3? Se não, escreve: “O argumento namot
precisa ser um número inteiro e > 3.”mc
é do tipo numérico? Se não, escreve: “O argumento mc
precisa ser numérico.”mt
é do tipo numérico? Se não, escreve: “O argumento mt
precisa ser numérico.”sdc
é do tipo numérico? Se não, escreve: “O argumento sdc
precisa ser numérico.”sdt
é do tipo numérico? Se não, escreve: “O argumento sdt
precisa ser numérico.”measure
é TRUE? Se não, escreve: “O argumento measure
precisa ser TRUE, pois a estatistica de interesse dessa função é a média.”replace
é TRUE? Se não, escreve: “O argumento replace
precisa ser TRUE.”Pseudo-código:
sdc
e sdt
são os desvio padrão da amostra? Digite S para sim ou N para não”data
[i]for
) reamostragem com reposição.Saída:
Exemplo de output (gráfico):
Vocês já repararam que as lojas de materias de construção estão sempre lotadas, parecendo shopping? A maioria das pessoas que frequentam esses lugares estão em busca de dar uma repaginada no visu da casa, dar uma modernizada, fazer um puxadinho, ou decidem fazer uma reforma simplesmente porque querem e podem. Ah! Tem os casos específicos, mães, as que todo ano pintam a casa inteira, pois acreditam que passar o ano novo sem pintar a casa dá azar (suspeito que foi algum vendedor de tinta que criou essa lenda). E casos “ raros” de pessoas que tem tics por derrubar parede, trocar piso, reformar a sala, mudar isso ou aquilo…
Num mundo ideal, a melhor escolha seria contratar um profissional e realizar um orçamento da quantidade de todos os materiais necessários para fazer a reforma. Porém, de pedreiro e louco todo mundo tem um pouco. Claro, que as pessoas decidem ir comprando ao longo da reforma sem nenhum planejamento de custo e estimativa da quantidade dos materiais a serem utilizados. Então, para auxiliar as pessoas que irão fazer uma reforma, mas que querem economizar e fazer um planejamento dos custos. A proposta de função, é criar um algoritmo que otimize, calcula a quantidade de material a ser utilizado por m2, e cria uma tabela com todos os gastos para cada tipo de material escolhido.
Description
A função irá calcular a quantidade de cada material a ser utilizado por m2, retorna um data frame com os custos e quantidade dos materiais.
Usage
reformaR (tijolo, m2tijo, typetijo, piso, m2piso, typepiso, telhado, m2telha, typetelha, tinta, m2parede, m2teto, typetinta, areia, m3areia, cimento, m2cim, brita, m3brita, data)
Arguments
tijolo
= numeric, preço do tijolo por m2.m2tijo
= numeric, m2 a ser construido.typetijo
= string de caracteres com o tipo do tijolo.piso
= numeric com o preço do m2.m2piso
= numeric, m2 a ser colocado o piso.typepiso
= string de caracteres com o tipo de piso.telhado
= numeric com o preço do m2.m2telha
= numeric com o m2 da area a ser coberta.typetelha
= string de caracteres com o tipo da telha.tinta
= numeric com o preço do m2.m2parede
= numeric com o m2 total da parede.m2teto
= numeric com o m2 total do teto.typetinta
= string de caracteres com o tipo de tinta.areia
= numeric, preço por m3.m3areia
= numeric, m2 total da area.cimento
= numeric, preço por unidade (saco).m2cim
= numeric com m2 total da area.brita
= numeric com m2 total da area.m3brita
= numeric com m2 total da area.data
= data frame, opcional, o usuario pode inserir um data frame com todos os argumentos acima.Observação: a metodologia com os parâmetros para calcular a quantidade minima por m2 será de acordo com TISAKA, 2006.4)
Verificando os parâmetros:
tijolo
, m2tijo
, piso
, m2piso
, telhado
, m2telha
, tinta
, m2parede
, m2teto
, areia
, m3areia
, cimento
, m2cim
, brita
, m3brita
é númerico e > 0 ? Se não, escreva: “ O argumento[i] precisa ser do tipo numérico e > 0.typetijo
, typepiso
, typetelha
, typetinta
é string e umas das opções pré determinadas ? Se não, escreva; “ O argumento [i] precisa ser do tipo string e umas das opções listadas.”data
é um data frame ? Se não, escreva: “ O argumento data precisa ser do tipo data.frame.”Pseudo-código:
data
. Então, leia data.frame com os argumentos para cada colunatijolo
. Então, mostre na tela as opções para escolher o tipo de tijolo (usar função switch para criar lista de opções).typetijo
[i]typepiso
[i]typetelha
[i]typetinta
[i]tijolo
, piso
, telha
, tinta
).tijolo
, piso
, telha
, tinta
) com o menor até o maior custo e a quantidade total.Saída:
Um data frame com os valores e quantidade necessária para cada material de construção por m2.
Janaína, seu plano A parece super legal e interessante, só recomendo fortemente que vc explique melhor o que a função vai calcular usando bootstrap. Isso vai ser especialmente importante na hora de escrever o help!
Sugiro fazer o plano A mesmo, apesar do texto do plano B ser maravilhoso.
Oi Danilo, obrigada pela sugestão
Realmente preciso definir o cálculo usando bootstrap, essa parte ainda está meio obscura
Decidimos (Eu, Danilo e o acaso ) seguir com a proposta A.
Como observado, a parte do bootstrap não estava clara na função. E como nos estudos com meta-análise, geralmente não se tem o acesso aos dados brutos. Optei, por não fazer o bootstrap e calcular o intervalo de confiança a partir de fórmulas estatísticas encontradas na literatura (veja as fórmulas na descrição do plano A). Também, optei por mudar os argumentos da função. Antes, o usuário teria que inserir cada valor manualmente nos argumentos da função. O que dispensaria tempo. Então, deixei como argumento da função um data.frame de entrada que conterá todos os dados necessários para a função
Portanto, a função calcula a média padronizada de cada estudo e o intervalo de confiança. Cria um gráfico, estilo forest plot e retorna um data.frame ao usuário.
Além, do que foi acordado,a função cria novas colunas no data.frame com os valores que podem ser utilizados para análise estatística, como: fator de correção (J) , grau de liberdade (df), estatística (Z), variância (var.d), erro padrão (SE.d).
Para que a função execute é necessário que o usuário coloque exatamente os nomes pré estabelecidos para o cabeçalho. O que restringe o usuário a usar apenas esses nomes. Porém, ao desenvolver a função quis ter a certeza que o cálculo realizado na função seria dos valores correspondente a cada coluna. Por isso, restringir o nome para ter certeza que os valores serão inseridos corretamente. Como, quero utilizar esta função pretendo resolver posteriormente essa limitação. Outra limitação, o titulo da legenda do lado esquerdo e direito não ficam alinhados com a descrição da legenda.
Referências: