Índice
- O Curso R
-
- Tutoriais
-
- Apostila
-
- 6. Testes de Hipótese (em preparação!)
- Exercícios
-
- Material de Apoio
-
- Área dos Alunos
-
- Cursos Anteriores
-
IBUSP
Outras Insitutições
Linques
Visitantes
Outras Insitutições
Mestrando em Economia da Saúde - USP.
Projeto de mestrado:
“Avaliação econômica para tratamento de pacientes com câncer”
MEUS EXERCÍCIOS
PROPOSTA DE TRABALHO FINAL - 22/04/2016
Por favor coloque as propostas diretamente no wiki para que possamos discutir aqui mesmo tendo um histórico de mudanças.
Suas 4 primeiras propostas são praticamente a mesma, e não creio que sejam coisas bacanas de ficarem em uma única função. A ideia de uma função não é ser um script completo que automatiza completamente uma analise, mas uma peça identificável da analise, que eventualmente possa ser usada em vários contextos, ou no minimo várias vezes dentro de uma mesma analise. Testar normalidade, fazer gráficos diagnósticos, escolher um modelo, rodar o modelo, diagnosticar o modelo e comparar modelos é coisa demais pra uma função só. Sugiro que vc foque num aspecto só do processo de modelagem, e não tente automatizar tudo. Frequentemente tem muita subjetividade na escolha de um modelo, e principalmente muita dependência na pergunta que vc está interessada em responder. É muito difícil automatizar isso.
A última é um péssimo jeito de montar um modelo linear. Vc deveria incluir variáveis que façam sentido e que possam ser interpretadas afim de responder uma pergunta, e não só tentar montar o conjunto que tem maior R².
Acho que vale a pena pensar mais em uma peça repetível e interessante das analises para transformar em função.
Valeu,
—-Ogro
Veja as indicações sobre como postar propostas e o trabalho no wiki. Lembre-se que temos cerca de 70 alunos para avaliar e se não seguirem as recomendações fica difícil de operacionalizar o curso. Veja se consegue ir pelo caminho que o Diogo apontou. Se não vislumbrar, sugiro que solicite ajuda no forum e se possível vá conversar pessoalmente com algum monitor disponível. Não demore a faze-lo pois o tempo para a execução fica curto. — Alexandre Adalardo de Oliveira 2016/04/29 11:04
Boa tarde, prof. Alexandre e Diogo,
Obrigado pelo retorno sobre o trabalho final.
Tentei reformular, segue abaixo.
PROPOSTA DE TRABALHO FINAL - 29/04/2016
PROPOSTAS - A - REFORMULADA e C
FUNÇÃO MEDIDAS ANTROPOMÉTRICAS
Página de ajuda
antropometricas package:unknown R Documentation Função Medidas Antropométricas Descrição: Calcula o índice de massa corporal(imc) de adultos e idosos, classifica o indice de massa corporal(imc) de adultos e idosos e classifica circunferência abdominal (ca) de adultos. Uso: antropometricas(x) Argumentos: x= data frame contendo as colunas com as variáveis nomeadas e na respectiva ordem: nome, sexo, idade, altura, peso e ca. Detalhes: Os parâmetros de classificação do imc e circunferência abdominal(ca) seguem as normas da Organização Mundial da Saúde (OMS). sexo foi classificado como F (feminino) e M (masculino) idade medida em anos altura medida em metro peso medido em kg circunferência abdominal(ca) medida em cm imc= medido em kg/m² Classificação do imc: Faixa etária de 19 a 65 anos: imc < 18,5 (Baixo Peso) 18,5 =< imc < 25 (Peso Normal) 25 =< imc < 30 (Sobrepeso) 30 =< imc < 35 (Obesidade classe 1) 35 =< imc < 40 (Obesidade classe 2) imc >= 40 (Obesidade classe 3) Faixa etária acima de 65 anos: imc < 22 (Baixo Peso) 22 =< imc =< 27 (Peso Normal) imc > 27 (Excesso de Peso) Classificação da circunferência abdominal(ca): Faixa etária de 19 a 65 anos: Masculino: Aumentada >= 94 cm e < 102 cm Substancialmente aumentada >= 102 cm Feminino: Aumentada >= 80 cm e < 88 cm Substancialmente aumentada >= 88 Valores: Número de NAs excluídos Número de pacientes por faixa etária (menores de 10 anos, entre 10 e 19 anos, entre 19 e 65 anos e maiores de 65 anos). Número de pacientes no data frame gerado, após eleminação dos NAs e classificação do imc e circunferência adominal(ca). Número de pacientes fora dos parâmetros do imc. Número de pacientes fora dos parâmetros da circunferância abdominal. Retorna um data frame contendo as colunas do data frame original mais as colunas de classificação e imc com as variáveis nomeadas e na respectiva ordem: nome, sexo, idade, altura, peso, circunferencia abdominal, classificacao etaria, imc, classificacao imc e classificacao circunferencia abdominal. Exporta um arquivo com data para o diretório do usuário nomeado da seguinte forma: dados.exportados.(ano/mes/dia).csv Avisos: O data frame de entrada deve ter as variáveis de cada coluna nomeadas e na respecitiva ordem mencionada. Veja o exemplo que segue abaixo! Esta função não classifica circunferência abdominal de idosos, pois este não é um parâmetro adotado para vigilância nutricional, segundo recomendações da OMS e Ministério da Saúde. Esta função não calcula e classifica o imc e circuferencia abdominal de crianças e jovens, pois estes possuem outros parâmetros utilizados no cálculo e classificação. Caso o data frame contenha algum dos casos será classificado como "Nao se aplica" e apresentado no console do R a mensagem de aviso. Autor: Carlos Henrique Botelho botelho13@usp.br References: http://www2.einstein.br/Blog/paginas/post.aspx?post=1260 http://www.abeso.org.br/pdf/diretrizes_brasileiras_obesidade_2009_2010_1.pdf http://189.28.128.100/dab/docs/portaldab/publicacoes/orientacoes_coleta_analise_dados_antropometricos.pdf Exemplos: nome sexo idade altura peso ca Carla F 39 1.6 65.5 75.45 Joana F 45 1.7 50 70 Karina F 35 1.7 120.4 100 Manoela F 46 1.65 95 86.25 Maria F 43 1.75 85.34 78 Rita F 37 NA 90.345 90 Marilia NA 50 1.63 98.35 92.35 Joaquim M 45 1.81 80 NA NA M NA 1.75 100.25 100 Pedro M 60 1.73 NA 110.23 Obsevação: Junto com a função será disponibilizado um arquivo que foi criado para testar a função.
Código da função
antropometricas <- function(x) { pacientes <- na.omit(x) # RETIRA TODOS OS PACIENTES QUE TIVEREM ALGUM NA NOS DADOS! # Mostra na tela os avisos: n.NA=length(x$idade)-length(pacientes$idade) # Mostra na tela quantos NAs foram excluidos do data frame. if(n.NA != 0) # Se algum NA foi excluido será exibido no console do R a mensagem do números de valores excluídos. {cat("\t", n.NA," valores NA excluídos\n")} # A funcao cat mostra no console a mensagem criada de aviso. # Arredondar de variaveis com a funcao round pacientes$idade <- round( pacientes$idade, 0 ) # Idade (anos) foi arrendondada sem casas decimais. pacientes$altura <- round( pacientes$altura, 2 ) # Altura (m) foi arrendondada para duas casas decimais. pacientes$ca <- round( pacientes$ca, 2 ) # ca = circuferencia abdominal (cm) foi arredondada para duas casas decimais. pacientes$peso <- round( pacientes$peso, 2 ) # peso (kg) # foi arrendondado para duas casas decimais. # Classificacao etaria # criando o vetor class.idade, para depois classificar as idades. pacientes$class.idade <- ifelse( pacientes$idade < 10, "Crianca", # ifelse foi usado para classificar as faixas etarias, dentro das faixas estabelecidas. ifelse( pacientes$idade < 19, "Jovem", ifelse( pacientes$idade <= 65, "Adulto", "Idoso"))) # Calcular IMC - arredondado para duas casas decimais pacientes$imc <- round( pacientes$peso/( pacientes$altura )^2, 2) # criando o vetor imc a partir da formula imc=peso/m² e arredondando para duas casas decimais. # Classificacao de IMC conforme OMS (1997) pacientes$class.imc <- rep( "Nao se aplica", nrow(pacientes) ) # criando o vetor class.imc com o tamanho dos demais vetores para depois classificar a partir dos valores do imc. # classificando a coluna class.imc com o uso do which para identificar as linhas que possuem a condicao necessaria para "Adultos". pacientes[which( pacientes$imc < 18.5 & pacientes$class.idade == "Adulto"),"class.imc" ] <- "Baixo Peso" pacientes[which( pacientes$imc >= 18.5 & pacientes$imc< 25 & pacientes$class.idade == "Adulto"),"class.imc" ] <- "Peso Normal" pacientes[which(pacientes$imc >= 25 & pacientes$imc < 30 & pacientes$class.idade == "Adulto"),"class.imc" ] <- "Sobrepeso" pacientes[which(pacientes$imc >= 30 & pacientes$imc < 35 & pacientes$class.idade == "Adulto"),"class.imc" ] <- "Obesidade classe 1" pacientes[which(pacientes$imc >= 35 & pacientes$imc < 40 & pacientes$class.idade == "Adulto"),"class.imc" ] <- "Obesidade classe 2" pacientes[which(pacientes$imc >= 40 & pacientes$class.idade == "Adulto"),"class.imc" ] <- "Obesidade classe 3" # classificando a coluna class.imc com o uso do which para identificar as linhas que possuem a condicao necessaria para "Idosos". pacientes[which(pacientes$imc < 22 & pacientes$class.idade == "Idoso"),"class.imc"] <- "Baixo Peso" pacientes[which(pacientes$imc >= 22 & pacientes$imc< 27 & pacientes$class.idade == "Idoso"),"class.imc"] <- "Peso Normal" pacientes[which(pacientes$imc >= 27 & pacientes$class.idade == "Idoso"),"class.imc"] <- "Excesso de Peso" # Classificacao da ca= circunferencia abdominal conforme Diretrizes Brasileiras de Obesidade (2010) - Os parametros sao diferentes para sexo masculino (M) e feminino (F). # Se for do sexo masculino (M) classicar como: ca < 94 como "Normal", ca >= 94 e < 102 como "Aumentada" e ca >= 102 como "Aumentada substancialmente". pacientes$class.ca <- rep( "Nao se aplica", nrow(pacientes) ) # criando o vetor class.ca com o tamanho dos demais vetores para para depois classificar a partir dos valores de ca. # classificando a coluna class.ca com o uso do which para identificar as linhas que possuem a condicao necessaria para o sexo masculino (M). pacientes[which(pacientes$ca < 94 & pacientes$sexo == "M" & pacientes$class.idade == "Adulto" ), "class.ca"] <- "Normal" pacientes[which(pacientes$ca >= 94 & pacientes$ca < 102 & pacientes$sexo == "M" & pacientes$class.idade == "Adulto" ), "class.ca"] <- "Aumentada" pacientes[which(pacientes$ca >= 102 & pacientes$sexo == "M" & pacientes$class.idade == "Adulto" ), "class.ca"] <- "Aumentada substancialmente" # classificando a coluna class.ca com o uso do which para identificar as linhas que possuem a condicao necessaria para o sexo feminino (F). # Se do sexo feminino (F) classicar como: ca < 80 como "Normal", ca >= 80 e < 88 como "Aumentada" e ca >= 88 como "Aumentada substancialmente". pacientes[which(pacientes$ca < 80 & pacientes$sexo == "F" & pacientes$class.idade == "Adulto" ), "class.ca"] <- "Normal" pacientes[which(pacientes$ca >= 80 & pacientes$ca < 88 & pacientes$sexo == "F" & pacientes$class.idade == "Adulto" ), "class.ca"] <- "Aumentada" pacientes[which(pacientes$ca >= 88 & pacientes$sexo == "F" & pacientes$class.idade == "Adulto" ), "class.ca"] <- "Aumentada substancialmente" # Contar o numero de pacientes por faixa etaria menor10 <- sum( pacientes$class.idade == "Crianca" ) entre10e19 <- sum( pacientes$class.idade == "Jovem" ) entre19e65 <- sum( pacientes$class.idade == "Adulto" ) maior65 <- sum( pacientes$class.idade == "Idoso" ) # Mostra na tela os avisos: # Foi usado o paste para agrupar strings e criar o aviso no console do R com o número de pacientes em cada faixa etária. MENSAGEM_menor10 = paste("Ha", menor10 , "pacientes menores de 10 anos. Para estes pacientes esta funcao nao se aplica.\n") MENSAGEM_entre10e19 = paste("Ha", entre10e19, "pacientes entre 10 e 19 anos. Para estes pacientes esta funcao nao se aplica.\n") MENSAGEM_entre19e65 = paste("Ha", entre19e65, "pacientes entre 19 e 65 anos. Para estes pacientes utiliza-se a classificao da circunferncia abdominal e imc.\n") MENSAGEM_maior65 = paste("Ha", maior65, "pacientes maiores de 65 anos. Para estes pacientes a classificao da circunfencia abdominal nao se aplica.\n") # If foi usado para mostrar no console do R somente se o valor da soma da faixa etaria for diferente de zero. if(menor10 != 0) {cat("\t", MENSAGEM_menor10)} # cat para mostrar na tela do R a mensagem. if(entre10e19 != 0) {cat("\t", MENSAGEM_entre10e19)} if(entre19e65 != 0) {cat("\t", MENSAGEM_entre19e65)} if(maior65 != 0) {cat("\t", MENSAGEM_maior65)} # Transformando em fator, para contar a frequencia de cada classificacao do imc e ca. pacientes$class.imc <- as.factor( pacientes$class.imc ) pacientes$class.ca <- as.factor( pacientes$class.ca ) total <- length(pacientes$class.imc) # contando o número total de pacientes que ha no data frame depois da exclusao dos NAs. # somando o numero de pacientes que estao fora dos parametros de imc, ou seja, todos aqueles que nao sao classificados como "Peso Normal". risco.imc <- sum( pacientes$class.imc == "Baixo Peso" | pacientes$class.imc == "Sobrepeso" | pacientes$class.imc == "Obesidade classe 1"| pacientes$class.imc == "Obesidade classe 2"| pacientes$class.imc == "Obesidade classe 3" | pacientes$class.imc == "Excesso de peso") # somando o numero de pacientes que estao fora dos parametros de ca, ou seja, todos aqueles que nao sao classificados como "Normal". risco.ca <- sum( pacientes$class.ca == "Aumentada" | pacientes$class.ca == "Aumentada substancialmente") # Mostra na tela os avisos: MENSAGEM_total = paste("Ha", total , "pacientes no data frame gerado.\n") # Foi usado a funcao paste para juntar strings. cat("\t", MENSAGEM_total) # e depois cat para apresentar o aviso no console do R. MENSAGEM_risco.imc = paste("Ha", risco.imc , "pacientes fora dos parametros de imc.\n") cat("\t", MENSAGEM_risco.imc) MENSAGEM_risco.ca = paste("Ha", risco.ca , "pacientes fora dos parametros de circunferencia abdominal.\n") cat("\t", MENSAGEM_risco.ca) # Renomeia as colunas do dataframe com os nomes por extenso. names( pacientes ) <- c( "nome","sexo","idade","altura","peso","circunferencia abdominal","classificacao etaria","imc","classificacao imc","classificacao circunferencia abdominal") # Referencia para formato de data e hora em https://stat.ethz.ch/R-manual/R-devel/library/base/html/strptime.html # Usei somente ano, mes e dia, assim o usuario tem seus arquivos organizados. arquivo <- paste( "dados.exportados.", format( Sys.time(), "%Y%m%d" ), ".csv", sep="" ) # A ideia e ter os dados organizados de imc e ca a cada intervalo (mes, ciclo de medicacao...) e depois poder fazer alguma analise com os dados. # Exportando o data frame gerado para um arquivo .csv que será salvo no diretorio que o usuario esta utilizando. dados.exportados <- write.table( x = pacientes, file = arquivo, col.names = T, row.names = F, sep = "," ) # write.table para salvar data frame como arquivo. return (pacientes) # retorna o data frame com as colunas do data frame original mais as novas colunas de classificacao etaria, imc, classificacao de imc e classificacao da circunferencia abdmoninal. }
Arquivo da função
Arquivo para testar a função