Graduada e mestranda em Saúde Pública, Faculdade de Saúde Pública, USP.
Projeto de pesquisa: Análise espacial e espaço-temporal dos óbitos por câncer de mama e de colo de útero, município de São Paulo, 2000 a 2016.
Orientador: Francisco Chiaravalloti Neto.
Co-orientadora: Alessandra Cristina Guedes Pellini
Link para acesso aos meus Exercícios.
## Função para Padronização direta de taxas stRate <- function (df.event, df.pop, df.pop.st = NULL, mult = 100000, crude.rt = TRUE) { #Atribui ao objeto "stRate" a função #com os argumentos que estão listados entre virgulas, dentro dos parênteses. #### Realizando os controles de fluxo ## CONTROLE DE FLUXO: Os objetos de entrada df.event; df.pop; (e df.pop.st, #se for o caso) são da classe data.frame? if (class(df.event) != "data.frame" | class(df.pop) != "data.frame") { #Se a #classe do objeto 'df.event' for diferente de "data.frame" ou a classe do #objeto "df.pop" for diferente da classe "data.frame". stop ("Os objetos 'df.event' e 'df.pop' devem possuir a classe data.frame. Faça as correções necessárias e rode a função novamente.")} # Então, a função para e retorna uma mensagem de erro. if (!is.null(df.pop.st) & class(df.pop.st) != "data.frame") { # Se o usuário #escolheu colocar um objeto no argumento 'df.pop.st', ou seja, se este for #diferente de nulo no argumento da função "E" a classe do objeto inserido #pelo usuário para esse argumento for diferente de "data.frame." stop ("O objeto 'df.pop.st' deve possuir a classe data.frame. Faça as correções necessárias e rode a função novamente.")} #Então, a #função para e retorna uma mensagem de erro. ## CONTROLE DE FLUXO: Os objetos de entrada df.event; df.pop; ( e df.pop.st, #se for o caso) contém na posição [1] uma coluna de identificação? Se não, a #função para e retorna uma mensagem ao usuário para correção. ANSWER_1 <- readline(prompt = " \n PERGUNTA 01/02: DIGITE SUA RESPOSTA AQUI NO CONSOLE! \n A PRIMEIRA COLUNA EM TODOS OS SEUS OBJETOS DE ENTRADA CORRESPONDE À UMA COLUNA DE IDENTIFICAÇÃO (ID) ? \n O ID DEVE APRESENTAR A MESMA SEQUÊNCIA EM TODOS OS OBJETOS. DIGITE s para SIM ou n para NÃO: s / n ? ") #Atribui ao #objeto "ANSWER_1" a função 'readline' que irá exibir um prompt na tela do #console com uma pergunta que deverá ser respondida pelo usuário digitando #"s" para sim ou "n" para não. if(ANSWER_1 == "n") { #Se a resposta for igual a não stop ("Insira uma coluna de identificação na posição 1 [, 1] em todos os objetos de entrada. Esta coluna não precisa ser numérica, mas deve apresentar a mesma sequência entre todos os objeto de entrada. Faça as correções necessárias e rode a função novamente.")} # Então, a função para e retorna uma mensagem de erro. # Observação: como o campo de ID sempre é aconselhável estar presente em um #banco de dados. A função foi construída para realizar as operações #considerando este ID e realizando as operações sempre a partir da coluna de #posição 2. Desde modo, o usuário é notificado disso e, ao digitar sim #, assume a responsabilidade de que o não cumprimento deste critério #compromete os resultados finais da função. #Essa coluna de identificação não precisa ser numérica. Pode ser nome do #município, por exemplo. ## CONTROLE DE FLUXO: Os objetos de entrada df.event; df.pop; ( e df.pop.st, #se for o caso) contém nas posições [2] em diante de colunas, variáveis #numéricas com as respectivas contagens? Se não, a função para e retorna uma #mensagem ao usuário para correção. if(any (apply(df.event [, 2: ncol(df.event)], 2, is.character)) #Se qualquer #observação for caractere em qualquer linha, entre a coluna dois até a #última coluna (especificado por meio do n° total de colunas) do objeto #'df.event' | any (apply(df.pop[, 2: ncol(df.pop)], 2, is.character)) # OU se qualquer #observação for caractere em qualquer linha, entre a coluna dois até a #última coluna (especificado por meio do n° total de colunas) do objeto #'df.pop' | any (apply(df.event [, 2: ncol(df.event)], 2, is.logical)) #'OU' se #qualquer observação for lógica em qualquer linha, entre a coluna dois #até a última coluna (especificado por meio do n° total de colunas) do #objeto 'df.event' | any (apply(df.pop[, 2: ncol(df.pop)], 2, is.logical))) { # OU se #qualquer observação for lógica em qualquer linha, entre a coluna dois até #a última coluna (especificado por meio do n° total de colunas) do objeto #'df.pop' ( stop("Em todas as colunas (exceto a primeira, de identificação (ID)) dos objetos de entrada, as observações contidas devem ser números (numéricas)! Faça as correções necessárias e rode a função novamente.")) } # Então, a função para e retorna uma mensagem de erro. #Observação: o ideal seria utilizar "!is.numeric", porém a função apply não #aceita esta opção. if (!is.null(df.pop.st)) { # Se o usuário escolheu colocar um objeto no #argumento 'df.pop.st', ou seja, se este for diferente de nulo no argumento #da função if(any (apply(df.pop.st [, 2: ncol(df.pop.st)], 2, is.character)) # Se o #usuário escolheu colocar um objeto no argumento 'df.pop.st', ou seja, #se este for diferente de nulo no argumento da função | any (apply(df.pop.st [, 2: ncol(df.pop.st)], 2, is.logical))){ #OU se #qualquer observação for lógica em qualquer linha, entre a coluna dois #até a última coluna (especificado por meio do n° total de colunas) do #objeto 'df.pop.st' stop("Em todas as colunas (exceto a primeira, de identificação) do objeto de entrada 'df.pop.st', as observações contidas devem ser números (numéricas)! Faça as correções necessárias e rode a função novamente.") # Então, a função para e retorna uma mensagem de erro. } } ## CONTROLE DE FLUXO: Os objetos de entrada df.event; df.pop; ( e df.pop.st, #se for o caso) contém o mesmo número de linhas (locais ou ano) e colunas #(variáveis)? Se não, a função para e retorna uma mensagem ao usuário para #correção. if (ncol(df.event) != ncol(df.pop) | nrow(df.event) != nrow(df.pop)) { #Se o #número de colunas do objeto 'df.event' for diferente do número de colunas #do objeto 'df.pop' "OU" se o número de linhas do objeto 'df.event' for #diferente do número de linhas do objeto 'df.pop' stop ("Os objetos 'df.event' e 'df.pop' devem possuir o mesmo número de linhas (localidade) e o mesmo número de colunas (id e colunas dos estratos que serão utilizadas na padronização), as observações contidas devem ser números (numéricas)! Faça as correções necessárias e rode a função novamente.") # Então, a função para e retorna uma mensagem de erro. } if (!is.null(df.pop.st)) { #Se o usuário escolheu colocar um objeto no #argumento 'df.pop.st', ou seja, se este for diferente de nulo no argumento #da função if (ncol(df.pop.st) != ncol(df.event) | nrow(df.pop.st) != nrow(df.event)){ #Se o número de colunas do objeto 'df.pop.st' for diferente do número de #colunas do objeto 'df.event' "OU" se o número de linhas do objeto #'df.pop.st' for diferente do número de linhas do objeto 'df.event' stop ("Os objetos 'df.pop.st', 'df.event' e 'df.pop' devem possuir o mesmo número de linhas (localidade) e o mesmo número de colunas (id e colunas dos estratos que serão utilizadas na padronização). Faça as correções necessárias e rode a função novamente.") #Então, a função #para e retorna uma mensagem de erro. } } ## CONTROLE DE FLUXO: Os objetos de entrada df.pop; ( e df.pop.st, se for o #caso) contém o valor zero ou NA? Se sim, a função para e retorna uma #mensagem ao usuário para correção. if(any (apply(df.event [, 2: ncol(df.event)], 2, is.na)) #Se qualquer #observação for NA em qualquer linha, entre a coluna dois até a última #coluna (especificado por meio do n° total de colunas) do objeto #'df.event' | any (apply(df.pop [, 2: ncol(df.pop)], 2, is.na))){ # OU se qualquer #observação for NA em qualquer linha, entre a coluna dois até a última #coluna (especificado por meio do n° total de colunas) do objeto 'df.pop' stop("Os objetos de entrada 'de.event'e 'df.pop' NÃO devem possuir nenhum valor NA. Faça as correções necessárias e rode a função novamente.") # Então, a função para e retorna uma mensagem de #erro. } else if (any (df.pop [, 2:ncol(df.pop)] == 0)) { # Se não e se qualquer #observação for ZERO em qualquer linha, entre a coluna dois até a última #coluna (especificado por meio do n° total de colunas) do objeto 'df.pop' stop("O objeto 'df.pop' NÃO deve possuir nenhum valor zero. Faça as observações contidas devem ser números (numéricas)! Faça as correções necessárias e rode a função novamente.") # Então, a função para e retorna #uma mensagem de erro. } #Observação: A conferência para valores zero precisa ser posterior a #conferência de NAs para não ocorrer erro. Além disso, a conferência para #valores zero só é necessária para o denominador, ou seja, população, uma vez #que não se pode dividir por zero. #Há diferentes maneiras de lidar com valores zero no banco, optou-se por #deixar o usuário escolher sua maneira, resolver fora da função e #posteriormente retornar a função. if (!is.null(df.pop.st)) { #Se o usuário escolheu colocar um objeto no #argumento 'df.pop.st', ou seja, se este for diferente de nulo no argumento #da função if(any (apply(df.pop.st [, 2: ncol(df.pop.st)], 2, is.na))) { #Se qualquer observação for NA em qualquer linha, entre a coluna dois até a última coluna (especificado por meio do n° total de colunas) do objeto 'df.pop.st' stop("O objeto de entrada 'df.pop.st'NÃO deve possuir nenhum valor NA. Faça as correções necessárias e rode a função novamente.") #Então, a função para e retorna uma mensagem de erro. } else if (any (df.pop.st[, 2:ncol(df.pop.st)] == 0)) #Se não e se qualquer #observação for ZERO em qualquer linha, entre a coluna dois até a última #coluna (especificado por meio do n° total de colunas) do objeto #'df.pop.st' stop("O objeto de entrada 'df.pop.st'NÃO deve possuir nenhum valor zero. Faça as correções necessárias e rode a função novamente.") #Então, a função para e retorna #uma mensagem de erro. } ## CONTROLE DE FLUXO: O usuário respondeu (por meio da função readline) que #seus dataframes fornecidos NÃO possuem a mesma sequência em relação aos #extratos? Se não, a função para e retorna uma mensagem ao usuário para #correção. ANSWER_2 <- readline(prompt = " \n PERGUNTA 02/02: \n AS DEMAIS COLUNAS APRESENTAM A MESMA ORDEM (MESMA POSIÇÃO DE COLUNAS) EM TODOS OS OBJETOS DE ENTRADA?\n DIGITE s para SIM ou n para NÃO: s / n ? ") #Atribui ao #objeto "ANSWER_2" a função 'readline' que irá exibir um prompt na tela do #console com uma pergunta que deverá ser respondida pelo usuário digitando "s" #para sim ou "n" para não. if(ANSWER_2 == "n") { #Se a resposta for igual a não stop ("Os objetos de entrada devem apresentar a mesma sequência em relação aos estratos. Exemplo: Se você colocou a coluna referente a contagem pela faixa etária de 00 a 14 anos de idades na posição 2 de coluna [, 2] no objeto 'df.event', então, esta coluna deve ocupar a mesma posição, posição 2 de coluna [, 2] no objeto 'df.pop'. Faça as correções necessárias e rode a função novamente.") #Então, a função para e retorna uma mensagem de erro. } #Observação: este controle evita que o usuário insira objetos com diferentes #ordens das sequencias de estratos entre os mesmos. Assim, o usuário recebe a #informação que seus estratos precisam estar na mesma de sequência em relação #as colunas e digitando "sim", assume a responsabilidade, uma vez que ordens #diferentes irão resultar em resultados errôneos. ## CONTROLE DE FLUXO: O usuário deixou a opção df.pop.st = NULL? Se sim, #verifica se os objetos de entrada df.event; df.pop contém quatro colunas. #Se sim, mostrar uma mensagem que será utilizada a população padrão da OMS. #Se não, a função para e retorna uma mensagem ao usuário para correção. if (is.null(df.pop.st) & ((ncol(df.event) != 4) #Se o usuário deixou a opção #'df.pop.st' como default , ou seja, igual a nulo #no argumento da função "E" o número de colunas do objeto 'df.event' for #diferente de 4 | is.null(df.pop.st) & (ncol(df.pop) != 4))) { #OU se #o usuário escolheu colocar um objeto no argumento 'df.pop.st', ou seja, se #este for diferente de nulo no argumento da função "E" o número de colunas do #objeto 'df.pop' for diferente de 4 stop ("O banco utilizado para a padronização será o da OMS, com um ID e três colunas de estratos etários (estrato 1: 00 a 14 anos de idade; estrato 2: 15 a 59 anos de idade; e estrato 3: 60 anos e mais de idade). Nesta ordem! Portanto, os objetos 'df.event' e 'df.pop' devem também ter quatro colunas. A primeira correspondente ao ID e as demais com a mesma ordem de estratos que o banco da OMS. Faça as correções necessárias e rode a função novamente.") #Então, a função para e retorna uma mensagem de erro. } if (is.null(df.pop.st)) { #Se o usuário deixou a opção 'df.pop.st' como default #ou seja, igual a nulo cat(" \n \t A população padrão que está sendo utilizada é a da OMS, conforme consta no HELP \n \n") #Se não, é apresentado no console uma mensagem de que a população padrão #utilizada é a da OMS } #Observação: este controle é necessário, porque a opção default de df.pop.st' #apresenta 4 colunas. Logo, os objetos de entrada também devem apresentar este #número. #### Construindo o banco de dados com a população padrão da OMS para ser utilizada #caso o usuário mantenha a opção default 'df.pop.st' = NULL. if(is.null(df.pop.st)) { # Se o usuário escolheu manter a opção default para #'df.pop.st', ou seja, 'df.pop.st' = NULL df.pop.st <- data.frame(cod = df.event[1], #Então é atribuído ao objeto #'df.pop.st' um data.frame, com a primeira coluna correspondente a #'#primeira coluna do objeto 'df.event', com o nome "cod" poppadr00_14 = rep(26139, nrow(df.event)), #A segunda #coluna corresponde a repetição do valor da população padrão da OMS de #00 a 14 anos de idade. O número de repetições é equivalente ao número #de linhas do objeto 'df.event', com o nome da coluna correspondente a #"poppadr00_14" poppadr15_59 = rep(61920, nrow(df.event)), # A terceira #coluna corresponde a repetição do valor da população padrão da OMS de #15 a 59 anos de idade. O número de repetições é equivalente ao número #de linhas do objeto 'df.event', com o nome da coluna correspondente a #"poppadr15_59" poppadr60_em = rep(11941, nrow(df.event))) } # A quarta #coluna corresponde a repetição do valor da população padrão da OMS de #60 anos e mais de idade. O número de repetições é equivalente ao número #de linhas do objeto 'df.event', com o nome da coluna correspondente a #poppadr60_em" #### Criando uma matriz vazia para receber o valor de eventos que seriam esperados #caso a população observada correspondesse ao valor da população padronizada. ob_esp <- matrix(NA, ncol = ncol(df.event), nrow = nrow(df.event)) #Atribui ao #objeto "ob_esp" uma matriz com valores NA, com o número de colunas correspondente #ao número de colunas do objeto 'df.event' e com o número de linhas correspondente #ao número de linhas do objeto 'df.event' #### Criando um ciclo para preencher os valores de eventos esperados. #Regra de três para cada estrato: "Evento observado" está para "População observada", #assim como "Evento esperado" está para a "População padrão" # "Evento esperado" é igual a multiplicação do "Evento observado" pela #"População padrão" correspondente, dividido pela "População observada" também #correspondente for(i in 1:nrow(df.event)){ # Para o contador i indo de 1 até o número de linhas #do objeto 'df.event' for (j in 2:ncol(df.event)){ #Para o contador j indo de 2 até o número de #colunas do objeto 'df.event' ( a coluna 1 ficará vazia) ob_esp[i, j] <- (df.event[i, j] * df.pop.st[i, j]) / df.pop[i, j] #Atribui #ao objeto 'ob_esp' na posição i de linha, que no primeiro ciclo é 1, e na #posição j de coluna, que no primeiro ciclo é 2, a multiplicação do valor do #objeto 'df.event', na mesma posição de linha e coluna, com o valor do objeto #'df.pop.st', na mesma posição de linha e coluna, com o resultado dividido #pelo valor do objeto 'df.pop' na mesma posição de linha e coluna } } ob_esp <- data.frame(ob_esp) # Faz a coerção do objeto "ob_esp" para data.frame #### Calculando a taxa padronizada st_rate <- data.frame (cod = df.event[1], #Atribui ao objeto 'st_rate' um #data.frame com a primeira coluna correspondente à primeira #coluna do objeto 'df.event', com o nome "cod" st_rt = round((apply(ob_esp [, 2:ncol(ob_esp)], 1, sum) * mult ) # A #segunda coluna corresponde a soma, por linha, dos valores #do objeto 'ob_esp' entre a coluna 2 até a última coluna #(especificado por meio do n° total de colunas do objeto #''ob_esp'). Este resultado multiplicado pelo objeto 'mult' / apply(df.pop.st[, 2:ncol(df.pop.st)], 1, sum), 2)) # Este resultado #dividido pela soma, por linha, dos valores do objeto #'df.pop.st' entre a coluna 2 até a última coluna (especificado #'#por meio do n° total de colunas do objeto 'df.pop.st'). #'#Este resultado arredondado para duas casas decimais #### Calculando a taxa não ajustada (Bruta) if(crude.rt == TRUE) { # Se o usuário escolheu manter a opção default para #'crude.rt', ou seja, 'crude.rt' = TRUE crude.rt <- data.frame (cod = df.event[1], # Então é atribuído ao objeto #"crude.rt" um data.frame com a primeira coluna correspondente #rimeira coluna do objeto 'df.event', com o nome "cod" crude.rt = round((apply(df.event [, 2:ncol(df.event)], 1, sum) * # A segunda #coluna corresponde a soma, por linha, dos valores do objeto #'df.event' entre a coluna 2 até a última coluna #(especificado por meio do n° total de colunas #do objeto ''df.event). mult ) / apply(df.pop [, 2:ncol(df.pop)], 1, sum), 2))# Este #resultado multiplicado pelo objeto 'mult'. Em seguida, o novo resultado é dividido #pela soma, por linha, dos valores do objeto 'df.pop' entre a coluna 2 até a última #coluna (especificado por meio do n° total de colunas do objeto 'df.pop'). #Este resultado é arredondado para duas casas decimais exit <- cbind(crude.rt , st_rate[, -1]) #Atribui ao objeto "exit" a junção por #colunas dos objetos 'crude.rt' e 'st_rate[, -1]' com exceção da primeira coluna, #para que no banco não tenham dois campos de identificação names(exit) <- c("ID", "Taxa Bruta", "Taxa Padronizada") #Renomeia os nomes #das colunas do objeto 'exit' } else { # Se não, se o usuário selecionou a opção 'crude.rt' = FALSE exit <- st_rate # Então, atribui ao objeto 'exit' apenas a taxa padronizada, #objeto 'st_rate' names(exit) <- c("ID", "Taxa Padronizada") # Renomeia os nomes das colunas #do objeto 'exit' } return (exit) # Retorna o objeto 'exit' }
stRate package:unknown R Documentation ~~ Função para padronizar taxas pelo método direto~~ Description ~~ A função calcula as taxas não ajustadas e faz a padronização direta por idade das taxas de um evento por 100 mil habitantes, utilizando como população padrão a da Organização Mundial da Saúde. Também permite padronizar por outras variáveis de interesse e utilizar outra população padrão. ~~ Usage ~~ stRate(df.event, df.pop, df.pop.st = NULL, mult = 100000, crude.rt = T)~~ Arguments ~~''df.event'' Um data.frame com uma coluna de identificação na primeira posição de coluna [, 1] e com a contagem de eventos observados por estratos, nas demais posições de colunas. Se ''df.pop.st'' = NULL, os estratos de ''df.event'' deverão ser os mesmos que os contidos no argumento ''df.pop.st''. ~~ ~~''df.pop'' Um data.frame com a mesma coluna de identificação do objeto ''df.event'', na primeira posição de coluna [, 1], e com a contagem de populações observadas, pelos mesmos estratos e posições de coluna do objeto ''df.event''. ~~ ~~''df.pop.st'' Um data.frame com a contagem de populações padrão com a mesma coluna de identificação e mesma posição de estratos fornecidos no objeto ''df.event''. Se ''df.pop.st'' = NULL, a contagem de populações padrão será a da Organização Mundial da Saúde, com três estratos etários (ver detalhes).~~ ~~''mult'' Um vetor numérico utilizado como multiplicador para evitar valores fracionados de difícil interpretação. ~~ ~~''crude.rt'' Um vetor lógico para apresentação das taxas não ajustadas (brutas). ~~ Details ~~ A coluna de identificação em todos os objetos de entrada pode ser um local, um ano, código de setor, nome de município ou outro. Os eventos observados podem ser casos, óbitos, agravos ou outros. Os estratos podem ser categorias por faixa etária, categorias por sexo ou outros. ~~ ~~ No objeto ''df.pop.st'', quando este é nulo (default), a população padrão utilizada como é a da Organização Mundial da Saúde (OMS), que está dividida nos seguintes estratos: segunda coluna correspondente a contagem de 00 a 14 anos de idade; terceira coluna equivalente a contagem de 15 a 59 anos de idade; e quarta coluna referente a contagem de 60 anos e mais de idade.¹ ~~ ~~ O método utilizado para a padronização, é o método direto.² ~~ Value ~~ Se ''crude.rt'' = TRUE (defalut), retorna um data.frame, com uma coluna com a mesma identificação fornecida pelo usuário, uma segunda coluna com as taxas padronizadas por pelo método direto e uma terceira coluna com as taxas não ajustadas (brutas).~~ ~~ Se ''crude.rt'' = FALSE retorna um data.frame de saída com uma coluna com a mesma identificação fornecida pelo usuário e uma segunda coluna com as taxas padronizadas pelo método direto.~~ ~~ Se ''mult'' = 100000, os resultados das taxas serão multiplicados por 100 mil habitantes. ~~ ~~ Se ''df.pop.st'' = NULL, a população utilizada para a padronização das taxas será a da Organização Mundial da Saúde.~~ Warning: ~~ Os objetos de entrada devem:~~ ~~ - ser da classe data.frame ~~ ~~ - apresentar uma primeira coluna comum de identificação ~~ ~~ - apresentar colunas por categorias de estrados comum entre todos os objetos, constando mesma ordem de posição de coluna e com observações numéricas. ~~ ~~ - não apresentar valores NAs ou valores zero (este último, exceto para o objeto de entrada ‘df.event’). ~~ Note: ... References ~~ 1. National Cancer Institute. World (WHO 2000-2025) Standard. Acesso em: 18 jun 2019. Disponível em <https://seer.cancer.gov/stdpopulations/world.who.html> ~~ ~~ 2. National Cancer Institute. SEER*Stat Tutorials: Calculating Age-adjusted Rates. Acesso em: 18 jun 2019. Disponível em<https://seer.cancer.gov/seerstat/tutorials/aarates/definition.html> ~~ Author ~~ Patricia Marques Moralejo Bermudi patricia.bermudi@usp.br~~ See Also ... Examples ##Exemplo 1 ## df.event <- data.frame(cod_local = seq(1:3), ## c0_14 = c(3, 200, 500), ## c15_60 = c(8, 400, 1090), ## c60_em = c(50, 4800, 19200)) ## df.pop <- data.frame(cod_local = seq(1:3), ## p00_14 = c(603500, 225957, 150367), ## p15_60 = c(272373, 573743, 541965), ## p60_em = c(41630, 167600, 107313)) ##x <- stRate(df.event, df.pop) ##x ## A população padrão que está sendo utilizada é a da OMS, conforme consta no HELP ## ID Taxa Bruta Taxa Padronizada ## 1 1 17.00 43.00 ## 2 2 544.09 393.15 ## 3 3 1589.58 1430.01 ##Exemplo 2 ##df.event <- data.frame(cod_local = seq(1:3), ## c1 = c(3, 200, 500), ## c2 = c(50, 4800, 19200)) ##df.pop <- data.frame(cod_local = seq(1:3), ## p1 = c(60350, 22595, 15036), ## p2 = c(4163, 16760, 10731)) ##df_st <- data.frame(cod_local = seq(1:3), ## pp1 = rep(58080, 3), ## pp2 = rep(81920, 3)) ##y <- stRate(df.event, df.pop, df.pop.st = df_st, mult = 10000, crude.rt = F) ##y ## ID Taxa Padronizada ##1 1 70.49 ##2 2 1712.55 ##3 3 10607.38
Comparar taxas sem nenhum ajuste (taxas brutas), entre locais ou entre diferentes períodos de tempo no mesmo local, pode induzir à interpretações errôneas. É necessário considerar que diferentes populações podem apresentar diferentes distribuições de determinantes que estão relacionados ao evento de estudo. Deste modo, a padronização direta de taxas é um método utilizado para retirar esse efeito de confusão, fazendo um ajuste por uma ou mais variáveis presentes na população que estão causando confundimento.
Nesta padronização, as populações observadas que serão comparadas (separadas em estratos segundo a variável de interrese) são matematicamente ajustadas para a estrutura de uma população escolhida ('população padrão'). Assim, a medida obtida representa a taxa 1) de um local, considerando que este teria a mesma distribuição da população adotada como “padrão” em relação a variável escolhida para o ajuste.
Na área da saúde, é comum realizar a padronização pela variável idade 2) e usar, como população padrão, a estrutura de estratos da população elaborada pela da Organização Mundial da Saúde, que nesta função será agrupada em três estratos (jovens3), adultos4) e idosos5)) e deixada como default.
Cálculo de uma taxa não ajustada (bruta) ‘crude.rt’:
Cálculo dos eventos esperados de um extrato z ‘espct_event’ de um estrato apenas:
Título: stRate (standardised rate).
Entrada: stRate (df.event
, df.pop
, df.pop.st
= NULL, mult
= 100000, crude.rt
= TRUE)
df.pop
Um dataframe com a contagem de populações observadas, pelos mesmos estratos e variável de identificação fornecidos no objeto df.event
.df.pop.st
Um dataframe com a contagem de populações padrão pelos mesmos estratos e variável de identificação fornecidos no objeto df.event
. Se df.pop.st
= NULL, a contagem de populações padrão será a da Organização Mundial da Saúde.mult
Um vetor númerico utilizado como multiplicador para evitar valores fracionados de difícil interpretação. Se mult
= 100000, os resultados das taxas serão multiplicados por 100 mil habitantes. crude.rt
Um vetor lógico. Se crude.rt
= TRUE, realiza e apresenta o cálculo das taxas não ajustadas (brutas). df.event
; df.pop
; ( e df.pop.st
, se for o caso) são da classe data.frame? Se não, a função para e retorna uma mensagem ao usuário para correção.df.event
; df.pop
; ( e df.pop.st
, se for o caso) contém na posição [1] uma coluna de identificação? Se não, a função para e retorna uma mensagem ao usuário para correção.df.event
; df.pop
; ( e df.pop.st
, se for o caso) contém nas posições [2] em diante de colunas, variáveis numéricas com as respectivas contagens? Se não, a função para e retorna uma mensagem ao usuário para correção.df.event
; df.pop
; ( e df.pop.st
, se for o caso) contém o mesmo número de linhas (locais ou ano) e colunas (variáveis)? Se não, a função para e retorna uma mensagem ao usuário para correção. df.pop
; ( e df.pop.st
, se for o caso) contém o valor zero ou NA? Se sim, a função para e retorna uma mensagem ao usuário para correção. crude.rt
= FALSE? Se sim, a função não realiza o cálculo e não apresenta os valores das taxas não ajustadas (brutas). df.pop.st
= NULL? Se sim, verifica se os objetos de entrada df.event
; df.pop
contém quatro colunas. Se sim, mostrar uma mensagem que será utilizada a população padrão da OMS. Se não, a função para e retorna uma mensagem ao usuário para correção.df.pop.st
)’: cria um objeto df.pop.st
, da classe 'data.frame' que contém:df.cases
df.cases
. expct_event
. df.cases
expct_event
em data.framefor
para preencher expct_event
i
de 1 até o número de linhas do objeto df.cases
k
de 2 até o número de colunas do objeto df.cases
expct_event
nas posições i
e k
: df.cases
nas posições i
e k
, pela população padrão df.pop.st
nas posições i
e k
df.pop
nas posições i
e k
.st_rate
df.cases
e uma segunda coluna com o cálculo da taxa, arredondando para duas casas decimais apply
: faz a somatória, por linhas, de todas as colunas dos eventos esperados expct_event
, exceto a coluna um, que é de identificação. mult
apply
, por linhas, de todas as colunas das populações padrão df.pop.st
, exceto a coluna um.crude_rt
== TRUE: cria um objetost_crude
, da classe data.frame: da taxa não ajustada (bruta), arredondando para duas casas decimais:df.cases
df.event
, exceto a coluna um, que é de identificaçãomult
apply
, por linhas, de todas as colunas das populações observadas df.pop
, exceto a coluna um.exit
st_rate
e com as taxas brutas st_crude
, esta última sem a coluna de identificaçãoexit
apenas com as taxas padronizadas st_rate
exit
df.event
, com uma coluna referente as taxas padronizadas e, se escolhido pelo usuário, com uma coluna referente as taxas brutas.Comentários Lucas Camacho
Sua proposta está super completa e bem estruturada. Acho que você estudou bem como fazer ela e gostei bastante do tópico sobre generalização da função e como dá pra usar elas em outros contextos.
Enfim, acho legal você tentar entregar ela.
Resposta Patricia
Te mandei um e-mail com uma dúvida.
Grata! Abraços
A média móvel simples tem o objetivo de suavizar uma tendência de um conjunto de dados que apresenta flutuação aleatória ao longo do tempo. Seu cálculo é dado por meio de média aritmética, comumente realizada a cada três valores. Assim, esta se inicia na posição um e vai se descolando até o final, ao longo do conjunto de dados, de uma em uma unidade de período de tempo (dias, meses, ano, etc). Exemplo
Título: movMean (Moving mean).
Entrada: movMean(data
, period
, k
= 3)
data
Um vetor numérico quantitativoperiod
Um vetor numérico quantitativo correspondente ao período de cada valor em ‘data’k
Um valor correspondente a quantidade de valores em ‘data’ que serão contabilizados para a média móvel em cada deslocamento data
e period
são numéricos? Se não, a função para e retorna uma mensagem de erro.data
e period
possuem o mesmo tamanho? Se não, a função para e retorna uma mensagem de erro.data
possui NA? Se sim, a função para e retorna uma mensagem de erro.mm
repetições de NA com tamanho correspondente a variável data
subtraindo o valor dois, já que a primeira e última posição não serão ocupadas.j
com atribuição de k
For
com contador i
indo de 1 até o tamanho da variável data
menos doismm
na posição i
a soma de data
nas posições de i
a j
, dividindo por k
j
, a operação j
+ 1data
e do objeto das médias móveis mm
mm
acrescentando NA na primeira e última posição, para que o vetor tenho o mesmo tamanho dos demais vetoresexit
contendo um dataframe com os valores dos períodos period
, do vetor data
e das médias móveis mm
. exist
k
: a função pode realizar médias de diferentes tamanhos de períodos de tempo. Exemplo, com k
= 4 e com unidade de medida do argumento period
em ano, serão calculadas médias móveis quadrienais. Comentários Lucas Camacho
Patricia, ambas as propostas estão boas e acho que você pode escolher qual das duas você quer entregar como trabalho final.
Qualquer dúvida que você tiver pode me mandar e-mail (lucas.camacho@usp.br) e podemos conversar.
Abraços
df.event
, df.pop
e df.st
, cada um contendo uma coluna de identificação e uma coluna de contagem para cada estrato (sexo masculino e sexo feminino).