Índice
- O Curso R
-
- Tutoriais
-
- Apostila
-
- 6. Testes de Hipótese (em preparação!)
- Exercícios
-
- Material de Apoio
-
- Área dos Alunos
-
- Cursos Anteriores
-
IBUSP
Outras Insitutições
Linques
Visitantes
Outras Insitutições
Aluno de mestrado pelo Programa de Pós Graduação em Biologia Animal da Universidade Estadual de Campinas (UNICAMP). Meu projeto engloba seis espécies de importância médico forense da família Calliphoridae (Insecta: Diptera) envolvendo seus comportamentos alimentares e expressão gênica.
Atualmente, os insetos constituem o grupo dominante de animais na Terra. De longe, seu número supera o de todos os outros animais terrestres e estão em praticamente todos os locais (TRIPLEHORN & JOHNSON, 2015). Os insetos são animais pecilotérmicos, ou seja, quando a temperatura do ambiente cai, sua temperatura corporal também cai e seus processos fisiológicos tornam-se mais lentos. Dentro do grupo, existem inúmeros hábitos alimentares permitindo o consumo de variadas fontes (TRIPLEHORN & JOHNSON, 2015). Uma das maiores ordens de insetos são as moscas (Insecta: Diptera). É um grupo abundante em termos de indivíduos e número de espécies. Os hábitos alimentares aqui também variam, mas focando apenas no interesse forense, existem famílias muito estudadas, e estas, se alimentam de carne em decomposição (necrófagas) ou até mesmo carne fresca (parasitas).
No contexto forense, é valioso as estimativas de intervalo pós morte com o uso da fauna de dípteros presentes no cadáver. Para este cálculo, os animais são recolhidos e criados sob temperatura, umidade e substrato alimentar controlados a fim de se obter o menor intervalo do seu desenvolvimento ainda presente no corpo em decomposição, servindo como inferência no tempo de morte. Os dados são demonstrados por meio de gráficos das curvas de desenvolvimento e ANOVA. Os testes estatísticos podem sofrer variações, isso estará totalmente dependente do tipo de objetivo do autor. O fato é que a variável principal nos testes comuns, é a temperatura - o quanto do peso e comprimento da larva irá aumentar referente àquela temperatura. A variável substrato não é observada, e talvez exista diferença entre larvas que se alimentaram, por exemplo, na região do abdômen do cadáver e outras larvas presentes na cabeça.
Meu objetivo com esta proposta, é fazer uma função que coloque a distribuição de crescimento juntos para uma melhor comparação do desenvolvimento das espécies em substratos diferentes, podendo ser observada possíveis diferenças e semelhanças a cada pesagem (12/12h das larvas) em determinada temperatura fixa. A função então, retornaria, um valor de p (oriundo de ANOVA), mais a tabela de tukey caso o valor de p fosse significativo e um gráfico com os valores de desenvolvimento.
Entrada: develop (x, temp, data)
Verificando os parâmetros:
Pseudo-código:
Saída:
A criação de procedimentos operacionais padrões (POP) permite a uma empresa a garantia de que suas tarefas sejam realizadas corretamente, frente a uma padronização e que seus resultados estejam sempre dentro daquela margem de segurança.
No segundo semestre de 2012, a Secretaria Nacional de Segurança Pública assumiu a coordenação da tarefa de produzir procedimentos operacionais padronizados, os POPs, e convidou o Conselho de Dirigentes de Órgãos Periciais, as associações representativas dos profissionais de perícia, a equipe da Força Nacional de Segurança Pública e outros especialistas nas áreas para desenvolvê-la. Com uma norma de procedimentos operacionais relacionados a polícia científica já criada, isso garante ou pelo menos ajuda peritos iniciais na hora da produção da prova técnica, qualificando a investigação criminal (BRASIL, 2013).
Caso um perito ou qualquer outra pessoa tenha o interesse de olhar esses protocolos ou sempre usá-los, ela deve carregá-los fisicamente ou mesmo que em um computador portátil ou qualquer outro dispositivo digital, estarão presentes muitas informações (mais de 240 páginas) que pode gerar uma perca de tempo em um momento de pressa na hora da busca.
O objetivo desta proposta, é pegar estes dados já feitos por profissionais competentes da área e colocá-los dentro de uma função, que facilmente poderia ser “chamada” pelo usuário. A ideia é que o profissional digite a natureza do caso criminal, e a função convoque os procedimentos operacionais padrões necessários para o atendimento no local.
Entrada: perpop (x)
Verificando os parâmetros:
Pseudo-código:
Saída:
Olá Gustavo,
Você postou as duas propostas, não entanto ambas estão pouco detalhadas em relação aos pseudocódigos. No caso da proposta A, seu objetivo de “fazer uma função que compare as curvas de desenvolvimento, verificando qual substrato é o mais significativo para o seu desenvolvimento em temperatura fixa” não chega a ser demostrado factível dado o pseudocódigo que você apresentou. O que você propus foi fazer um test de t com os dados de peso de cada tratamento de dieta. A entrada pode ser um único arquivo, com as informações dos dois grupos experimentais, e cada um com repectiva idade. Apesar de você estar interasado no desenvolvimento, dentro do pseudocódigo nunca é usada a variável de idade, que a que le permitiria ter a noção do desenvolviento das larvas ao longo do tempo e de fato construir o gráfico que propõe como resultado. Você inclui no dataframe de entrada, a variável termperatura, que no contexto é inecessária, pois a temperatura é fixa. Além disso terminologia usada nos parámetros de entrada faz com que a função pareça de um uso muito especifico, quando pode ser mais geral. Por exemplo, no seu caso o proxy de tamanho é peso, mas em outro caso pode ser comprimento da perna, ou largura da cabeça, se você usa a palavra “tamanho” faria com que a função tenha um escopo mais amplo. A proposta B, me deixou com umas dúvidas, cada um dos objetos que você vai criar contêm “valores”. O que são os valores? Eu achava que seria só um texto com o protocolo. Falta explicar um pouco melhor o que contêm esses objetos para poder entender melhor e incluso entender o objeto que você propoe de saída. Sugiero que você esclareça um pouco mais os pseudocódigos das duas funções, para te dar uma melhor sugestão de proposta a desenvolver. Bom trabalho!
. — SolimaryGarcia 2018/05/11 08:20
Proposta A Obrigado pelo feedback Solimary. Vamos lá. Minha ideia principal, seria comparar de uma única vez todos os dados (referente a gama de substratos possíveis) que o pesquisador tenha. Então por exemplo. Suponhamos que eu tenha o desenvolvimento de uma espécie de mosca para os substratos: músculo, fígado e intestino. O meu objetivo é de comparar (pegando a massa em gramas da larva mais a temperatura) as diferenças entre os substratos, pra ver se existe uma diferença significativa entre substratos ou não, se a variável principal é a temperatura, independente do tipo de substrato. Eu acabei colocando como a entrada dois dataframes pois fiquei receoso se poderia colocar todos os dados em um único dataframe. Vou colocar uma foto embaixo para ficar mais visível, como seria os dados. Uma coisa que não ficou clara. Os ensaios são realizados em diferentes temperaturas (20/25/30ºC por exemplo). Quando falo que a temperatura é fixa, é que naquele determinado ensaio ela é constante até o final. Mas existe outros ensaios, para o mesmo substrato para a mesma espécie em outras temperaturas (a fim de ver qual seria a melhor temperatura para o desenvolvimento da larva, e até mesmo, ter uma faixa de temperatura que a larva se desenvolva). Proposta B Na realidade eu pensei no R “printando” na tela do usuário um dataframe (objeto) com várias strings referentes aos equipamentos que o perito deveria levar a cena. Mas agora você falando de uma saída de texto com o protocolo, é bem mais objetivo… Eu gostei mais. — Gustavo Amaral Faria 2018/05/18 15:52
Olá Gustavo,
Obrigada pelos esclarecimentos. Em relação às duas propostas, sugiro ficar com a proposta A, com algumas resalvas. Ainda parece uma proposta muito específica e relacionada a seus dados. Lembre que uma das sugestões é fazer algo que possa ser usado mais amplamente. Nesse sentido, tenho algumas sugestões: 1. Voce pode sim colocar todos esses dados em um único data frame, mas de uma forma diferente ao que você propus. O data frame deve contear uma unica variável categórica para os “substratos”, que poderáa ter vários níveis (ex: músculo, fígado e intestino). Outra variável categótica com os dados de temperatura (ex. 20/25/30ºC ou, baixa, média e alta temperatura), uma variável continua com a idáde (dias de desenvolvimento) e mais uma com o tamanho (massa). 2. A análise que entendo você quer fazer é entender qual é o efeito (significativo o não) da temperatura & o substrato sobre o desenvolvimento (idade ou tamanho). Entendi bem? se for assim, a sua função pode chamar uma outra função para fazer a análise. Há vários pacotes que podem fazer essas análises, conhecidos como modelos lineares (se o crescimento não é linear há outras opções também). A sua função faria essa análise, mostraria os resultados númericos, e também mostraria resultados como gráficos. Cómo exatamente voce espera que sejam os gráficos? estava pensando que seriam regressões, mas acho que você propoe são graficos de barras. Como exercicio, antes de fazer a função, sugiro que você establesca exatamente que informação você precisa para fazer os gráficos de manera que façam sentido e cumpram o seu objetivo. Se tem alguma dúvida não duvide em nos escrever! bom trabalho!
. — SolimaryGarcia 2018/05/15 21:30
Olá Gustavo,
As propostas não estão muito adequadas para o trabalho final. A primeira é muito específica e faz a análise de dados específico o que foi alertado não ser uma boa opção. Usa um if e faz uma anova e retorna informações parciais da anova, inclusive a ordem em que as tarefas aparecem no pseudocódigo não faz sentido. Vc. retorna na tela o hipótese antes de fazer o teste.
A segunda tem 6 testes lógicos sequencias para retornar a informação armazenada de seis itens. Não acho que sejam desafios suficientes. Vejo duas possibilidades: seguir com a proposta A incorporar algo para torná-la um desafio de programação mais interessante, definindo bem esse desafio e o peseudcodigo, ou sugerir outra proposta.
Obrigado pelas sugestões, Sim, entendo que realmente pareça muito específica, mas isso é um problema que qualquer pesquisador que trabalhe com biologia de insetos possa vir a se deparar, e uma função que compare se existe diferença significativa no desenvolvimento entre os substratos em determinada temperatura é muito importante, e ainda não foi feito, até onde eu sei. Isso implicaria, por exemplo, em sabermos se de repente na hora de uma coleta, devemos dar mais atenção a determinada região do corpo em decomposição, a fim de obter um Intervalo Pós Morte mínimo bem mais preciso, ajudando muito num trabalho investigativo. Por isso meu interesse nela. Eu fiz as modificações no dataframe de entrada, colocando apenas quatro variáveis, e elas com seus níveis. E sim, é um modelo linear, e os gráficos seriam as curvas de desenvolvimento da larva no substrato e temperatura em questão. Os dados que estou usando, são de fato reais (peguei emprestados, rsrs) pois queria já fazer os testes como uma simulação real mesmo, e não com dados aleatórios que de repente não poderia fazer sentido no ponto de vista biológico. — Gustavo Amaral Faria 2018/05/18 15:52
Atualizei o pseudo-código, como pedido professor, e acrescentei mais algumas informações que acho que serão um desafio. — Gustavo Amaral Faria 2018/05/21 09:12
— Alexandre Adalardo de Oliveira 2018/05/22 16:17 Oi Gustavo,
A Solimary me falou que estavam conversando por email. Realmente não tenho muito mais a propor, a elaboração da ideia deve vir dos alunos. Ainda estou em dúvida, apesar da sua argumentação sobre a aplicação.Continuo com dificuldade para entender a tarefa a ser executada e a utilização de alguns dos métodos propostos. A proposta está baseada no desenvolvimento da larva e nos tratamentos testados por ANOVA. Por exemplo, como fará Análise de variância do peso em função do tempo? Há um problema conceitual ou terminológico aqui. Outra questão é, havendo efeito de um tratamentos isoladamente (p.ex. substrato), como fará para verificar se isso não está associado ou tem interação com outro tratamento (p.ex. tempo)? Como estamos avançados no tempo e estou entendendo que decidiu por executar a proposta A, vc. deve trabalhar nela e documentá-la muito bem em todas as linhas do seu código para que possamos entender o que está sendo feito e assim conseguir avaliá-lo. Assim como trabalhar muito bem na sua documentação (Help).