Índice
- O Curso R
-
- Tutoriais
-
- Apostila
-
- 6. Testes de Hipótese (em preparação!)
- Exercícios
-
- Material de Apoio
-
- Área dos Alunos
-
- Cursos Anteriores
-
IBUSP
Outras Insitutições
Linques
Visitantes
Outras Insitutições
Ornitóloga do Museu de Zoologia da USP e mestranda do departamento de Zoologia. Trabalha com Ecologia (distribuição, preferência de habitat e tamanho de território) do bicudinho-do-brejo-paulista (Formicivora sp. nov.), espécie de ave ainda não descrita, criticamente ameaçada de extinção e endêmica do estado de São Paulo.
Quando se faz um trabalho taxonômico, cria-se unidades taxonômicas operacionais, ou seja, agrupamentos de espécimes semelhantes quanto à morfologia e diagnosticáveis de membros de demais grupos, para então buscar-se os nomes disponíveis na literatura e assim compreender melhor a diversidade dentro de um complexo. No entanto, esta delimitação é muito subjetiva, pois depende da percepção do taxonomista quanto a semelhanças e diferenças entre indivíduos. Muitas vezes, o pesquisador analisa suas amostras em momentos diferentes, já que extrai a maior parte das informações de coleções museológicas. Esta função pretende criar unidades taxonômicas operacionais de maneira objetiva ao agrupar espécimes de aves semelhantes morfologicamente. Como na ornitologia a diagnose baseia-se sobretudo nos padrões de plumagem, por meio de uma planilha que discrimine as cores de cada parte do corpo, a função agruparia espécimes com uma proporção X de caracteres iguais. Além disso, a função também poderia trabalhar com semelhança morfométrica e proximidade das coordenadas geográficas.
Em meu trabalho de mestrado estou trabalhando com preferência de habitat do bicudinho-do-brejo-paulista (Formicivora sp.nov), uma espécie de ave nova, ainda não descrita e ameaçada de extinção que habita brejos no leste do estado de São Paulo. Devido ao extremo isolamento das populações, em muitos casos, a translocação pode ser uma opção de manejo interessante para a manutenção da espécie. Esta função se basearia nos dados coletados sobre densidade e altura da vegetação, além de parâmetros sobre a quantidade e qualidade da água que permeia o brejo. A função utilizaria os dados de preferência para apontar as condições ambientais mínimas para a sobrevivência da espécie, já que os modelos espaciais são imprecisos para escala tão detalhada de habitat preferencial. Assim, as estratégias de translocação poderiam ser guiadas pelos parâmetros apontados pela função. Antes de selecionar a área para a translocação, o pesquisador mediria os parâmetros do local e usaria a função para apontar se ela atende as condições mínimas para a sobrevivência da espécie.
Vc descreveu basicamente um problema de clustering, que não são os mais triviais. Empates e relações entre grupos são difíceis de lidar e frequentemente envolvem heurísticas (regras empíricas que não funcionam sempre) para separar os elementos em grupos. Não é impossível, mas seria um desafio e exige algum estudo do tema. Se houver interesse posso passar uma bibliografia e te apontar no caminho certo, mas pode ser complicado.
Bem interessante a proposta. Acho que o termo comum pra isso é modelagem de nicho, e tem bastante literatura. Acho que seria mais fácil de implementar que a proposta A, pelo menos para um caso simples. Seria legal deixar claro quais são as entradas e saídas da função. Não entendi se vc especifica os requisitos mínimos para uma área ser considerada para translocação e as medidas do ambiente; ou se vc especifica a distribuição da espécie e a função determina as preferências dela também.
A função apresentada, difere da proposta B inicial. Essa modificação foi feita para que o fundamento teórico fosse utilizado de maneira correta. Dessa forma, o novo objetivo da função é apontar, dentro das variáveis ambientais, o conjunto delas que é mais frequente dentre as observações, que no caso devem representar, amostras de locais de ocorrência da espécie.
A função avamb, partindo de um conjunto de dados de variáveis ambientais (de distribuição normal) coletadas em áreas de ocorrência de uma espécie, tem por objetivo mostrar a amplitude de cada uma dessas variáveis que contemple 95% (ou outras porcentagens que podem ser escolhidas) das observações, ou seja, 95% da população amostrada. A função pode ser útil em trabalhos que estudem seleção ou preferência de habitat de uma espécie, ao passo que indica o intervalo de condições “mais favoráveis” dentro do conjunto de observações. Adicionalmente, a função também sumariza dados de média, variância e desvio padrão de cada variável, além de poder construir gráficos que apontam os dados de amplitude e média para cada variável ambiental.
####Amplitude de Variável Ambiental avamb=function(x,rmNA=T,porcentagem=0.95,graficos=F) { ####para não remover dados faltantes, recomenda-se usar esse argumento apenas no caso de querer apontar a ausência de dados. Com NAs o argumento gráficos=T não gerará gráficos para todas as variáveis: if(rmNA==FALSE) { dados=x } else { dados=(na.omit(x)) } ####estabalece o tamanho do intervalo que pretende-se apontar para cada variável, ou seja, a porcentagem da população abrigada nos intervalos apontados para as variáveis. A função permite a entrada das seguintes porcentagens: 0.70,0.80,0.90,0.95, sendo 0.95 o default. if(porcentagem==0.70) { p.inf=0.15 p.sup=0.85 } if(porcentagem==0.80) { p.inf=0.10 p.sup=0.90 } if(porcentagem==0.90) { p.inf=0.05 p.sup=0.95 } if(porcentagem==0.95) { p.inf=0.025 p.sup=0.975 } ####a seguir cria-se ciclos para calcular as médias de cada variável e abrigá-las em uma tabela. nplot=dim(dados)[2] media=rep(NA,nplot) names(media)=paste("variavel",c(1:nplot)) for(i in 1:(dim(dados)[2])) { mean=mean(dados[,i]) media[i]=mean } ####a seguir cria-se ciclos para calcular o desvio padrão para cada variável e abrigá-los em uma tabela. nplot=dim(dados)[2] desvio=rep(NA,nplot) names(desvio)=paste("variavel",c(1:nplot)) for(i in 1:(dim(dados)[2])) { sd=sd(dados[,i]) desvio[i]=sd } ####a seguir cria-se ciclos para calcular a variância para cada variável e abrigá-las em uma tabela. nplot=dim(dados)[2] variancia=rep(NA,nplot) names(variancia)=paste("variavel",c(1:nplot)) for(i in 1:(dim(dados)[2])) { var=var(dados[,i]) variancia[i]=var } ####a seguir cria-se ciclos para informar o valor de quantil inferior que delimita o intervalo estabelecido. nplot=dim(dados)[2] quantil.inferior=rep(NA,nplot) names(quantil.inferior)=paste("variavel",c(1:nplot)) for(i in 1:(dim(dados)[2])) { quant.inf=qnorm(p.inf,media[i],desvio[i]) quantil.inferior[i]=quant.inf } ####a seguir cria-se ciclos para informar o valor de quantil superior que delimita o intervalo estabelecido. nplot=dim(dados)[2] quantil.superior=rep(NA,nplot) names(quantil.superior)=paste("variavel",c(1:nplot)) for(i in 1:(dim(dados)[2])) { quant.sup=qnorm(p.sup,media[i],desvio[i]) quantil.superior[i]=quant.sup } resulta=data.frame(media,desvio,variancia,quantil.inferior,quantil.superior) ####caso queira, além da tabela com os valores calculados, gráficos de densidade de probabilidade, apontando média (linha pontilhada azul) e valores do intervalo (linha pontilhada vermelha), basta dizer que o argumento "graficos" é igual a TRUE, a sequencia de comandos a seguir cria ciclos para a construcao destes gráficos. par(mfrow=c(1,nplot)) par(family="serif") if (graficos==T) { for(i in 1:dim(dados)[2]) { curve(dnorm(x,mean=media[i],sd=desvio[i]),from=(min(dados[,i])-desvio[i]),to=max((dados[,i])+desvio[i]),main="Variavel",ylab="Densidade de Probabilidade") mtext(i,3,0.4,cex=0.8) abline(v=quantil.inferior[i],col="red",lty=2) abline(v=quantil.superior[i],col="red", lty=2) abline(v=media[i],col="blue",lty=2) } return(resulta) ####para retornar os parâmetros usuais do dispositivo gráfico par(mfrow=c(1,1)) } else { return(resulta) } }
avamb package:unknown R Documentation Amplitude de Variável Ambiental Description: A função aponta a amplitude de uma ou mais variáveis ambientais (de distribuição normal) que contempla uma porcentagem X de ocorrências de uma especie, alem de media, variância e desvio padrão de cada variável. Usage: avamb(x,rmNA=T,porcentagem=0.95,graficos=F) Arguments: x deve ser um data.frame em que cada coluna corresponda a uma variável ambiental de distribuição normal, e cada linha represente uma observação, ou seja, uma área de ocorrência da especie. Desta forma, o data.frame deve abrigar os valores das variáveis ambientais para cada observação. rmNA argumento para remoção de dados faltantes. Caso não queira remove-los, os cálculos para a aquela variável resultarão em NA. Alem disso, não serão produzidos gráficos para todas as variáveis. O default aponta para a remoção de NAs. porcentagem valor de porcentagem de observações para a qual pretende-se apontar os intervalos das variáveis, ou seja, a proporção das observações que será contemplada dentro dos intervalos das variáveis apontados pela função. A função aceita apenas os seguintes valores de porcentagem: 0.70,0.80,0.90,0.95.O deafault é 0.95. graficos argumento que permite a construção de um gráfico para cada variável apontando os intervalos calculados pela função (linha pontilhada vermelha) e também a media para cada variável (linha pontilhada azul). Recomenda-se que este argumento seja utilizado para até seis variáveis, para que os gráficos possam ser devidamente visualizados no dispositivo gráfico. Details: Os valores calculados para os quantis são definidos pelo argumento porcentagem. O intervalo entre os quantis representa a amplitude das variáveis ambientais que contempla a porcentagem de observaçoes requerida. A função requer que as variáveis ambientais apresentem distribuição normal para que os intervalos sejam calculados adequadamente. Value: A função gera um data.frame que contem media, desvio padrão, variância, valor do quantil inferior e valor do quantil superior para cada variável ambiental. Alem disso, a função também pode construir gráficos de densidade de probabilidade para cada variável, mostrando os intervalos que definem a amplitude de cada variável ambiental que contempla a porcentagem de observações definida. Author(s): Glaucia Del-Rio (Ornitóloga da Seção de Aves do Museu de Zoologia USP) contato: glaudel@globo.com Examples: x=(data.frame(rnorm(20,mean=3,sd=1),rnorm(20,mean=2,sd=2),rnorm(20,mean=4,sd=2))) avamb(x) avamb(x,graficos=T) avamb(x,porcentagem=0.70,graficos=T)