Plano A
Definir um modelo de função de detectabilidade para amostragens por distância.
O método da amostragem por distância permite a estimação da densidade populacional de um objeto, por meio de observações destes objetos ao longo de uma transecção linear. A teoria envolvida na amostragem por distância assume que alguns, talvez muitos objetos não sejam detectados pelo observador. Acredita-se que a detectabilidade dos objetos diminua com a distância do objeto em relação a transecção linear, e que a detecção de 100% é encontrada quando os objetos estão a 0 metros de distância da transecção.
O conceito central da amostragem por distância é estimar o número total de objetos “perdidos” pelo observador, por meio de uma função de detectabilidade (g(y)), com a intenção de se calcular uma densidade populacional mais próxima da realidade, estimando o número de objetos “perdidos” pelo observador.
Esta função tem como objetivo selecionar qual a função de detectabilidade melhor se ajusta a um conjunto de dados X, na tentativa de se realizar uma estimativa populacional mais próxima da realidade.
A função a ser criada realizará uma análise exploratória dos dados, criando histogramas do número de avistamentos pela distância objeto-trilha e realizará um teste, por meio de permutações, para avaliar se a detectabilidade diminui com a distância da transeção. Além disso, essa função testará qual modelo de função de detectabilidade mais se ajusta a um conjunto de dados X. Para isso, este teste utilizará 3 modelos de detectabilidade: metade-normal (half-normal), exponencial negativo e taxa-de-risco (hazard-rate).
Samuel, não entendi direito como sua função funcionaria. D~e mais detalhes dos parâmetros de entrada, do calculo a ser feito, e da saída. como será feito o ajuste dos modelos?
Plano B
Testar Auto-correlação espacial entre comunidades de espécies de diferentes sítios.
A ideia central desta função é testar se a distância geográfica afeta a composição de espécies em diferentes sítios. Esta função criará duas matrizes simétricas, a primeira será a distância geográfica entre os diferentes sítios a partir de das coordenadas geográficas dos diferentes sítios e a segunda será uma a distância de similaridade na composição de espécies entre os diferentes sítios. A função então realizará um teste de Mantel de correlação entre estas duas distâncias.
Esta idéia me parece simples demais, sem nenhum desafio, ainda mais porque já vimos a implementação do teste de Mantel em aula. Eu iria com a primeira função, mas gostaria que vc detalhasse ela mais
Vitor, infelizmente não terei tempo de trabalhar no Plano A, contudo já terminei a função do Plano B. Ela ficou diferente do proposto acima, mas gostaria que você ou alguém avaliasse a complexidade da mesma, pois posso trabalhar nela ainda até esta sexta-feira...
obrigado
**Revisão da proposta - Plano B
Função: Testar a autocorrelação espacial entre sítios.**
A idéia desta função é calcular um valor de correlação de Pearson (estatística r de Mantel) entre as (1) distâncias geográficas euclidianas de diferentes sítios, e (2) as dissimilaridades na composição ou abundância de espécies nestes sítios.
Esta função realizará permutações (teste de Mantel) com os dados de dissimilaridade aleatorizados para avaliar a significância estatística do valor observado de Pearson.
Os dados de entrada desta função são dois data.frames contento (1) as coordenadas geográficas de cada sítio de amostragem e (2) um data.frame contendo nas colunas, a presença/ausência ou abundância de cada espécie por sítio de amostragem. Esta função permitirá a entrada de dois formatos de coordenadas geográficas (graus decimais e graus, minutos e segundos). Os índices de dissimilaridades serão os de Jaccard.
Esta função retornará duas matrizes, (1) distâncias geográficas e (2) dissimilaridade entre os diferentes sítios. Esta função retorna uma gráfico de dispersão entre as distâncias geográficas e as similaridades entre sítios, apresentando a inclinação da reta e o valor calculado da correlação de Pearson entre as duas matrizes.
A função ainda retorna um histograma mostrando os valores estimados de Pearson, bem como os valores correspondentes aos valores de Pearson observados (distribuição bi-caudal), e o nível de significância do valor de Pearson observado em relação ao valores de Pearson estimado.
Ricardo, já que vc decidiu seguir com essa função, seria bom que sua função testasse a integridade da entrada de dados (NA, NaN, e coisas do tipo), e testasse também se as matrizes cumprem as premissas necessárias para a realização dos testes (não conheço sobre teste de Mantel, então não posso dizer muita coisa). Existem pacotes do R que lidam bem com a conversões de formatos de coordenadas geográficas, seria bom vc dar uma olhada neles para não ter de fazer uma formula de distancia diferente para cada tipo