Traduções desta página:

Ferramentas do usuário

Ferramentas do site


05_curso_antigo:r2018:alunos:trabalho_final:hlucascs:fun1

PLANO A

Cálculo de Índice SUMIN

Contextualização

O conhecimento do nível de ameaça para espécies animais é de primordial importância para muitos táxons. Existem atualmente muitos índices utilizados para calcular o status de conservação, índices estes, utilizados para tomada de decisões no que diz respeito ao manejo das espécies sendo que os mais conhecidos são os critérios de classificação gerados pela IUCN. Tais classificações geralmente baseiam-se em informações de distribuição, história natural e análise quantitativa de dados, porém muitas vezes a avaliação torna-se difícil devido à constante lacunas no conhecimento da biologia de certas espécies, como no caso das serpentes (França e Araújo, 2006). A proposta desta função baseia-se na automatização do cálculo do índice SUMIN, proposto por Reca et al (1994), para o ranqueamento das espécies de tetrapodos por prioridade de conservação. Este índece será adaptado para as serpentes, e baseia-se em doze variáveis relevantes para a sobrevivência das espécies: i) distribuição continental; ii) distribuição nacional; iii) extensão do uso do hábitat; iv) extensão do uso vertical do habitat; v) tamanho corporal; vi) potencial reprodutivo; vii) amplitude trófica; viii) abundância; ix) singularidade taxonômica; x) singularidade; xi) ação extrativista e xii) grau de proteção. A função será feita com dados simulados randomicamente no R, entretanto poderá ser feita com a entrada de um data frame de dados reais.

sumin.jpg

sumin(df)

Entrada dos dados

Simulação com dados retirados aleatoriamente de uma distribuição normal ou um arquivo em formato csv ou txt poderá ser utilizado desde que respeite os parâmetros necessários (e. g. variáveis necessárias e números inteiros com valor máximo de 5).

Verificando parâmetros

  1. O data frame foi lido corretamente? Se não escreve: “dados não encontrados”
  2. Os valores dos dados são números inteiros > 0 e < = 5? Se não escreve “valores fora do intervalo 1 e 5.
  3. Existem números maiores do que o número máximo para cada variável? Se sim, para e escreve: “ valor não permitido variável x”

Pseudo-código

  • 1. Lê o data frame
  • 2. Aplica os parâmetros necessários
  • 3. Executa a somatória dos valores para cada espécie
  • 4. Cria um novo data frame com os valores ordenados decrescentemente
  • 5. Cria uma matriz de distâncias do data frame
  • 6. Executa o cluster e PCA
  • 5. Cria parâmetros dos gráficos
    1. I. Plota gráfico análise de componentes principais
    2. II. Cria análise de cluster

Saída

  1. Data frame com ordenação de scores do índice SUMIN
  2. Gráfico de análise de componentes principais e cluster das similaridades relativas pelas variáveis.

Referências

França, F. G. R. and Araújo, A. F. B. 2006. The conservatios status of snakes in central Brazil. South American Journal of Herpetology 1(1): 25 - 36.

Reca, A., Úbeda, C. and Gridera, D. 1994. Conservacion de la fauna de tetrapodos I. un indice para su evaluacion. Mastozoología Neotropical 1(1): 17 - 28.

Comentários Andre Chalom

Salve, Lucas!

Acho sua proposta muito interessante e pertinente, mas ela tem várias coisas que precisam ser mais trabalhadas.

Primeiro, acho que ela precisa ser mais detalhada pra ajudar tanto a gente a avaliar se ela é factível quanto vc a programar isso depois. Não ficou claro pra mim como os dados de entrada devem estar organizados - como devem ser as linhas e colunas desse data.frame? É uma linha pra cada espećie, ou uma coluna pra cada espécie? Você pode fornecer um arquivo csv com dados de exemplo pra isso.

Segundo, pelo que eu entendi, o cálculo do índice pode simplesmente ser com um apply ou um aggregate? Se for isso, é muito pouco pra justificar a função. Sugiro detalhar melhor a parte de montar a matriz de distâncias e a parte gráfica que vc está propondo (PCA e análise de cluster) e focar nisso pra vender seu peixe.

E finalmente, vc usa citações no seu texto, mas não dá a referência. Como eu acho esse tal Reca et al (1994)?

AguaRdo sua Resposta aqui :)

Olá André. Obrigado pelas dicas. Incluirei um arquivo com exemplo de como a entrada de dados deve ser abaixo: exemplo_sumin.csv

Realmente o cálculo pode ser feito apenas com um apply, e imaginei que seria algo simples, porém pensei em fazer com que a função aceite uma simulação gerando uma planílha parecida com que a que anexei seguindo parâmetros programados e as saídas com os gráficos para dar mais complexidade à ela.

Á partir da entrada de dados carregada no R, ou simulada (criação de um data frame com os parâmetros dados pelo usuário), pensei em criar um novo objeto contendo a função dist, para criar a matriz de distância. Em seguida criar um novo objeto com a função hclust e um outro com a função princomp. Á partir daí, criar parâmetros graficos e em seguida plotar os objetos contendo o cluster e o pca da melhor maneira possível.

Editei a proposta com as referências e anexei o artigo propondo o SUMIN abaixo: reca_et_al_1994_-_conservacion_de_la_fauna_de_tetrapodos.pdf

05_curso_antigo/r2018/alunos/trabalho_final/hlucascs/fun1.txt · Última modificação: 2020/08/12 06:04 (edição externa)