Frente à devolutiva do monitor responsável pela avaliação das minhas propostas, aplicabilidade da função e familiaridade com o tema, decidi prosseguir com a Proposta A: Suficiência amostral em trabalhos com diversidade genética.
Tamanho amostral adequado é essencial em qualquer estudo empírico cujo objetivo seja fazer inferências sobre a população a partir de uma amostragem1). Em geral, avaliar a suficiência amostral é uma prática frequente em trabalhos de ecologia. No entanto, em outras áreas, como genética de populações, tal abordagem ainda é dificilmente incorporada às análises de dados. Alguns trabalhos tem buscado estabelecer generalizações a respeito do tamanho amostral adequado para estimativa de diversidade genética das populações (e.g. Hale et al. 2012)2). Apesar desse esforço, é sabido que essa suficiência amostral pode variar com o tipo de marcador molecular, nível de polimorfismo dos loci e história natural das espécies. Sendo assim, a função sample.suff
desenvolvida tem como objetivo permitir aos pesquisadores interessados em genética de populações avaliar se, dado o conjunto de loci microssatélites genotipado, seu esforço amostral foi suficiente para inferir a diversidade genética das populações ou grupos de indivíduos diplóides sob estudo.
Ao longo da elaboração do trabalho final, algumas alterações foram necessárias com relação à proposta inicial. Abaixo, encontra-se uma relação dessas alterações seguida da respectiva justificativa.
Proposta | Alteração | Justificativa |
---|---|---|
Incluir riqueza de alelos privados (pA ) como uma das opções de gen.div | Opção removida | pA não depende apenas dos indivíduos amostrados na população, mas também do número de populações amostradas. Logo, não é uma estimativa de diversidade genética intrínseca à população. Portanto, essa opção foi removida |
Usar pacotes PopGenReport e adegenet | Usar apenas pacote adegenet | O pacote adegenet permitiu realizar todas as tarefas previstas na função. Portanto, não houve necessidade de usar outro pacote para análises de diversidade genética |
Possibilidade de incluir argumento mol.marker 3) | Opção não incluída | Conforme previsto na proposta, o argumento mol.marker apenas seria incluído na função caso houvesse tempo disponível. No entanto, a função com os argumentos propostos consumiu bastante tempo para elaboração, tornando inviável a inclusão do argumento mol.marker no prazo previsto4) |
No objeto dados , organizar cada locus em duas colunas, uma para cada alelo | Organizar dados de forma que haja uma coluna por locus, com alelos separados por barra (/) | Alteração fez-se necessária para adequada transformação do data frame em objeto da classe genind, visto que esta é a classe de objetos utilizada pelo pacote adegenet para as análises genéticas |
Dentro do 1º ciclo for , estimar diversidade genética para cenários simulados apenas | Além do proposto, no primeiro ciclo for também foram incluídas as estimativas de diversidade genética para as populações observadas (ou seja, fora do contexto das simulações) | Tal procedimento foi feito para reduzir a redundância do cógido e não ter que criar um outro ciclo for também com contador de i até o número de populações |
Gerar subamostragens das populações, usando sample com size =j e replace =TRUE | Usar sample com size =j e replace =FALSE | Evitar que um mesmo indivíduo possa ser amostrado nas populações simuladas, o que enviesaria a estimativa de diversidade genética |
Plotar gráfico com linhas correspondentes aos intervalos de confiança | Ao invés de linhas, plotar área sombreada no gráfico, com cor com transparência, correspondente ao intervalo de confiança das estimativas de diversidade genética | Alteração deixou gráfico menos poluído e esteticamente mais bonito |
Colocar legendas com cores das populações e o que cada linha indica | Na legenda são mostradas as cores da linha (média) e da área sombreada (intervalo de confiança) e a população correspondente | A interpretação da linha (média da estimativa de diversidade genética) e da área sombreada (intervalos de confiança) encontra-se explicitamente explicada na seção VALUE do help da função |