Traduções desta página:

Ferramentas do usuário

Ferramentas do site


05_curso_antigo:r2016:alunos:trabalho_final:jdalapicolla:proposta_b_-_analises_multivariadas

ANÁLISES MULTIVARIADAS


FUNÇÃO


multivar()

Entrada de dados: Será feito por uma tabela da classe data.frame no R. Essa tabela terá linhas correspondendo às observações e as colunas corresponderão às variáveis. As variáveis que serão utilizadas como variáveis quantitativas (numéricas) não poderão apresentar NA e devem seguir as premissas dos testes: Para Análise de Função Discriminante (AFD) os dados devem ter uma distribuição normal para cada grupo e para a MANOVA, além da distribuição normal, os dados devem ter variância homogênea.

Argumentos: a função terá 7 argumentos

multivar(x, quant=, group.by=, PCA=TRUE, AFD=TRUE, MANOVA=TRUE, lines=“none”)

Onde:

  1. x: é o data frame, tabela com todas as colunas e linhas;

  2. quant: um vetor com as posições das colunas que contenham variáveis quantitativas que serão usadas nas análises;

  3. group.by:argumento obrigatório que indicará uma única coluna do data frame com a classificação em grupos das observações. Uma variável categórica/qualitataiva, por exemplo, pode ser a coluna que indica as espécies, os morfotipos, sexo, localidades, experimentos ou qualquer outra variável categórica;

  4. PCA: argumento lógico que indica se será realizada a Análise de Componentes Principais (PCA) para os dados. O default é TRUE.

  5. ADF: argumento lógico que indica se será realizada a Análise de Função Discriminante (ADF) para os dados. O default é TRUE.

  6. MANOVA: argumento lógico que indica se será realizada a Análise de Variância Multivariada (MANOVA) para os dados.

  7. lines: argumento que indica se os gráficos deverão apresentar alguma linha para agrupar as observações do mesmo fator. O default é “none”, nenhuma linha será desenhada. As outras duas opções serão: “pol” que criará o mínimo polígono convexo para cada grupo e “ellipse” que criará as elipses de 95% de intervalo de confiança.

Objetos de Saída: Para cada uma das três análises serão geradas 2 tipos de objetos: tabelas em formato .csv e gráficos salvos como imagens em formato .jpeg.

Gráficos Gerados: Os gráficos gerados serão produzidos em alta resolução e prontos para serem usados em publicações, teses ou relatórios. Cada análise gerará um gráfico próprio. Esses gráficos serão produzidos utilizando os pacotes gráficos básicos do R. Só em último caso será utilizado pacotes complexos como o ggplot2.

Passos: Essa função pretender automatizar três análises multivariadas mais usadas em morfometria: para cada analise será criada uma pasta de diretório separada, dentro do diretório de trabalho do R, Essas pastas se chamarão: PCA, ADF, MANOVA.

  • PCA: Serão gerados dois gráficos, um gráfico de dispersão com os 2 principais componentes e um gráfico com as contribuições das variáveis para cada componente. Além dos gráficos serão criados três tabelas: (i) os autovalores e a contribuição de cada componente principal para variação; (ii) a contribuição de cada variável para a construção dos componentes principais; e (iii) a posição de cada observação no gráfico de dispersão;

  • ADF: Se a coluna indicada pelo argumento group.by tiver apenas dois níveis, o gráfico será criado a partir de histogramas, comparando esses dois níveis. Caso tenha mais de dois níveis, as variáveis serão transformadas em variáveis canônicas. Entre os arquivos .csv de saída estarão a função discriminantes, os p-valores, os certos das funções, e valores de cada barra nos histogramas ou posições das observações nos gráficos de variáveis canônicas.

  • MANOVA: Será gerado um único gráfico e e dois arquivos .csv: um contendo os p-valores e os valores de estatísticas do teste como os índices de Pillai-M.S. Bartlett e de Lawley-Hotelling e outro com as posições das observações no gráfico gerado.

Referências:
Claude, J. (2008). Morphometrics with R. Springer Science & Business Media.

Jolliffe, I. (2002). Principal component analysis. John Wiley & Sons, Ltd.

Shlens, J. (2010). A tutorial on principal component analysis (2005). Institute for Nonlinear Science, UCSD.

Alunos de Cursos Passados com Funções Semelhantes:
Juan Camilo Arredondo
Ramiro Campelo Araújo Ribeiro

05_curso_antigo/r2016/alunos/trabalho_final/jdalapicolla/proposta_b_-_analises_multivariadas.txt · Última modificação: 2020/08/12 06:04 (edição externa)