Aluna de Graduação em Ciências Biológicas pela USP
Projeto de Iniciação Científica em andamento no Laboratório de Evolução de Mamíferos, LEM, no Dpto de Genética e Biologia Evolitiva da Universidade de São Paulo
“Modularidade e Padrões de Integração em Linhagens Selecionadas de Camundongos”
Orientada pelo Profº Gabriel Marroig
PLANO A: Uma metodologia utilizada na comparação de matrizes V/CV, é a das Adagas Casualizadas (Random Skewers).
Matrizes de Variância e Covariância (V/CV) são uma medida quantitativa importante da associação entre traços em um sistema. Dessa forma, tem um papel central em estudos de biologia evolutiva. Para realizar tais estudos, é necessário comparar matrizes.
Essa tecnica procura quantificar a diferença entre matrizes ao comparar os vetores de resposta evolutiva de cada matriz quando submetidas ao mesmo vetor de seleção. Ela é a aplicação da equação de resposta multivariada à seleção proposta por Lande, 1979:
Δz = G ∗ β,
onde Δz é o vetor de resposta evolutiva (representa as diferenças entre as médias de cada carater em duas matrizes, uma antes e outra depois da seleção), G é a matriz de V/CV genética e β é o vetor de seleção.
A primeira parte dessa comparação consiste em gerar um grande número de vetores aleatórios de seleção (β) e obter os respectivos vetores de resposta evolutiva (Δz) para cada matriz, através de multiplicação simples. Essa primeira parte acaba por gerar uma distribuição aleatória de Δz, onde cada um dos vetores aleatórios gerados terá um par de vetores de resposta à seleção associado, um para cada matriz a ser comparada. Em seguida é feita a correlação desses diversos pares de Δz. A última parte consiste em tirar a média dessas comparações.
Passo a passo:
1. Criando os vetores aleatórios de seleção (com um numero de linhas igual ao da dimensão das matrizes).
2. Multiplicar esses 10.000 vetores gerados por cada uma das matrizes, o que vai gerar 10.000 vetores de resposta à seleção para cada uma das matriz. Cada vetor de seleção terá, então, um par de vetores Δz associado.
3. Comparar as respostas evolutivas de cada matriz (os pares de Δz gerados por β) através de correlação de vetores, criando uma distribuição aleatória de correlações de Δz.
4. Extrair a média da correlação dos Δz, que será usada como a medida de similaridade de cada matriz.
PLANO B:
FALTOU O PLANO B!.
Oi Ana, sei que o “Clã das Adagas Voadoras” é ótimo e que sua proposta deve ser pertinente, mas todos os “coleguinhas” postaram o plano B. Temos algumas hipóteses sobre alunos que não o fazem :
Perceba que qq que seja a resposta (inclusive “…”) ela depõem contra vc. Minha impressão é outra: uma aluna interessada e motivada, ou seja, o tipo de aluno para o qual pensamos e fazemos esse curso. Um plano B não iria fazer mal algum, talvez até fizesse vc. avançar para planos futuros, afinal temos que “Dominar o Mundo”.
Sabia que Random Skewers foi primeiro aplicado para a Ecologia por Manly? Ele é o “todo poderoso” da permutação e randomização! A aula final do curso é em homenagem a ele! Acho a proposta interessante e como vc. não tem alternativa, é ela que irá tocar! Tenho alguns pontos para pensar ou que talvez eu não tenha entendido direito (não é minha praia!):
A implementação não parece dificil, vc. já produziu um esboço de pseudo-código, fica mais fácil ainda. Acho que uma boa alternativa é gerar o β' aleatorio e operar as duas matrizes simultaneamente e calcular as correlações dos dois vetor Δz'(i) formados em um mesmo ciclo! Há jeitos mais eficientes (sem ciclos), mas vai dar mais trabalho… desse jeito fica mais intuitivo e, se as matrizes não forem muito grandes não vai demorar muito. Quando a função tiver rodando me avisa que vou te mostrar um jeito de incluir uma janela com uma barra de progressão da simulação…até com o tempo que já demorou processando.. bacaninha!
— Alexandre Adalardo de Oliveira 2012/04/03 19:21
Crazy.Skewers<- function(A, B, beta=1000) { if # verificando as condiçoes de entrada das matrizes (!(dim(A)[1] == dim(A)[2] & dim(B)[1] == dim(B)[2] & dim(A)[1] == dim(B)[1])) { cat("Review your matrix dimensions, sweetheart!","\n") return(-1) } size<- dim(A) [1] #criando a matriz de betas aleatorios BETAmx<- matrix (data=rnorm(size * beta) , nrow= size, ncol=beta, dimnames=list (c(1:size), c(paste("b", 1:beta)))) normalz<- function ( x ) {n.x<- x / sqrt(t(x) %*%(x)) return(n.x) } N.BETAmx<- apply(BETAmx, 2, normalz)# normalizando os betas gerados #calculando a correlacao entre os pares de Delta zes de cada Beta aleatório (cada um referente a uma das matrizes) cor<- apply((apply (A %*% N.BETAmx, 2, normalz)) * (apply (B %*% N.BETAmx, 2, normalz)), 2, sum ) result<- c( mean(cor), sd(cor) ) names(result) <- c("Media" , "SD") return(result) }
Crazy.skewers {XingLing} package: Filme Chines B R Documentation ~~Random Skewers: comparando duas matrizes de variancia/covariancia~~ Description: ~~ Compara duas matrizes atraves da correlacao entre seus respectivos vetores resposta (DeltaZes) a vetores aleatorios (beta) gerados\\ a partir de uma distribuicao normal de media zero. ~~ Usage: ~~Crazy.Skewers (A, B, beta=1000) ~~ Arguments: ~~ A uma matriz de Var/Covar B uma matriz de Var/Covar beta numero desejado de vetores aleatorios gerados. default= 1000 ~~ Details: ~~ A e B devem ser matrizes quadradas e simetricas, de mesma dimensoes. Se essas condicoes na forem verificadas, retorna uma mensagem de Erro para vc conferir as dimensoes das matrizes. ~~ Value: ~~ De acordo com as dimensoes das matrizes A e B, a função cria um numero beta de vetores aleatórios apartir de uma distribuicao\\ normal de media zero, cujos comprimentos sao iguais a dimensao das matrizes. As matrizes são, entao, multiplicadas por cada um dos vetores aleatórios gerados normalizados e em seguida) sao comparados\\ atraves da medida da correlacao entre eles. A função£o retorna a media e o desvio padrao dos pares de correlacoes verificados.~~ Author(s): ~~Anna Penna~~ References: ~~ Cheverud, J & Marroig, G. (2007) 'Comparing covariance matrices: Random Skewers method compared to the Common Principal Components model', Genetics and Molecular Biology, vol. 30, pp. 461-469. Marroig, G.; Melo D.; Porto, A.; Sebastiao, H.; Garcia, G. (2011) 'Selection Response Decomposition (SRD): A New Tool for Dissecting Differences and Similarities Between Matrices" , Evol Biol, vol. 38, pp. 225â241~~ Examples: # criando matrizes para entrar na funcao. Aqui voce pode escolher as dimensoes de cada uma delas (1 e 2) em "nrow=" e "ncol=" row1<- col1<- row2<- col2<- M1<- matrix(data= 0, nrow=row1, ncol=col1, dimnames= list (c(paste("A", 1:col1)), c(paste("A", 1:row1)) ) ) M1[lower.tri(M1, diag= FALSE)]<- rnorm( (length(M1[lower.tri(M1, diag=TRUE)]) - row1) , mean= 0, sd=1) M2<- matrix(data= 0, nrow=row2, ncol=col2, dimnames= list (c(paste("B", 1:col2)), c(paste("B", 1:row2)) ) ) M2[lower.tri(M2, diag= FALSE)]<- rnorm( (length(M2[lower.tri(M2, diag=TRUE)]) - row2), mean= 0, sd=1) Mx1<- M1 + t(M1) Mx2<- M2 + t(M2) diag(Mx1)<- rnorm(row1, mean= 0, sd=1) diag(Mx2)<- rnorm(row2, mean= 0, sd=1) Crazy.Skewers( Mx1 ,Mx2 , beta= 10000)