\documentclass[a4paper, oneside, 10pt]{article} \usepackage[unicode]{hyperref} \usepackage[utf8x]{inputenc} \usepackage[english]{babel} \usepackage{listings} \date{\today} \title{} \author{} \begin{document} \begin{itemize} \item Exercícios \item Apostila \item Tutorial \end{itemize} \section{\texorpdfstring{Exercícios 8. Reamostragem e Simulação}{Exercicios 8 Reamostragem e Simulaao}} \label{sec:exercicios_8_reamostragem_e_simulaao} \subsection{\texorpdfstring{Exercício 1.}{Exercicio 1}} \label{sec:exercicio_1} Os palmitos estão distribuídos aleatoriamente na floresta? Durante a aula teórica mostramos como podemos usar uma distribuição teórica para gerar dados que simulem o cenário previsto por nossa hipótese nula. No caso da posição dos palmitos adultos em uma parcela de 10,24 ha de floresta ($320 \times 320$ m), nossa hipótese nula é que eles se distribuem aleatoriamente no espaço. Iniciamos a construção do código para testar essa hipótese, o exercício é terminar de testar a hipótese. Abaixo reproduzimos o código apresentado em aula para que possa continuar a partir dele. \begin{itemize} \item 1.1. Baixe o arquivo \href{media/bie5782/01_curso_atual/palmadulto.txt}{palmadulto.txt} e leia os dados no R em um objeto chamado \texttt{eutad}, não esqueça de conferir se o objeto de dados foi lido corretamente. \item 1.2. Crie o objeto para guardar as distâncias entre cada indivíduo: \end{itemize} \lstset{frame=single} \begin{lstlisting} dist=matrix(NA, ncol=102, nrow=102) \end{lstlisting} \begin{itemize} \item 1.3. Calcule a distãncia observada entre cada indivíduo e guarde o resultados em \texttt{dist}: \end{itemize} \lstset{frame=single} \begin{lstlisting} for(i in 1:101) { for(j in (i+1):102) { difx2=(eutad$gx[i]-eutad$gx[j])^2 dify2=(eutad$gy[i]-eutad$gy[j])^2 dist[i,j]<-sqrt(difx2 + dify2) dist[j,i]<-sqrt(difx2 + dify2) } } \end{lstlisting} \begin{itemize} \item 1.4. Verifique o objeto \texttt{dist} e calcule o parâmetro chamado de distância média do vizinho mais próximo (\emph{MNN}): \end{itemize} \lstset{frame=single} \begin{lstlisting} (nn<-apply(dist, 1, min, na.rm=TRUE)) (mnn<-mean(nn)) \end{lstlisting} \subsubsection{\texorpdfstring{Simulando}{Simulando}} \label{sec:simulando} Até agora calculamos o valor esperado da distância média do vizinho mais próximo. Os próximos passos, são \footnote{a descrição de um algoritmo desta forma é chamada de pseudo-código}: \begin{itemize} \item 1.5. Crie um vetor \texttt{resultado}, com 1000 \emph{NA}'s, para guardar os valores de cada simulação. \item 1.6. Guarde o valor observado na primeira posição de \texttt{resultado}; \item 1.7. Crie um ciclo com contador (\emph{k}) que vai de 2 a 1000; \item 1.8. Dentro do ciclo: \begin{itemize} \item 1.8.1. Crie o objetos \texttt{xsim}, um vetor com valores amostrados aleatoriamente de uma distribuição uniforme de 0 a 320 (o tamanho x da parcela), arredondando o valor para uma casa decimal\footnote{um dígito}. Lembre-se de sortear o mesmo quantidade de valores que a população de palmito observado; \item 1.8.2. Faça o mesmo que no passo anterior e guarde no objeto \texttt{ysim}; \item 1.8.3. Como no tópico anterior, crie uma matriz para guardar as distâncias entre cada valor xy simulados; \item 1.8.3. Crie os ciclos para o calculo das distâncias como no tópico anterior; \item 1.8.4. Guarde o valor da distância média do vizinho mais próximo dos dados simulados na posição \emph{k} do vetor \texttt{resultado}; \item 1.8.5. Feche o ciclo. \end{itemize} \item 1.9. Faça um histograma dos valores simulados e coloque uma linha vermelha vertical na posição do valor observado; \item 1.10. Calcule a probabilidade de uma distribuição espacial aleatória gerar valores iguais ou mais extremos do que o valor \emph{MNN} observado. \end{itemize} \begin{center} \line(1,0){250} \end{center} \subsection{\texorpdfstring{Exercício 2}{Exercicio 2}} \label{sec:exercicio_2} \subsubsection{\texorpdfstring{Simulando o teste de uma regressão linear}{Simulando o teste de uma regressao linear}} \label{sec:simulando_o_teste_de_uma_regressao_linear} O principal teste estatístico de uma \emph{regressão linear} é que a inclinação do modelo da reta é diferente de zero! Isso significa que a variável preditora é independente da variável reposta. Ou seja não há relação aparente entre elas. Utilizando os dados de massa corpórea e do cérebro de alguns vertebrados \href{http://ecor.ib.usp.br./doku.php?id=dados:dados-animals}{dados:dados-animals}: \begin{itemize} \item 2.1. Calcule a inclinação da relação log(brain) \textasciitilde{} log(body) \footnote{Que tal dar uma checada no valor calculado, antes de continuar?}; \end{itemize} \emph{\textbf{\underline{Cálculo da inclinação da reta}}} $$ \beta = \frac{\sum_1^n((x_i- \bar{x}) (y_i- \bar{y}))}{\sum_1^n{(x_i- \bar{x})^2}} $$ \begin{itemize} \item 2.2. Crie um vetor para guardar o resultado de simulações; \item 2.3. Guarde o valor observado no objeto criado em 2.2; \item 2.4. Abra um ciclo de 2 a 1000; \item 2.5. Desordene o vetor \texttt{brain} e guarde no objeto \texttt{sim\_brain}; \item 2.6. Calcule a inclinação entre o log(sim\_brain) \textasciitilde{} log(body) e guarde no vetor resultado; \item 2.7. Feche o ciclo; \item 2.8. Faça o histograma dos valores simulados e compare com o valor observado da inclinação da relação; \item 2.9. Calcule a probabilidade da inclinação observada ter sido gerada por variáveis que são independentes; \end{itemize} \begin{center} \line(1,0){250} \end{center} \end{document}