02-continuas:02-continuas
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
02-continuas:02-continuas [2020/11/13 17:30] – [Distribuição Bernoulli Tendendo à Normal?] paulo | 02-continuas:02-continuas [2024/11/03 03:40] (atual) – paulo | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== 2. Distribuições Contínuas | ||
+ | |||
+ | Ao contrário de contagens, as medidas contínuas podem assumir qualquer valor dentro de um intervalo numérico. | ||
+ | |||
+ | Nesse tópico apresentamos esses modelos e exploramos suas propriedades básicas, com simulações dos cenários probabilísticos em computador. Também vamos verificar que a soma de muitas fontes de variação no limite cria a distribuição contínua mais conhecida, a Gaussiana. | ||
+ | |||
+ | |||
+ | ====== Conceitos ====== | ||
+ | |||
+ | * Função de densidade probabilística | ||
+ | * Função de probabilidade acumulada | ||
+ | * Esperança e variância de variáveis contínuas | ||
+ | * Teorema Central do Limite | ||
+ | * Distribuições de probabilidade contínuas mais usadas em ecologia | ||
+ | |||
+ | |||
+ | ====== Tutoriais ====== | ||
+ | |||
+ | ===== Função de Densidade e Probabilidade ===== | ||
+ | |||
+ | É importante ter clara a diferença entre a // | ||
+ | |||
+ | A primeira não é uma probabilidade, | ||
+ | |||
+ | A função **" | ||
+ | <code rsplus> | ||
+ | > dnorm(2+c(-0.15, | ||
+ | [1] 1.295176 1.295176 | ||
+ | </ | ||
+ | |||
+ | Aplicando a função **" | ||
+ | <code rsplus> | ||
+ | curve(dnorm(x, | ||
+ | xlab=" | ||
+ | </ | ||
+ | |||
+ | Vamos acrescentar neste gráfico os valores que calculamos acima: | ||
+ | <code rsplus> | ||
+ | points(2+c(-0.15, | ||
+ | | ||
+ | segments(x0=c(2+c(-0.15, | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | </ | ||
+ | |||
+ | Para uma variável aleatória a probabilidade só pode ser definida para //__um intervalo__//, | ||
+ | <code rsplus> | ||
+ | area.norm <- function(from, | ||
+ | len <- (to-from)*shade | ||
+ | x <- seq(from, | ||
+ | segments(x0=x, | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | |||
+ | E agora aplicá-la para colorir de vermelho a área delimitada por $\mu \pm 1,5\sigma$ no gráfico que criamos: | ||
+ | <code rsplus> | ||
+ | | ||
+ | </ | ||
+ | |||
+ | A área sob uma função é sua // | ||
+ | <code rsplus> | ||
+ | | ||
+ | </ | ||
+ | |||
+ | A integral de qualquer função de densidade probabilística no intervalo que contém todos os valores da variável aleatória é um. Verifique isto para a normal, integrando-a de //__menos infinito__// | ||
+ | <code rsplus> | ||
+ | integrate(dnorm, | ||
+ | integrate(dnorm, | ||
+ | </ | ||
+ | |||
+ | A integral do limite inferior de uma função de densidade até um certo valor é a // | ||
+ | |||
+ | <box centered 70% red|A probabilidade de um intervalo é a diferença de suas probabilidades acumuladas> | ||
+ | {{: | ||
+ | </ | ||
+ | |||
+ | O que você obtém com o comando: | ||
+ | <code rsplus> | ||
+ | pnorm(2.15, | ||
+ | </ | ||
+ | |||
+ | A funções no R para calcular probabilidades acumuladas, como a **" | ||
+ | <code rsplus> | ||
+ | 1-(pnorm(2.15, | ||
+ | </ | ||
+ | |||
+ | Por fim, como o intervalo é simétrico em torno da média, e a curva normal também o é, uma terceira maneira de fazer o cálculo é: | ||
+ | <code rsplus> | ||
+ | 1-2*pnorm(1.85, | ||
+ | </ | ||
+ | |||
+ | ==== Extras ==== | ||
+ | Se quiser reproduzir a figura deste tutorial, o código em R é | ||
+ | <code rsplus> | ||
+ | png(" | ||
+ | par(mfrow=c(1, | ||
+ | curve(dnorm(x, | ||
+ | xlab="", | ||
+ | area.norm(1.7, | ||
+ | curve(dnorm(x, | ||
+ | xlab="", | ||
+ | area.norm(1.7, | ||
+ | curve(dnorm(x, | ||
+ | xlab="", | ||
+ | area.norm(1.85, | ||
+ | mtext(c(" | ||
+ | dev.off() | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== Esperança de uma Distribuição Contínua ===== | ||
+ | |||
+ | A esperança de uma variável aleatória contínua é | ||
+ | |||
+ | $$ E[X]\ = \ \int x \cdot f(x) \ dx $$ | ||
+ | |||
+ | Onde $f(x)$ é a função de densidade probabilística. | ||
+ | |||
+ | Vamos verificar isto numericamente para a variável exponencial, | ||
+ | <code rsplus> | ||
+ | esper.exp <- function(x, | ||
+ | dexp(x, | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | Agora usamos a função **" | ||
+ | |||
+ | <code rsplus> integrate(esper.exp, | ||
+ | |||
+ | Compare o valor obtido com o valor teórico da esperança, | ||
+ | |||
+ | ===== Histograma de Densidade ===== | ||
+ | |||
+ | Para comparar a distribuição de dados com alguma variável aleatória, podemos usar um histograma re-escalonado para densidade. | ||
+ | |||
+ | Para exemplificar, | ||
+ | |||
+ | Primeiro criamos um objeto com os dados de interesse, que são os fustes da caixeta em Chauás: | ||
+ | <code rsplus> | ||
+ | caixeta <- read.csv2(" | ||
+ | chauas <- caixeta[caixeta$local==" | ||
+ | & | ||
+ | </ | ||
+ | |||
+ | E então criamos um fator para as classes de CAP, com intervalos de 100 mm: | ||
+ | <code rsplus> | ||
+ | chauas$cap.class <- cut(chauas$cap, | ||
+ | </ | ||
+ | |||
+ | Um gráfico da tabulação deste fator é um histograma de frequências: | ||
+ | <code rsplus> | ||
+ | barplot(table(chauas$cap.class), | ||
+ | </ | ||
+ | |||
+ | Dividindo-se os valores pelo total de fustes temos um histograma de frequências relativas: | ||
+ | <code rsplus> | ||
+ | barplot(table(chauas$cap.class)/ | ||
+ | </ | ||
+ | |||
+ | Finalmente, dividindo novamente estes valores pelas amplitude do intervalo de classe usado (100 mm) temos um histograma de densidade: | ||
+ | <code rsplus> | ||
+ | barplot(table(chauas$cap.class)/ | ||
+ | space=0) | ||
+ | </ | ||
+ | |||
+ | Neste histograma, a soma das áreas das barras é um. A função **" | ||
+ | <code rsplus> | ||
+ | hist(chauas$cap, | ||
+ | | ||
+ | </ | ||
+ | |||
+ | Nesta escala podemo sobrepor funções de densidade, como a Gaussiana: | ||
+ | <code rsplus> curve(dnorm(x, | ||
+ | sd=sd(chauas$cap)), | ||
+ | |||
+ | |||
+ | ===== Distribuição Normal (Gaussiana) ===== | ||
+ | |||
+ | As companhias aéreas norte-americanas garantem que 98% de seus passageiros não terão problemas para se acomodar nos assentos da classe econômica. Para isso, usam um modelo que descreve a distribuição das larguras dos quadris dos homens norte-americanos como uma variável normal, com média de 14,4 polegadas, e desvio-padrão de 1,0 polegada. | ||
+ | |||
+ | Faça um gráfico desta distribuição de probabilidades: | ||
+ | <code rsplus> | ||
+ | curve(dnorm(x, | ||
+ | xlab=" | ||
+ | </ | ||
+ | |||
+ | Para definir a largura do assento, é preciso saber o limite superior do intervalo que contêm 98% da população. Esse é o quantil de 98% da distribuição, | ||
+ | |||
+ | Calcule o valor deste quantil com o comando: | ||
+ | <code rsplus> | ||
+ | (larg <- qnorm(mean=14.4, | ||
+ | </ | ||
+ | |||
+ | Este é o valor que delimita 98% da área sob a curva normal. Usando a função criada no tutorial anterior podemos visualizar no gráfico a área que vai até o quantil calculado acima: | ||
+ | |||
+ | <code rsplus> | ||
+ | area.norm(8, | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== Variando os Parâmetros da Normal ===== | ||
+ | |||
+ | Imagine que o desvio-padrão para o exemplo dos quadris norte-americanos seja 50% maior. O que deve ocorrer com o quantil de 98%? Verifique sua expectativa com o comando: | ||
+ | <code rsplus> | ||
+ | qnorm(mean=14.4, | ||
+ | </ | ||
+ | |||
+ | Repita o gráfico do tutorial anterior, e adicione ao gráfico a distribuição de probabilidades com o novo valor do parâmetro desvio-padrão: | ||
+ | <code rsplus> | ||
+ | curve(dnorm(x, | ||
+ | xlab=" | ||
+ | curve(dnorm(x, | ||
+ | </ | ||
+ | |||
+ | Os parâmetros da distribuição normal correspondem à média e ao desvio-padrão. Explore o comportamento da curva com a mudança de seus parâmetros: | ||
+ | |||
+ | <code rsplus> | ||
+ | cores <- rainbow(n=4) | ||
+ | curve(dnorm(x), | ||
+ | curve(dnorm(x, | ||
+ | curve(dnorm(x, | ||
+ | curve(dnorm(x, | ||
+ | legend(-7.5, | ||
+ | " | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== Teorema Central do Limite ===== | ||
+ | |||
+ | O Teorema Central do Limite (TCL) prova que as médias de amostras independentes tomadas de uma mesma distribuição tendem para uma distribuição normal. A média desta normal é a mesma da distribuição de onde vieram as amostras, e a variância é igual à variância da distribuição original, dividida pelo tamanho das amostras. | ||
+ | |||
+ | Verifique isto com o seguinte tutorial: | ||
+ | |||
+ | Sorteie dez mil números de uma distribuição muito diferente de uma normal, como uma Poisson com média baixa: | ||
+ | <code rsplus> | ||
+ | vals <- rpois(10000, | ||
+ | </ | ||
+ | |||
+ | Agora imagine que estes valores foram obtidos de mil amostras independentes, | ||
+ | <code rsplus> | ||
+ | cod.amostras <- factor(rep(1: | ||
+ | </ | ||
+ | |||
+ | Agora podemos calcular a média de cada uma dessas amostras: | ||
+ | |||
+ | <code rsplus> | ||
+ | medias.vals <- tapply(vals, | ||
+ | </ | ||
+ | |||
+ | E fazer um histograma dessas mil médias: | ||
+ | |||
+ | <code rsplus> | ||
+ | hist(medias.vals, | ||
+ | </ | ||
+ | |||
+ | E sobrepor a função de densidade da normal, com os parâmetros previstos pelo TCL: | ||
+ | |||
+ | <code rsplus> | ||
+ | curve(dnorm(x, | ||
+ | </ | ||
+ | |||
+ | Uma outra ótima maneira de avaliar a normalidade é com o gráfico de quantis normais ((Para saber mais sobre gráficos quantil-quantil veja este [[https:// | ||
+ | |||
+ | <code rsplus> | ||
+ | qqnorm(medias.vals) | ||
+ | qqline(medias.vals) | ||
+ | </ | ||
+ | |||
+ | Repita os procedimentos, | ||
+ | |||
+ | |||
+ | ===== Distribuição Bernoulli Tendendo à Normal? ===== | ||
+ | |||
+ | Uma maneira simples de formular o Teorema Central do Limite é que a soma ou a média de muitas variáveis aleatórias tende a uma variável normal. Esta tendência é válida mesmo para variáveis com distribuições muito diferentes da normal e que não tenham os mesmos parâmetros. | ||
+ | |||
+ | Neste tutorial investigaremos se o TCL pode nos ajudar a propor um modelo para a riqueza de espécies em um conjunto de áreas. Vamos simular um cenário em que a ocorrência de cada espécie é uma variável Bernoulli (**1** = presente, **0** = ausente), cujo único parâmetro (**p** a probabilidade de ocorrência) varia entre espécies. | ||
+ | |||
+ | Vamos assumir que as probabilidades de ocorrência também são variáveis aleatórias. Uma escolha natural é a [[https:// | ||
+ | |||
+ | <box centered 90% red|Função de densidade da distribuição beta usada para representar as probabilidades de ocorrência das espécies. Os parâmetros usados são **a=1** e **b=5**.> | ||
+ | {{: | ||
+ | </ | ||
+ | |||
+ | |||
+ | Para simular uma metacomunidade com 300 espécies, sorteamos 300 valores da distribuição beta representada acima: | ||
+ | |||
+ | <code rsplus> | ||
+ | p.oc <- rbeta(300, shape1=1, | ||
+ | </ | ||
+ | |||
+ | Em seguida criamos uma função que faz **N** experimentos de Bernoulli, tomando um valor **1** com probabilidade $p$ e valor $0$ com probabilidade **1-p** | ||
+ | |||
+ | <code rsplus> | ||
+ | ocorre <- function(p, | ||
+ | </ | ||
+ | |||
+ | Aplicando esta função às probabilidades de ocorrência sorteadas no passo anterior, obtemos uma matriz com **100** linhas (locais) e **300** colunas (espécies): | ||
+ | <code rsplus> | ||
+ | matriz <- sapply(p.oc, | ||
+ | </ | ||
+ | |||
+ | A soma de cada linhas é o número de espécies em cada um dos **100** locais | ||
+ | <code rsplus> | ||
+ | riquezas <- apply(matriz, | ||
+ | </ | ||
+ | |||
+ | Cuja distribuição pode ser comparada com função de densidade de uma normal de mesma média e desvio-padrão: | ||
+ | |||
+ | <code rsplus> | ||
+ | hist(riquezas, | ||
+ | | ||
+ | curve(dnorm(x, | ||
+ | add=T, | ||
+ | </ | ||
+ | |||
+ | Avalie também o ajuste a uma normal com o gráfico de quantis teóricos: | ||
+ | |||
+ | <code rsplus> | ||
+ | qqnorm(riquezas) | ||
+ | qqline(riquezas) | ||
+ | </ | ||
+ | |||
+ | ==== Extras ==== | ||
+ | Se quiser reproduzir o gráfico da variável beta deste tutorial o comando é: | ||
+ | <code rsplus> | ||
+ | curve(dbeta(x, | ||
+ | xlab=" | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== Distribuição Exponencial ===== | ||
+ | |||
+ | A variável exponencial é a análoga contínua da variável geométrica. Ela pode ser usada para descrever o tempo de espera até a primeira ocorrência de um evento, dado que ele tem uma taxa de ocorrência $\lambda$ constante. | ||
+ | |||
+ | Vamos simular esta situação, imaginando que você acompanha um animal por até duas horas((a rigor deveríamos esperar até a primeira ocorrência. Fixando o tempo máximo de observação temos uma [[http:// | ||
+ | |||
+ | A distribuição desta variável aleatória pode ser simulada repetindo o estudo muitas vezes. A cada uma delas haverá um certo número de comportamentos, | ||
+ | <code rsplus> | ||
+ | n <- rpois(10000, | ||
+ | </ | ||
+ | |||
+ | O total de eventos será então a soma destes valores sorteados. Em seguida sorteamos este número de valores de uma distribuição uniforme, com o mínimo de 0 e máximo de 120. Estes serão os horários de ocorrência de cada evento, em cada repetição do estudo ((Como cada evento é independente dos demais e a taxa de ocorrência instantânea é constante, todos os horários são equiprováveis, | ||
+ | |||
+ | <code rsplus> | ||
+ | vals <- runif(sum(n), | ||
+ | </ | ||
+ | |||
+ | E criamos um fator para identificar cada repetição do estudo, ou seja, cada dia de observação: | ||
+ | <code rsplus> | ||
+ | cod.amostras <- factor(rep(1: | ||
+ | </ | ||
+ | |||
+ | Até aqui temos um vetor com tempo transcorrido até cada um dos eventos que ocorreram em cada dia de observação. Com isto, podemos usar a função **" | ||
+ | <code rsplus> | ||
+ | primeiro <- tapply(vals, | ||
+ | </ | ||
+ | |||
+ | E agora construímos um histograma de densidade desta variável, e sobrepomos a função de densidade da variável exponencial: | ||
+ | <code rsplus> | ||
+ | hist(primeiro, | ||
+ | | ||
+ | curve(dexp(x, | ||
+ | </ | ||
+ | |||
+ | Avalie visualmente a concordância com o modelo teórico. | ||
+ | |||
+ | |||
+ | ===== Distribuição Gama ===== | ||
+ | |||
+ | A variável Gama foi criada como uma extensão da exponencial, | ||
+ | |||
+ | Usando a simulação do tutorial anterior, podemos obter os tempos de espera até que o animal apresente o comportamento de interesse pela segunda vez. Para isto, criamos uma função que retorna o n-ésimo menor valor de um vetor de números | ||
+ | |||
+ | <code rsplus> | ||
+ | enesimo <- function(x, | ||
+ | </ | ||
+ | |||
+ | E aplicamos esta função a cada repetição do estudo, guardada no vetor '' | ||
+ | |||
+ | <code rsplus> | ||
+ | segundo <- tapply(vals, | ||
+ | </ | ||
+ | |||
+ | Para então fazer um histograma de densidade com estes dados | ||
+ | |||
+ | <code rsplus> | ||
+ | hist(segundo, | ||
+ | | ||
+ | </ | ||
+ | |||
+ | Podemos então sobrepor a este histograma a curva da função de densidade probabilística da variável Gama, com os parâmetros teóricos de taxa de ocorrência (**" | ||
+ | |||
+ | <code rsplus> | ||
+ | curve(dgamma(x, | ||
+ | </ | ||
+ | |||
+ | =====Distribuição Weibull e memória===== | ||
+ | |||
+ | A distribuição Weibull também é usada para descrever tempo contínuo de espera até que um evento aconteça. O seu parâmetro de forma determina como a taxa instantânea de mortalidade muda com o tempo decorrido. Se isso acontece, dizemos que a distribuição descreve um processo com [[http:// | ||
+ | |||
+ | ===Uma distribuição sem memória=== | ||
+ | |||
+ | Suponha um processo de mortalidade em tempo contínuo, a uma taxa constante((esta é uma taxa de ocorrência instantânea por tempo, por isso sua unidade é 1/tempo)) de $\lambda = 0.5 \; \text{ano}^{-1}$. Neste caso o tempo de vida segue uma distribuição exponencial. | ||
+ | |||
+ | Neste exemplo, qual será a probabilidade de viver mais do que um ano? Para responder isso, lembre-se que a probabilidade acumulada da exponencial até um valor $x$ é a integral da função de densidade probabilística de zero até $x$: | ||
+ | |||
+ | $$P(t \leq x) \,=\, \int_0^x \lambda e^{- t \lambda} \; dx\, = \, 1-e^{-\lambda x}$$ | ||
+ | |||
+ | e portanto a função de probabilidade acumulada a partir deste valor é seu complemento para a unidade: | ||
+ | |||
+ | $$P(t \geq x) \,=\, 1-P(t \leq x) \,=\, e^{-\lambda x}$$ | ||
+ | |||
+ | Portanto, em nosso exemplo $P(t \geq 1) = e^{-lambda}$. Podemos obter este valor no R com a função de densidade acumulada '' | ||
+ | |||
+ | <code rsplus> | ||
+ | (p1 <- pexp(1, rate=0.5, lower.tail=FALSE)) | ||
+ | </ | ||
+ | |||
+ | Qual a probablilidade que esta distribuição atribui a sobreviver um ano e meio ou mais? | ||
+ | |||
+ | <code rsplus> | ||
+ | (p1.5 <- pexp(1.5, rate=0.5, lower.tail=FALSE)) | ||
+ | </ | ||
+ | |||
+ | Com estes dois valores podemos calcular a probabilidade de sobrevivência por um ano e meio ou mais, dado que sobreviveu-se até um ano. Esta é uma probabilidade condicional: | ||
+ | |||
+ | $$P(t\geq1.5 \,| \,t\geq1)$$ | ||
+ | |||
+ | Que obtemos divindo a condicionada pela condicionante: | ||
+ | |||
+ | <code rsplus> | ||
+ | p1.5/p1 | ||
+ | </ | ||
+ | |||
+ | Compare este valor com a probabilidade de viver meio ano ou mais: | ||
+ | |||
+ | <code rsplus> | ||
+ | pexp(.5, rate=0.5, lower.tail=FALSE) | ||
+ | </ | ||
+ | |||
+ | Os dois valores são idênticos! Isso quer mostra que a exponencial não tem memória: a probabilidade de viver por um tempo adicional $\Delta$ não é afetada pelo tempo já vivido. Em linguagem matemática: | ||
+ | |||
+ | $$P(t\geq x + \Delta\,| \,t\geq x) \ = \ P(t\geq \Delta)$$ | ||
+ | |||
+ | == Bônus: demonstração algébrica == | ||
+ | |||
+ | Como explicamos acima, a probabilidade de se viver mais do que um certo valor $x$ de tempo é | ||
+ | |||
+ | $$P(t \geq x) \,=\, 1-P(t \leq x) \,=\, e^{-\lambda x}$$ | ||
+ | |||
+ | e a probabilidade condicional de viver mais que um tempo adicional | ||
+ | |||
+ | $$ P(t\geq x + \Delta\,| \,t\geq x) \, = \, \frac{P(t \geq x + \Delta)}{P(t \geq x)} $$ | ||
+ | |||
+ | Usando nesta razão a expressão da distribuição de probabilidade acumulada da exponencial temos: | ||
+ | |||
+ | $$ | ||
+ | \frac{P(t \geq x + \Delta)}{P(t \geq x)} \, = \, \frac{e^{-\lambda (x + \Delta) }}{e^{-\lambda x}} \, = \, e^{-\lambda (x+\Delta)} \times e^{\lambda x } \, = \, | ||
+ | e^{-\lambda x - \lambda \Delta + \lambda x} \, = \, e^{- \lambda \Delta} | ||
+ | $$ | ||
+ | |||
+ | Ou seja, sob a distribuição exponencial, | ||
+ | |||
+ | |||
+ | ===Memória na Weibull=== | ||
+ | |||
+ | O parâmetro de forma da distribuição Weibull define o tipo de memória que ela pode descrever. Se o parâmetro é igual a um, a Weibull reduz-se a uma exponencial e portanto não tem memória. Verifique com((neste tutorial fixamos o valor do parâmetro de escala porque não afeta os resultados que nos interessam)): | ||
+ | |||
+ | <code rsplus> | ||
+ | ## Probabilidade de viver mais de 1 ano | ||
+ | (pw1 <- pweibull(1, shape=1, scale=2, lower=FALSE)) | ||
+ | ## P de viver mais de 1 ano e meio | ||
+ | (pw1.5<- pweibull(1+ 0.5, shape=1, scale=2, lower=FALSE)) | ||
+ | ## Probabilidade de viver mais meio ano, dado que viveu um | ||
+ | pw1.5/pw1 | ||
+ | ## Probabilidade de viver meio ano no inicio da vida | ||
+ | pweibull(0.5, | ||
+ | </ | ||
+ | |||
+ | Quando o parâmetro de forma é maior que um cria-se um efeito de memória que pode ser interpretada como envelhecimento: | ||
+ | |||
+ | <code rsplus> | ||
+ | (pw1 <- pweibull(1, shape=1.5, scale=2, lower=FALSE)) | ||
+ | (pw1.5<- pweibull(1+ 0.5, shape=1.5, scale=2, lower=FALSE)) | ||
+ | pw1.5/pw1 | ||
+ | pweibull(0.5, | ||
+ | </ | ||
+ | |||
+ | Quando o parâmetro de forma é menor do que um temos uma memória que pode descrever mortalidade mais intensa de jovens: | ||
+ | |||
+ | <code rsplus> | ||
+ | (pw1 <- pweibull(1, shape=0.2, scale=2, lower=FALSE)) | ||
+ | (pw1.5<- pweibull(1+ 0.5, shape=0.2, scale=2, lower=FALSE)) | ||
+ | pw1.5/pw1 | ||
+ | pweibull(0.5, | ||
+ | </ | ||
+ | |||
+ | ===Função de risco=== | ||
+ | |||
+ | A [[https:// | ||
+ | |||
+ | $$h(t) \ = \ \frac{f(t)}{1-F(t)}$$ | ||
+ | |||
+ | Esta função expressa como o risco de morte ou falha muda com o tempo já decorrido, ou idade. Vamos fazer um gráfico das funções de risco das três distribuições Weibull usadas acima: | ||
+ | |||
+ | <code rsplus> | ||
+ | ## Funcao de risco | ||
+ | hweib <- function(x, shape, scale){ | ||
+ | dweibull(x, shape, scale)/ | ||
+ | pweibull(x, | ||
+ | } | ||
+ | ## Grafico | ||
+ | curve(hweib(x, | ||
+ | ylab=" | ||
+ | curve(hweib(x, | ||
+ | curve(hweib(x, | ||
+ | legend(x=2.5, | ||
+ | | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== Distribuição Log-Normal ===== | ||
+ | |||
+ | Assim como a variável normal descreve a soma ou média de muitas variáveis aleatórias, | ||
+ | |||
+ | O exemplo mais conhecido de processo multiplicativo em ecologia é o modelo de crescimento populacional geométrico estocástico. | ||
+ | |||
+ | Neste modelo, o tamanho da população no tempo **t+1** é o produto do tamanho da população no tempo anterior, **t**, multiplicado pela taxa de crescimento populacional **R**: | ||
+ | |||
+ | $$ | ||
+ | |||
+ | |||
+ | Se **R** varia ao longo do tempo, podemos descrevê-la como uma variável aleatória. Portanto, o tamanho da população será o resultado da multiplicação de muitas realizações de uma variável aleatória. Neste cenário, as abundâncias de um conjunto de espécies com dinâmicas populacionais independentes seguirão uma distribuição log-normal. | ||
+ | |||
+ | Para simular esta situação, criamos uma função que reitera a equação de crescimento de uma população **time** vezes, e repete este procedimento para **N** populações de tamanho inicial **N0**, sendo o valor de **R** uma variável uniforme, com valores entre **Rmin** e **Rmax**: | ||
+ | |||
+ | <code rsplus> | ||
+ | pops <- function(N, | ||
+ | results <- matrix(nrow=N, | ||
+ | results[,1] <- N0 | ||
+ | for(i in 1:N){ | ||
+ | for(z in 2:time){ | ||
+ | results[i, | ||
+ | } | ||
+ | } | ||
+ | results | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | O resultado desta função é uma matriz com **N** linhas (espécies) e **time** colunas (os intervalos de tempo). Com ela, simulamos a dinâmica populacional de 200 espécies por 20 intervalos de tempo, com valor médio do **R=1**, e atribuímos o resultado a um objeto: | ||
+ | |||
+ | <code rsplus> | ||
+ | abunds <- pops(200, | ||
+ | </ | ||
+ | |||
+ | Com isto podemos fazer o histograma de densidade das abundâncias das 200 espécies no último intervalo de tempo: | ||
+ | |||
+ | <code rsplus> | ||
+ | h1< | ||
+ | </ | ||
+ | |||
+ | E sobrepor a curva da função de densidade da log-normal, com os parâmetros estimados da amostra de 200 populações: | ||
+ | |||
+ | <code rsplus> | ||
+ | curve(dlnorm(x, | ||
+ | | ||
+ | add=T, col=" | ||
+ | </ | ||
+ | |||
+ | Se a log-normal é um bom modelo para descrever as abundâncias, | ||
+ | |||
+ | <code rsplus> | ||
+ | qqnorm(log(abunds[, | ||
+ | qqline(log(abunds[, | ||
+ | </ | ||
+ | |||
+ | ==Extra== | ||
+ | Um gráfico que pode ajudar a entender a simulação: | ||
+ | <code rsplus> | ||
+ | nf <- layout(matrix(c(1, | ||
+ | par(mar=c(5, | ||
+ | matplot(t(abunds), | ||
+ | xlab= " | ||
+ | par(mar=c(5, | ||
+ | barplot(h1$counts, | ||
+ | </ | ||
+ | |||
+ | \\ | ||
+ | ---------------- | ||
+ | \\ | ||
+ | |||
+ | |||
+ | ====== Distribuições Contínuas mais Usadas ====== | ||
+ | |||
+ | |||
+ | |||
+ | ^ Distribuição | ||
+ | | [[http:// | ||
+ | | [[http:// | ||
+ | | [[http:// | ||
+ | | [[http:// | ||
+ | | [[http:// | ||
+ | | [[http:// | ||
+ | | [[http:// | ||
+ | |||
+ | |||
+ | \\ | ||
+ | ------------------ | ||
+ | \\ | ||
+ | |||
+ | ====== Exercícios ====== | ||
+ | |||
+ | Faça os exercícios 202.1 a 202.5 no sistema [[http:// | ||
+ | ====== Questões motivadoras para discussão ====== | ||
+ | |||
+ | - A inferência estatística clássica baseia-se fortemente na distribuição Gaussiana. Quais seriam as razões? Quais vantagens e desvantagens você vê nessa estratégia? | ||
+ | - A Gaussiana é a única distribuição que estudamos nesta unidade que tem a esperança indendente da variância. Você esperaria esta propriedade em medidas tomados de sistemas biológicos? | ||
+ | - Um pesquisador descobriu que a distribuição de biomassas das populações das espécies de uma comunidade é muito diferente da família Gaussiana. Ele tentou algumas transformações matemáticas até descobrir que os logarítmos das biomassas podem ser descritas pela família Gaussiana. Qual deve ser a relação entre a esperança dos logarítmos das biomassas e da esperança das biomassas? | ||
+ | ====== Recursos para Estudo ====== | ||
+ | |||
+ | |||
+ | ===== Leituras ===== | ||
+ | |||
+ | === Principal === | ||
+ | |||
+ | * Probability and stochastic distributions for ecological modeling. Capítulo 4, item 4.5.2 de: Bolker, B.M. 2008 Ecological Models and Data in R Princeton: Princeton University Press. | ||
+ | |||
+ | |||
+ | === Complementares === | ||
+ | |||
+ | * Randon variables and probability distributions. Cap.2 de: Gotelli, N.J. & Ellison, A.M. 2004. A primer of ecological statistics. Sinauer. | ||
+ | |||
+ | * Probability theory. Cap.3 de: Otto, S. P. & Day, T. (2007). A biologist' | ||
+ | | ||
+ | * Houle, D., Pélabon, C., Wagner, G. P., & Hansen, T. F. (2011). Measurement and meaning in biology. The Quarterly Review of Biology, 86(1), 3-34. //Excelente revisão sobre consequências das transformações matemáticas de dados em biologia.// [[http:// | ||
+ | |||
+ | * Ruel, J. J., & Ayres, M. P. (1999). Jensen’s inequality predicts effects of environmental variation. Trends in Ecology & Evolution, 14(9), 361-366. // | ||
+ | |||
+ | * Verbete da wikipedia sobre a [[http:// | ||
+ | |||
+ | * Newman, M. E. (2005). Power laws, Pareto distributions and Zipf's law. Contemporary physics, 46(5), 323-351. //Ótima introdução a uma família de distribuições sem esperança// | ||
+ | |||
+ | |||
+ | ===== Na Internet ===== | ||
+ | |||
+ | * Portal sobre distribuições de probabilidades na Wikipedia: [[http:// | ||
+ | |||
+ | * O [[https:// | ||
+ | |||
+ | * [[http:// | ||
+ | |||
+ | * Distribuições interativas //on-line// do Statistics Online Computational Resource da UCLA: [[http:// | ||
+ | |||
+ | * Capítulo sobre variáveis aleatórias do //e-book// de Probabilidade e Estatística da UCLA: [[http:// | ||
+ | |||
+ | |||
+ | * Excelente vídeo-aula sobre o conceito de momentos de distribuições probabilísticas, | ||
+ | |||
+ | * Um excelente resumo das propriedades e relações entre distribuições de probabilidade: | ||
+ | * Leemis, L. M., and J. T. McQueston. 2008. Univariate Distribution Relationships. The American Statistician 62: | ||
+ | * [[http:// | ||
+ | |||
+ | * [[http:// | ||
+ | |||
+ | * Várias atividades em JAVA com a normal no livro on-line //Seeing Statistics// | ||
+ | |||
+ | * [[http:// | ||
+ | |||
+ | * [[http:// | ||
+ | |||
+ | * **Sobre o conceito matemático de infinito**: | ||
+ | * dois ótimos vídeos do fantástico canal de popularização da matemática [[http:// | ||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | |||
+ | |||
+ | |||
+ | |||