02-continuas:02-continuas
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
| Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
| 02-continuas:02-continuas [2022/10/23 21:27] – [Distribuição Weibull e memória] paulo | 02-continuas:02-continuas [2024/11/03 03:40] (atual) – paulo | ||
|---|---|---|---|
| Linha 1: | Linha 1: | ||
| + | ====== 2. Distribuições Contínuas | ||
| + | |||
| + | Ao contrário de contagens, as medidas contínuas podem assumir qualquer valor dentro de um intervalo numérico. | ||
| + | |||
| + | Nesse tópico apresentamos esses modelos e exploramos suas propriedades básicas, com simulações dos cenários probabilísticos em computador. Também vamos verificar que a soma de muitas fontes de variação no limite cria a distribuição contínua mais conhecida, a Gaussiana. | ||
| + | |||
| + | |||
| + | ====== Conceitos ====== | ||
| + | |||
| + | * Função de densidade probabilística | ||
| + | * Função de probabilidade acumulada | ||
| + | * Esperança e variância de variáveis contínuas | ||
| + | * Teorema Central do Limite | ||
| + | * Distribuições de probabilidade contínuas mais usadas em ecologia | ||
| + | |||
| + | |||
| + | ====== Tutoriais ====== | ||
| + | |||
| + | ===== Função de Densidade e Probabilidade ===== | ||
| + | |||
| + | É importante ter clara a diferença entre a // | ||
| + | |||
| + | A primeira não é uma probabilidade, | ||
| + | |||
| + | A função **" | ||
| + | <code rsplus> | ||
| + | > dnorm(2+c(-0.15, | ||
| + | [1] 1.295176 1.295176 | ||
| + | </ | ||
| + | |||
| + | Aplicando a função **" | ||
| + | <code rsplus> | ||
| + | curve(dnorm(x, | ||
| + | xlab=" | ||
| + | </ | ||
| + | |||
| + | Vamos acrescentar neste gráfico os valores que calculamos acima: | ||
| + | <code rsplus> | ||
| + | points(2+c(-0.15, | ||
| + | | ||
| + | segments(x0=c(2+c(-0.15, | ||
| + | | ||
| + | | ||
| + | | ||
| + | | ||
| + | </ | ||
| + | |||
| + | Para uma variável aleatória a probabilidade só pode ser definida para //__um intervalo__//, | ||
| + | <code rsplus> | ||
| + | area.norm <- function(from, | ||
| + | len <- (to-from)*shade | ||
| + | x <- seq(from, | ||
| + | segments(x0=x, | ||
| + | } | ||
| + | </ | ||
| + | |||
| + | |||
| + | E agora aplicá-la para colorir de vermelho a área delimitada por $\mu \pm 1,5\sigma$ no gráfico que criamos: | ||
| + | <code rsplus> | ||
| + | | ||
| + | </ | ||
| + | |||
| + | A área sob uma função é sua // | ||
| + | <code rsplus> | ||
| + | | ||
| + | </ | ||
| + | |||
| + | A integral de qualquer função de densidade probabilística no intervalo que contém todos os valores da variável aleatória é um. Verifique isto para a normal, integrando-a de //__menos infinito__// | ||
| + | <code rsplus> | ||
| + | integrate(dnorm, | ||
| + | integrate(dnorm, | ||
| + | </ | ||
| + | |||
| + | A integral do limite inferior de uma função de densidade até um certo valor é a // | ||
| + | |||
| + | <box centered 70% red|A probabilidade de um intervalo é a diferença de suas probabilidades acumuladas> | ||
| + | {{: | ||
| + | </ | ||
| + | |||
| + | O que você obtém com o comando: | ||
| + | <code rsplus> | ||
| + | pnorm(2.15, | ||
| + | </ | ||
| + | |||
| + | A funções no R para calcular probabilidades acumuladas, como a **" | ||
| + | <code rsplus> | ||
| + | 1-(pnorm(2.15, | ||
| + | </ | ||
| + | |||
| + | Por fim, como o intervalo é simétrico em torno da média, e a curva normal também o é, uma terceira maneira de fazer o cálculo é: | ||
| + | <code rsplus> | ||
| + | 1-2*pnorm(1.85, | ||
| + | </ | ||
| + | |||
| + | ==== Extras ==== | ||
| + | Se quiser reproduzir a figura deste tutorial, o código em R é | ||
| + | <code rsplus> | ||
| + | png(" | ||
| + | par(mfrow=c(1, | ||
| + | curve(dnorm(x, | ||
| + | xlab="", | ||
| + | area.norm(1.7, | ||
| + | curve(dnorm(x, | ||
| + | xlab="", | ||
| + | area.norm(1.7, | ||
| + | curve(dnorm(x, | ||
| + | xlab="", | ||
| + | area.norm(1.85, | ||
| + | mtext(c(" | ||
| + | dev.off() | ||
| + | </ | ||
| + | |||
| + | |||
| + | ===== Esperança de uma Distribuição Contínua ===== | ||
| + | |||
| + | A esperança de uma variável aleatória contínua é | ||
| + | |||
| + | $$ E[X]\ = \ \int x \cdot f(x) \ dx $$ | ||
| + | |||
| + | Onde $f(x)$ é a função de densidade probabilística. | ||
| + | |||
| + | Vamos verificar isto numericamente para a variável exponencial, | ||
| + | <code rsplus> | ||
| + | esper.exp <- function(x, | ||
| + | dexp(x, | ||
| + | } | ||
| + | </ | ||
| + | |||
| + | Agora usamos a função **" | ||
| + | |||
| + | <code rsplus> integrate(esper.exp, | ||
| + | |||
| + | Compare o valor obtido com o valor teórico da esperança, | ||
| + | |||
| + | ===== Histograma de Densidade ===== | ||
| + | |||
| + | Para comparar a distribuição de dados com alguma variável aleatória, podemos usar um histograma re-escalonado para densidade. | ||
| + | |||
| + | Para exemplificar, | ||
| + | |||
| + | Primeiro criamos um objeto com os dados de interesse, que são os fustes da caixeta em Chauás: | ||
| + | <code rsplus> | ||
| + | caixeta <- read.csv2(" | ||
| + | chauas <- caixeta[caixeta$local==" | ||
| + | & | ||
| + | </ | ||
| + | |||
| + | E então criamos um fator para as classes de CAP, com intervalos de 100 mm: | ||
| + | <code rsplus> | ||
| + | chauas$cap.class <- cut(chauas$cap, | ||
| + | </ | ||
| + | |||
| + | Um gráfico da tabulação deste fator é um histograma de frequências: | ||
| + | <code rsplus> | ||
| + | barplot(table(chauas$cap.class), | ||
| + | </ | ||
| + | |||
| + | Dividindo-se os valores pelo total de fustes temos um histograma de frequências relativas: | ||
| + | <code rsplus> | ||
| + | barplot(table(chauas$cap.class)/ | ||
| + | </ | ||
| + | |||
| + | Finalmente, dividindo novamente estes valores pelas amplitude do intervalo de classe usado (100 mm) temos um histograma de densidade: | ||
| + | <code rsplus> | ||
| + | barplot(table(chauas$cap.class)/ | ||
| + | space=0) | ||
| + | </ | ||
| + | |||
| + | Neste histograma, a soma das áreas das barras é um. A função **" | ||
| + | <code rsplus> | ||
| + | hist(chauas$cap, | ||
| + | | ||
| + | </ | ||
| + | |||
| + | Nesta escala podemo sobrepor funções de densidade, como a Gaussiana: | ||
| + | <code rsplus> curve(dnorm(x, | ||
| + | sd=sd(chauas$cap)), | ||
| + | |||
| + | |||
| + | ===== Distribuição Normal (Gaussiana) ===== | ||
| + | |||
| + | As companhias aéreas norte-americanas garantem que 98% de seus passageiros não terão problemas para se acomodar nos assentos da classe econômica. Para isso, usam um modelo que descreve a distribuição das larguras dos quadris dos homens norte-americanos como uma variável normal, com média de 14,4 polegadas, e desvio-padrão de 1,0 polegada. | ||
| + | |||
| + | Faça um gráfico desta distribuição de probabilidades: | ||
| + | <code rsplus> | ||
| + | curve(dnorm(x, | ||
| + | xlab=" | ||
| + | </ | ||
| + | |||
| + | Para definir a largura do assento, é preciso saber o limite superior do intervalo que contêm 98% da população. Esse é o quantil de 98% da distribuição, | ||
| + | |||
| + | Calcule o valor deste quantil com o comando: | ||
| + | <code rsplus> | ||
| + | (larg <- qnorm(mean=14.4, | ||
| + | </ | ||
| + | |||
| + | Este é o valor que delimita 98% da área sob a curva normal. Usando a função criada no tutorial anterior podemos visualizar no gráfico a área que vai até o quantil calculado acima: | ||
| + | |||
| + | <code rsplus> | ||
| + | area.norm(8, | ||
| + | </ | ||
| + | |||
| + | |||
| + | ===== Variando os Parâmetros da Normal ===== | ||
| + | |||
| + | Imagine que o desvio-padrão para o exemplo dos quadris norte-americanos seja 50% maior. O que deve ocorrer com o quantil de 98%? Verifique sua expectativa com o comando: | ||
| + | <code rsplus> | ||
| + | qnorm(mean=14.4, | ||
| + | </ | ||
| + | |||
| + | Repita o gráfico do tutorial anterior, e adicione ao gráfico a distribuição de probabilidades com o novo valor do parâmetro desvio-padrão: | ||
| + | <code rsplus> | ||
| + | curve(dnorm(x, | ||
| + | xlab=" | ||
| + | curve(dnorm(x, | ||
| + | </ | ||
| + | |||
| + | Os parâmetros da distribuição normal correspondem à média e ao desvio-padrão. Explore o comportamento da curva com a mudança de seus parâmetros: | ||
| + | |||
| + | <code rsplus> | ||
| + | cores <- rainbow(n=4) | ||
| + | curve(dnorm(x), | ||
| + | curve(dnorm(x, | ||
| + | curve(dnorm(x, | ||
| + | curve(dnorm(x, | ||
| + | legend(-7.5, | ||
| + | " | ||
| + | </ | ||
| + | |||
| + | |||
| + | ===== Teorema Central do Limite ===== | ||
| + | |||
| + | O Teorema Central do Limite (TCL) prova que as médias de amostras independentes tomadas de uma mesma distribuição tendem para uma distribuição normal. A média desta normal é a mesma da distribuição de onde vieram as amostras, e a variância é igual à variância da distribuição original, dividida pelo tamanho das amostras. | ||
| + | |||
| + | Verifique isto com o seguinte tutorial: | ||
| + | |||
| + | Sorteie dez mil números de uma distribuição muito diferente de uma normal, como uma Poisson com média baixa: | ||
| + | <code rsplus> | ||
| + | vals <- rpois(10000, | ||
| + | </ | ||
| + | |||
| + | Agora imagine que estes valores foram obtidos de mil amostras independentes, | ||
| + | <code rsplus> | ||
| + | cod.amostras <- factor(rep(1: | ||
| + | </ | ||
| + | |||
| + | Agora podemos calcular a média de cada uma dessas amostras: | ||
| + | |||
| + | <code rsplus> | ||
| + | medias.vals <- tapply(vals, | ||
| + | </ | ||
| + | |||
| + | E fazer um histograma dessas mil médias: | ||
| + | |||
| + | <code rsplus> | ||
| + | hist(medias.vals, | ||
| + | </ | ||
| + | |||
| + | E sobrepor a função de densidade da normal, com os parâmetros previstos pelo TCL: | ||
| + | |||
| + | <code rsplus> | ||
| + | curve(dnorm(x, | ||
| + | </ | ||
| + | |||
| + | Uma outra ótima maneira de avaliar a normalidade é com o gráfico de quantis normais ((Para saber mais sobre gráficos quantil-quantil veja este [[https:// | ||
| + | |||
| + | <code rsplus> | ||
| + | qqnorm(medias.vals) | ||
| + | qqline(medias.vals) | ||
| + | </ | ||
| + | |||
| + | Repita os procedimentos, | ||
| + | |||
| + | |||
| + | ===== Distribuição Bernoulli Tendendo à Normal? ===== | ||
| + | |||
| + | Uma maneira simples de formular o Teorema Central do Limite é que a soma ou a média de muitas variáveis aleatórias tende a uma variável normal. Esta tendência é válida mesmo para variáveis com distribuições muito diferentes da normal e que não tenham os mesmos parâmetros. | ||
| + | |||
| + | Neste tutorial investigaremos se o TCL pode nos ajudar a propor um modelo para a riqueza de espécies em um conjunto de áreas. Vamos simular um cenário em que a ocorrência de cada espécie é uma variável Bernoulli (**1** = presente, **0** = ausente), cujo único parâmetro (**p** a probabilidade de ocorrência) varia entre espécies. | ||
| + | |||
| + | Vamos assumir que as probabilidades de ocorrência também são variáveis aleatórias. Uma escolha natural é a [[https:// | ||
| + | |||
| + | <box centered 90% red|Função de densidade da distribuição beta usada para representar as probabilidades de ocorrência das espécies. Os parâmetros usados são **a=1** e **b=5**.> | ||
| + | {{: | ||
| + | </ | ||
| + | |||
| + | |||
| + | Para simular uma metacomunidade com 300 espécies, sorteamos 300 valores da distribuição beta representada acima: | ||
| + | |||
| + | <code rsplus> | ||
| + | p.oc <- rbeta(300, shape1=1, | ||
| + | </ | ||
| + | |||
| + | Em seguida criamos uma função que faz **N** experimentos de Bernoulli, tomando um valor **1** com probabilidade $p$ e valor $0$ com probabilidade **1-p** | ||
| + | |||
| + | <code rsplus> | ||
| + | ocorre <- function(p, | ||
| + | </ | ||
| + | |||
| + | Aplicando esta função às probabilidades de ocorrência sorteadas no passo anterior, obtemos uma matriz com **100** linhas (locais) e **300** colunas (espécies): | ||
| + | <code rsplus> | ||
| + | matriz <- sapply(p.oc, | ||
| + | </ | ||
| + | |||
| + | A soma de cada linhas é o número de espécies em cada um dos **100** locais | ||
| + | <code rsplus> | ||
| + | riquezas <- apply(matriz, | ||
| + | </ | ||
| + | |||
| + | Cuja distribuição pode ser comparada com função de densidade de uma normal de mesma média e desvio-padrão: | ||
| + | |||
| + | <code rsplus> | ||
| + | hist(riquezas, | ||
| + | | ||
| + | curve(dnorm(x, | ||
| + | add=T, | ||
| + | </ | ||
| + | |||
| + | Avalie também o ajuste a uma normal com o gráfico de quantis teóricos: | ||
| + | |||
| + | <code rsplus> | ||
| + | qqnorm(riquezas) | ||
| + | qqline(riquezas) | ||
| + | </ | ||
| + | |||
| + | ==== Extras ==== | ||
| + | Se quiser reproduzir o gráfico da variável beta deste tutorial o comando é: | ||
| + | <code rsplus> | ||
| + | curve(dbeta(x, | ||
| + | xlab=" | ||
| + | </ | ||
| + | |||
| + | |||
| + | ===== Distribuição Exponencial ===== | ||
| + | |||
| + | A variável exponencial é a análoga contínua da variável geométrica. Ela pode ser usada para descrever o tempo de espera até a primeira ocorrência de um evento, dado que ele tem uma taxa de ocorrência $\lambda$ constante. | ||
| + | |||
| + | Vamos simular esta situação, imaginando que você acompanha um animal por até duas horas((a rigor deveríamos esperar até a primeira ocorrência. Fixando o tempo máximo de observação temos uma [[http:// | ||
| + | |||
| + | A distribuição desta variável aleatória pode ser simulada repetindo o estudo muitas vezes. A cada uma delas haverá um certo número de comportamentos, | ||
| + | <code rsplus> | ||
| + | n <- rpois(10000, | ||
| + | </ | ||
| + | |||
| + | O total de eventos será então a soma destes valores sorteados. Em seguida sorteamos este número de valores de uma distribuição uniforme, com o mínimo de 0 e máximo de 120. Estes serão os horários de ocorrência de cada evento, em cada repetição do estudo ((Como cada evento é independente dos demais e a taxa de ocorrência instantânea é constante, todos os horários são equiprováveis, | ||
| + | |||
| + | <code rsplus> | ||
| + | vals <- runif(sum(n), | ||
| + | </ | ||
| + | |||
| + | E criamos um fator para identificar cada repetição do estudo, ou seja, cada dia de observação: | ||
| + | <code rsplus> | ||
| + | cod.amostras <- factor(rep(1: | ||
| + | </ | ||
| + | |||
| + | Até aqui temos um vetor com tempo transcorrido até cada um dos eventos que ocorreram em cada dia de observação. Com isto, podemos usar a função **" | ||
| + | <code rsplus> | ||
| + | primeiro <- tapply(vals, | ||
| + | </ | ||
| + | |||
| + | E agora construímos um histograma de densidade desta variável, e sobrepomos a função de densidade da variável exponencial: | ||
| + | <code rsplus> | ||
| + | hist(primeiro, | ||
| + | | ||
| + | curve(dexp(x, | ||
| + | </ | ||
| + | |||
| + | Avalie visualmente a concordância com o modelo teórico. | ||
| + | |||
| + | |||
| + | ===== Distribuição Gama ===== | ||
| + | |||
| + | A variável Gama foi criada como uma extensão da exponencial, | ||
| + | |||
| + | Usando a simulação do tutorial anterior, podemos obter os tempos de espera até que o animal apresente o comportamento de interesse pela segunda vez. Para isto, criamos uma função que retorna o n-ésimo menor valor de um vetor de números | ||
| + | |||
| + | <code rsplus> | ||
| + | enesimo <- function(x, | ||
| + | </ | ||
| + | |||
| + | E aplicamos esta função a cada repetição do estudo, guardada no vetor '' | ||
| + | |||
| + | <code rsplus> | ||
| + | segundo <- tapply(vals, | ||
| + | </ | ||
| + | |||
| + | Para então fazer um histograma de densidade com estes dados | ||
| + | |||
| + | <code rsplus> | ||
| + | hist(segundo, | ||
| + | | ||
| + | </ | ||
| + | |||
| + | Podemos então sobrepor a este histograma a curva da função de densidade probabilística da variável Gama, com os parâmetros teóricos de taxa de ocorrência (**" | ||
| + | |||
| + | <code rsplus> | ||
| + | curve(dgamma(x, | ||
| + | </ | ||
| + | |||
| + | =====Distribuição Weibull e memória===== | ||
| + | |||
| + | A distribuição Weibull também é usada para descrever tempo contínuo de espera até que um evento aconteça. O seu parâmetro de forma determina como a taxa instantânea de mortalidade muda com o tempo decorrido. Se isso acontece, dizemos que a distribuição descreve um processo com [[http:// | ||
| + | |||
| + | ===Uma distribuição sem memória=== | ||
| + | |||
| + | Suponha um processo de mortalidade em tempo contínuo, a uma taxa constante((esta é uma taxa de ocorrência instantânea por tempo, por isso sua unidade é 1/tempo)) de $\lambda = 0.5 \; \text{ano}^{-1}$. Neste caso o tempo de vida segue uma distribuição exponencial. | ||
| + | |||
| + | Neste exemplo, qual será a probabilidade de viver mais do que um ano? Para responder isso, lembre-se que a probabilidade acumulada da exponencial até um valor $x$ é a integral da função de densidade probabilística de zero até $x$: | ||
| + | |||
| + | $$P(t \leq x) \,=\, \int_0^x \lambda e^{- t \lambda} \; dx\, = \, 1-e^{-\lambda x}$$ | ||
| + | |||
| + | e portanto a função de probabilidade acumulada a partir deste valor é seu complemento para a unidade: | ||
| + | |||
| + | $$P(t \geq x) \,=\, 1-P(t \leq x) \,=\, e^{-\lambda x}$$ | ||
| + | |||
| + | Portanto, em nosso exemplo $P(t \geq 1) = e^{-lambda}$. Podemos obter este valor no R com a função de densidade acumulada '' | ||
| + | |||
| + | <code rsplus> | ||
| + | (p1 <- pexp(1, rate=0.5, lower.tail=FALSE)) | ||
| + | </ | ||
| + | |||
| + | Qual a probablilidade que esta distribuição atribui a sobreviver um ano e meio ou mais? | ||
| + | |||
| + | <code rsplus> | ||
| + | (p1.5 <- pexp(1.5, rate=0.5, lower.tail=FALSE)) | ||
| + | </ | ||
| + | |||
| + | Com estes dois valores podemos calcular a probabilidade de sobrevivência por um ano e meio ou mais, dado que sobreviveu-se até um ano. Esta é uma probabilidade condicional: | ||
| + | |||
| + | $$P(t\geq1.5 \,| \,t\geq1)$$ | ||
| + | |||
| + | Que obtemos divindo a condicionada pela condicionante: | ||
| + | |||
| + | <code rsplus> | ||
| + | p1.5/p1 | ||
| + | </ | ||
| + | |||
| + | Compare este valor com a probabilidade de viver meio ano ou mais: | ||
| + | |||
| + | <code rsplus> | ||
| + | pexp(.5, rate=0.5, lower.tail=FALSE) | ||
| + | </ | ||
| + | |||
| + | Os dois valores são idênticos! Isso quer mostra que a exponencial não tem memória: a probabilidade de viver por um tempo adicional $\Delta$ não é afetada pelo tempo já vivido. Em linguagem matemática: | ||
| + | |||
| + | $$P(t\geq x + \Delta\,| \,t\geq x) \ = \ P(t\geq \Delta)$$ | ||
| + | |||
| + | == Bônus: demonstração algébrica == | ||
| + | |||
| + | Como explicamos acima, a probabilidade de se viver mais do que um certo valor $x$ de tempo é | ||
| + | |||
| + | $$P(t \geq x) \,=\, 1-P(t \leq x) \,=\, e^{-\lambda x}$$ | ||
| + | |||
| + | e a probabilidade condicional de viver mais que um tempo adicional | ||
| + | |||
| + | $$ P(t\geq x + \Delta\,| \,t\geq x) \, = \, \frac{P(t \geq x + \Delta)}{P(t \geq x)} $$ | ||
| + | |||
| + | Usando nesta razão a expressão da distribuição de probabilidade acumulada da exponencial temos: | ||
| + | |||
| + | $$ | ||
| + | \frac{P(t \geq x + \Delta)}{P(t \geq x)} \, = \, \frac{e^{-\lambda (x + \Delta) }}{e^{-\lambda x}} \, = \, e^{-\lambda (x+\Delta)} \times e^{\lambda x } \, = \, | ||
| + | e^{-\lambda x - \lambda \Delta + \lambda x} \, = \, e^{- \lambda \Delta} | ||
| + | $$ | ||
| + | |||
| + | Ou seja, sob a distribuição exponencial, | ||
| + | |||
| + | |||
| + | ===Memória na Weibull=== | ||
| + | |||
| + | O parâmetro de forma da distribuição Weibull define o tipo de memória que ela pode descrever. Se o parâmetro é igual a um, a Weibull reduz-se a uma exponencial e portanto não tem memória. Verifique com((neste tutorial fixamos o valor do parâmetro de escala porque não afeta os resultados que nos interessam)): | ||
| + | |||
| + | <code rsplus> | ||
| + | ## Probabilidade de viver mais de 1 ano | ||
| + | (pw1 <- pweibull(1, shape=1, scale=2, lower=FALSE)) | ||
| + | ## P de viver mais de 1 ano e meio | ||
| + | (pw1.5<- pweibull(1+ 0.5, shape=1, scale=2, lower=FALSE)) | ||
| + | ## Probabilidade de viver mais meio ano, dado que viveu um | ||
| + | pw1.5/pw1 | ||
| + | ## Probabilidade de viver meio ano no inicio da vida | ||
| + | pweibull(0.5, | ||
| + | </ | ||
| + | |||
| + | Quando o parâmetro de forma é maior que um cria-se um efeito de memória que pode ser interpretada como envelhecimento: | ||
| + | |||
| + | <code rsplus> | ||
| + | (pw1 <- pweibull(1, shape=1.5, scale=2, lower=FALSE)) | ||
| + | (pw1.5<- pweibull(1+ 0.5, shape=1.5, scale=2, lower=FALSE)) | ||
| + | pw1.5/pw1 | ||
| + | pweibull(0.5, | ||
| + | </ | ||
| + | |||
| + | Quando o parâmetro de forma é menor do que um temos uma memória que pode descrever mortalidade mais intensa de jovens: | ||
| + | |||
| + | <code rsplus> | ||
| + | (pw1 <- pweibull(1, shape=0.2, scale=2, lower=FALSE)) | ||
| + | (pw1.5<- pweibull(1+ 0.5, shape=0.2, scale=2, lower=FALSE)) | ||
| + | pw1.5/pw1 | ||
| + | pweibull(0.5, | ||
| + | </ | ||
| + | |||
| + | ===Função de risco=== | ||
| + | |||
| + | A [[https:// | ||
| + | |||
| + | $$h(t) \ = \ \frac{f(t)}{1-F(t)}$$ | ||
| + | |||
| + | Esta função expressa como o risco de morte ou falha muda com o tempo já decorrido, ou idade. Vamos fazer um gráfico das funções de risco das três distribuições Weibull usadas acima: | ||
| + | |||
| + | <code rsplus> | ||
| + | ## Funcao de risco | ||
| + | hweib <- function(x, shape, scale){ | ||
| + | dweibull(x, shape, scale)/ | ||
| + | pweibull(x, | ||
| + | } | ||
| + | ## Grafico | ||
| + | curve(hweib(x, | ||
| + | ylab=" | ||
| + | curve(hweib(x, | ||
| + | curve(hweib(x, | ||
| + | legend(x=2.5, | ||
| + | | ||
| + | </ | ||
| + | |||
| + | |||
| + | ===== Distribuição Log-Normal ===== | ||
| + | |||
| + | Assim como a variável normal descreve a soma ou média de muitas variáveis aleatórias, | ||
| + | |||
| + | O exemplo mais conhecido de processo multiplicativo em ecologia é o modelo de crescimento populacional geométrico estocástico. | ||
| + | |||
| + | Neste modelo, o tamanho da população no tempo **t+1** é o produto do tamanho da população no tempo anterior, **t**, multiplicado pela taxa de crescimento populacional **R**: | ||
| + | |||
| + | $$ | ||
| + | |||
| + | |||
| + | Se **R** varia ao longo do tempo, podemos descrevê-la como uma variável aleatória. Portanto, o tamanho da população será o resultado da multiplicação de muitas realizações de uma variável aleatória. Neste cenário, as abundâncias de um conjunto de espécies com dinâmicas populacionais independentes seguirão uma distribuição log-normal. | ||
| + | |||
| + | Para simular esta situação, criamos uma função que reitera a equação de crescimento de uma população **time** vezes, e repete este procedimento para **N** populações de tamanho inicial **N0**, sendo o valor de **R** uma variável uniforme, com valores entre **Rmin** e **Rmax**: | ||
| + | |||
| + | <code rsplus> | ||
| + | pops <- function(N, | ||
| + | results <- matrix(nrow=N, | ||
| + | results[,1] <- N0 | ||
| + | for(i in 1:N){ | ||
| + | for(z in 2:time){ | ||
| + | results[i, | ||
| + | } | ||
| + | } | ||
| + | results | ||
| + | } | ||
| + | </ | ||
| + | |||
| + | O resultado desta função é uma matriz com **N** linhas (espécies) e **time** colunas (os intervalos de tempo). Com ela, simulamos a dinâmica populacional de 200 espécies por 20 intervalos de tempo, com valor médio do **R=1**, e atribuímos o resultado a um objeto: | ||
| + | |||
| + | <code rsplus> | ||
| + | abunds <- pops(200, | ||
| + | </ | ||
| + | |||
| + | Com isto podemos fazer o histograma de densidade das abundâncias das 200 espécies no último intervalo de tempo: | ||
| + | |||
| + | <code rsplus> | ||
| + | h1< | ||
| + | </ | ||
| + | |||
| + | E sobrepor a curva da função de densidade da log-normal, com os parâmetros estimados da amostra de 200 populações: | ||
| + | |||
| + | <code rsplus> | ||
| + | curve(dlnorm(x, | ||
| + | | ||
| + | add=T, col=" | ||
| + | </ | ||
| + | |||
| + | Se a log-normal é um bom modelo para descrever as abundâncias, | ||
| + | |||
| + | <code rsplus> | ||
| + | qqnorm(log(abunds[, | ||
| + | qqline(log(abunds[, | ||
| + | </ | ||
| + | |||
| + | ==Extra== | ||
| + | Um gráfico que pode ajudar a entender a simulação: | ||
| + | <code rsplus> | ||
| + | nf <- layout(matrix(c(1, | ||
| + | par(mar=c(5, | ||
| + | matplot(t(abunds), | ||
| + | xlab= " | ||
| + | par(mar=c(5, | ||
| + | barplot(h1$counts, | ||
| + | </ | ||
| + | |||
| + | \\ | ||
| + | ---------------- | ||
| + | \\ | ||
| + | |||
| + | |||
| + | ====== Distribuições Contínuas mais Usadas ====== | ||
| + | |||
| + | |||
| + | |||
| + | ^ Distribuição | ||
| + | | [[http:// | ||
| + | | [[http:// | ||
| + | | [[http:// | ||
| + | | [[http:// | ||
| + | | [[http:// | ||
| + | | [[http:// | ||
| + | | [[http:// | ||
| + | |||
| + | |||
| + | \\ | ||
| + | ------------------ | ||
| + | \\ | ||
| + | |||
| + | ====== Exercícios ====== | ||
| + | |||
| + | Faça os exercícios 202.1 a 202.5 no sistema [[http:// | ||
| + | ====== Questões motivadoras para discussão ====== | ||
| + | |||
| + | - A inferência estatística clássica baseia-se fortemente na distribuição Gaussiana. Quais seriam as razões? Quais vantagens e desvantagens você vê nessa estratégia? | ||
| + | - A Gaussiana é a única distribuição que estudamos nesta unidade que tem a esperança indendente da variância. Você esperaria esta propriedade em medidas tomados de sistemas biológicos? | ||
| + | - Um pesquisador descobriu que a distribuição de biomassas das populações das espécies de uma comunidade é muito diferente da família Gaussiana. Ele tentou algumas transformações matemáticas até descobrir que os logarítmos das biomassas podem ser descritas pela família Gaussiana. Qual deve ser a relação entre a esperança dos logarítmos das biomassas e da esperança das biomassas? | ||
| + | ====== Recursos para Estudo ====== | ||
| + | |||
| + | |||
| + | ===== Leituras ===== | ||
| + | |||
| + | === Principal === | ||
| + | |||
| + | * Probability and stochastic distributions for ecological modeling. Capítulo 4, item 4.5.2 de: Bolker, B.M. 2008 Ecological Models and Data in R Princeton: Princeton University Press. | ||
| + | |||
| + | |||
| + | === Complementares === | ||
| + | |||
| + | * Randon variables and probability distributions. Cap.2 de: Gotelli, N.J. & Ellison, A.M. 2004. A primer of ecological statistics. Sinauer. | ||
| + | |||
| + | * Probability theory. Cap.3 de: Otto, S. P. & Day, T. (2007). A biologist' | ||
| + | | ||
| + | * Houle, D., Pélabon, C., Wagner, G. P., & Hansen, T. F. (2011). Measurement and meaning in biology. The Quarterly Review of Biology, 86(1), 3-34. //Excelente revisão sobre consequências das transformações matemáticas de dados em biologia.// [[http:// | ||
| + | |||
| + | * Ruel, J. J., & Ayres, M. P. (1999). Jensen’s inequality predicts effects of environmental variation. Trends in Ecology & Evolution, 14(9), 361-366. // | ||
| + | |||
| + | * Verbete da wikipedia sobre a [[http:// | ||
| + | |||
| + | * Newman, M. E. (2005). Power laws, Pareto distributions and Zipf's law. Contemporary physics, 46(5), 323-351. //Ótima introdução a uma família de distribuições sem esperança// | ||
| + | |||
| + | |||
| + | ===== Na Internet ===== | ||
| + | |||
| + | * Portal sobre distribuições de probabilidades na Wikipedia: [[http:// | ||
| + | |||
| + | * O [[https:// | ||
| + | |||
| + | * [[http:// | ||
| + | |||
| + | * Distribuições interativas //on-line// do Statistics Online Computational Resource da UCLA: [[http:// | ||
| + | |||
| + | * Capítulo sobre variáveis aleatórias do //e-book// de Probabilidade e Estatística da UCLA: [[http:// | ||
| + | |||
| + | |||
| + | * Excelente vídeo-aula sobre o conceito de momentos de distribuições probabilísticas, | ||
| + | |||
| + | * Um excelente resumo das propriedades e relações entre distribuições de probabilidade: | ||
| + | * Leemis, L. M., and J. T. McQueston. 2008. Univariate Distribution Relationships. The American Statistician 62: | ||
| + | * [[http:// | ||
| + | |||
| + | * [[http:// | ||
| + | |||
| + | * Várias atividades em JAVA com a normal no livro on-line //Seeing Statistics// | ||
| + | |||
| + | * [[http:// | ||
| + | |||
| + | * [[http:// | ||
| + | |||
| + | * **Sobre o conceito matemático de infinito**: | ||
| + | * dois ótimos vídeos do fantástico canal de popularização da matemática [[http:// | ||
| + | * [[http:// | ||
| + | * [[http:// | ||
| + | * [[http:// | ||
| + | |||
| + | |||
| + | |||
| + | |||