05-binomial-poisson:05-binomial-poisson
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
05-binomial-poisson:05-binomial-poisson [2020/12/01 18:36] – [Para saber mais sobre glms] paulo | 05-binomial-poisson:05-binomial-poisson [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== 5. Modelos Binomial e Poisson ====== | ||
+ | |||
+ | A função de verossimilhança serve para encontrar os parâmetros de uma distribuição de probabilidade que melhor descreve os dados. Para isso, muitas vezes precisamos permitir que os parâmetros das distribuições variem, em função uma ou mais variáveis preditoras ou independentes. | ||
+ | |||
+ | Nestes tutoriais vamos simular | ||
+ | \\ | ||
+ | |||
+ | |||
+ | ====== Conceitos ====== | ||
+ | |||
+ | * Modelos não-gaussianos | ||
+ | * Modelos lineares generalizados | ||
+ | * Função de ligação | ||
+ | * Função logística, probito e logito | ||
+ | * Sobredispersão | ||
+ | |||
+ | |||
+ | |||
+ | ====== Tutoriais ======= | ||
+ | |||
+ | ===== Modelos Poisson: Fecundidade de Solanum sp. ===== | ||
+ | |||
+ | Neste tutorial vamos usar modelos Poisson para descrever a distribuição de número de frutos em plantas adultas de //Solanum sp.//. Mas ao invés de dados reais, criaremos os valores de uma distribuição Poisson. A vantagem da simulação é que podemos avaliar o desempenho dos modelos, pois conhecemos os valores dos parâmetros. | ||
+ | |||
+ | |||
+ | |||
+ | ==== Modelo Poisson sem variáveis preditoras ==== | ||
+ | |||
+ | Este é o modelo mais simples, que é o ajuste de uma distribuição Poisson com um único valor para seu parâmetro: | ||
+ | |||
+ | $$Y \ \sim \ P(\lambda = \beta_0)$$ | ||
+ | |||
+ | Que lemos: | ||
+ | |||
+ | <WRAP center round box 60%> | ||
+ | "O número de frutos por plantas é uma variável Poisson com um valor constante do parâmetro $\lambda$. Ou seja, o número de frutos por plantas ocorre a uma taxa constante." | ||
+ | |||
+ | </ | ||
+ | |||
+ | ==Passos iniciais== | ||
+ | |||
+ | Iniciamos o R e carregamos os pacote //bbmle//, // | ||
+ | algoritmos de optimização para obter a máxima verosimilhança dos parâmetros. Se você ainda não tem algum dos pacotes instalado | ||
+ | use o comando '' | ||
+ | |||
+ | <code rsplus> | ||
+ | library(bbmle) | ||
+ | library(car) | ||
+ | library(sads) | ||
+ | </ | ||
+ | |||
+ | Fixamos o gerador pseudo-aleatório de dados para todos obtermos exatamente o mesmos resultados: | ||
+ | <code rsplus> | ||
+ | set.seed(1234) | ||
+ | </ | ||
+ | |||
+ | ==Começamos a simulação: | ||
+ | |||
+ | Vamos sortear 1000 valores de uma distribuição Poisson com parâmetro $\lambda=5$, | ||
+ | |||
+ | <code rsplus> | ||
+ | nplan< | ||
+ | lambda=5 | ||
+ | frutos< | ||
+ | </ | ||
+ | |||
+ | ==Análise exploratória== | ||
+ | Qual é a probabilidade teórica de encontrar uma planta sexualmente madura sem frutos? | ||
+ | |||
+ | <code rsplus> | ||
+ | dpois(0, | ||
+ | </ | ||
+ | |||
+ | Compare com a proporção de plantas sem frutos na amostra simulada: | ||
+ | <code rsplus> | ||
+ | sum(frutos==0)/ | ||
+ | </ | ||
+ | |||
+ | Para fazer esta avaliação para todos os valores, comparamos a distribuição de probabilidade teórica com as proporções | ||
+ | empíricas. Comece com um gráfico de barras das proporções: | ||
+ | |||
+ | <code rsplus> | ||
+ | mfrut< | ||
+ | fa< | ||
+ | prob.obs< | ||
+ | par(las=1) | ||
+ | plot(0: | ||
+ | | ||
+ | </ | ||
+ | |||
+ | E adicione os pontos com os valores teóricos esperados: | ||
+ | <code rsplus> | ||
+ | prob.tr< | ||
+ | points(0: | ||
+ | </ | ||
+ | |||
+ | ==Ajuste do modelo== | ||
+ | |||
+ | Definimos a função de máxima verossimilhança do parâmetro lambda da distribuição Poisson: | ||
+ | |||
+ | <code rsplus> | ||
+ | x< | ||
+ | poisNLL< | ||
+ | -sum(dpois(x, | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | Há um teorema que garante que essa função de verossimilhança é unimodal e tem um único mínimo. Por isso podemos buscar a estimativa de máxima verossimilhança de $\lambda$ simplesmente experimentando diversos valores até encontrar um mínimo. Para isso criamos uma sequência de valores na vizinhança da média amostral e aplicamos a cada um a função de log-verossimilhança: | ||
+ | |||
+ | <code rsplus> | ||
+ | xvec< | ||
+ | LLest< | ||
+ | </ | ||
+ | |||
+ | Em seguida buscamos o valor mínimo: | ||
+ | |||
+ | <code rsplus> | ||
+ | minLLest< | ||
+ | lambdaLL.fb< | ||
+ | </ | ||
+ | |||
+ | |||
+ | Vamos comparar as estimativas do lambda obtidas com os métodos de força bruta, numéricos e analíticos((já que a média amostral equivale | ||
+ | à solução analítica para o MLE de $\lambda$ no caso da distribuição Poisson)). | ||
+ | |||
+ | Faça a minimização numérica com a função '' | ||
+ | |||
+ | <code rsplus> | ||
+ | lambdaLL.nm< | ||
+ | </ | ||
+ | |||
+ | E agora compare os três valores: | ||
+ | |||
+ | <code rsplus> | ||
+ | lambdaLL.fb | ||
+ | lambdaLL.nm | ||
+ | mean(frutos) | ||
+ | </ | ||
+ | |||
+ | E vamos fazer a comparação gráfica, plotando a função de verosimilhança e os pontos obtidos: | ||
+ | |||
+ | <code rsplus> | ||
+ | mfrutos< | ||
+ | LLest2< | ||
+ | plot(xvec, | ||
+ | abline(v=mfrutos, | ||
+ | abline(v=coef(lambdaLL.nm), | ||
+ | abline(v=lambdaLL.fb, | ||
+ | </ | ||
+ | |||
+ | |||
+ | ==== Modelos Poisson com variáveis preditoras ==== | ||
+ | |||
+ | Vamos supor que a fecundidade das plantas poderia incrementar-se com um aumento da concentração de fósforo no solo. Simulamos esta situação fazendo da taxa de frutos por planta uma função de variáveis preditoras, como o fósforo: | ||
+ | |||
+ | $$E[Y] \ = \ \lambda \ = \ e^{\beta_0 + \beta_i X_i}$$ | ||
+ | |||
+ | O que é o mesmo que | ||
+ | |||
+ | $$\ln(\lambda) \ = \beta_0 + \beta_iX_i$$ | ||
+ | |||
+ | Ou seja, o logarítmo de $\lambda$ é uma função linear das variáveis preditoras $X_i$((no caso temos uma variável preditora, mas isso pode ser generalizado para quantas você quiser)). Essa é a **funcão de ligação logarítmica**. Sua vantagem é preservar a relação linear com as preditoras, e garantir valores positivos de $\lambda$, como deve ser na distribuição Poisson. Nosso modelo agora torna-se: | ||
+ | |||
+ | $$Y \ \sim \ \mathrm{Pois}(\lambda = e^{\beta_0 + \beta_i X_i})$$ | ||
+ | |||
+ | Que lemos: | ||
+ | |||
+ | <WRAP center round box 60%> | ||
+ | "O número de frutos por plantas é uma variável Poisson cujo logaritmo do parâmetro $\lambda$ é uma função linear das variáveis reditoras $X_i$" | ||
+ | |||
+ | </ | ||
+ | |||
+ | Então vamos simular a dependência de $\lambda$ ao fósforo! Primeiro definimos valores dos parâmetros: | ||
+ | |||
+ | <code rsplus> | ||
+ | set.seed(1234) | ||
+ | phos< | ||
+ | a= 1 | ||
+ | b= 0.3 | ||
+ | x<-phos | ||
+ | </ | ||
+ | |||
+ | E então os valores esperados de frutos em função do nível de fósforo, conforme a função de ligação: | ||
+ | |||
+ | <code rsplus> | ||
+ | ydet< | ||
+ | plot(x, | ||
+ | </ | ||
+ | |||
+ | Agora para simular um processo Poisson sorteamos amostras Poisson com parâmetro lambda igual a estes valores esperados: | ||
+ | |||
+ | <code rsplus> | ||
+ | fec< | ||
+ | </ | ||
+ | |||
+ | E plotamos nossos dados: | ||
+ | |||
+ | <code rsplus> | ||
+ | par(las=1) | ||
+ | plot(phos, fec, xlab=" | ||
+ | </ | ||
+ | Definimos a função de verosimilhança para este modelo: | ||
+ | <code rsplus> | ||
+ | poisglmNLL = function(a, | ||
+ | | ||
+ | -sum(dpois(fec, | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | Agora que simulamos um processo Poisson com valor esperado que é uma função do nível de fósforo, vamos ver o o ajuste de um modelo que descrevesse exatamente isso. | ||
+ | Para estimar a máxima verosimilhança temos que fornecer na função de otimização um valor inicial para os parâmetros a e b. | ||
+ | |||
+ | <code rsplus> | ||
+ | chute <- list(a=2.5, b= 0.33) | ||
+ | </ | ||
+ | |||
+ | <box red center 75% | Pergunta> | ||
+ | Definir bons pontos de partida (//starting values//) para o otimizador é crucial, especialmente para funções de verossimilhança mais complexas, com muitas preditoras. Aqui o caso é simples e pouco sensível aos valores iniciais. Por isso " | ||
+ | </ | ||
+ | |||
+ | E então otimizamos a função de verossimilhança, | ||
+ | <code rsplus> | ||
+ | mod.pois< | ||
+ | </ | ||
+ | Conferimos o resumo do modelo: | ||
+ | <code rsplus> | ||
+ | summary(mod.pois) | ||
+ | </ | ||
+ | |||
+ | E os perfis de verossimilhança das estimativas: | ||
+ | <code rsplus> | ||
+ | mod.pois.prof <- profile(mod.pois) | ||
+ | par(mfrow=c(1, | ||
+ | plotprofmle(mod.pois.prof) ## carregue o pacote sads para ter esta função | ||
+ | par(mfrow=c(1, | ||
+ | </ | ||
+ | |||
+ | Numa abordagem frequentista, | ||
+ | |||
+ | Aplicando a função '' | ||
+ | <code rsplus> | ||
+ | plot(mod.pois.prof) | ||
+ | </ | ||
+ | |||
+ | As linhas vermelhas neste gráfico marcam no eixo $x$ os quantis correspondentes a diferentes probabilidades acumuladas da normal. Estes quantis são usados como os limites dos intervalos de confiança para estas probabilidades. Compare os valores na figura para probabilidade de 95% com os obtidos com o comando: | ||
+ | |||
+ | <code rsplus> | ||
+ | confint(mod.pois) | ||
+ | </ | ||
+ | |||
+ | |||
+ | Por fim, plotamos as curvas dos valores esperados de frutos por planta com os parâmetros e suas estimativas: | ||
+ | <code rsplus> | ||
+ | par(las=1) | ||
+ | plot(phos, | ||
+ | a.est< | ||
+ | b.est< | ||
+ | curve(exp(a+b*x), | ||
+ | curve(exp(a.est +b.est*x), add=TRUE, col=" | ||
+ | legend(" | ||
+ | </ | ||
+ | |||
+ | O que aconteceria se usássemos outro modelo para descrever estes dados? | ||
+ | Neste caso sabemos qual é o modelo correto, mas vamos simular esta situação, imaginando que a pesquisadora está | ||
+ | experimentando diferentes modelos. Usaremos a função de verosimilhança de uma binomial negativa, que permite agregação. Em nosso novo modelo mantemos a função de ligação logaritimica para a média, e supomos que o parâmetro de dispersão da binomial negativa é contante. Nosso modelo fica assim então: | ||
+ | |||
+ | $$Y \ \sim \ NB(\mu = e^{\beta_0 + \beta_i X_i, \ k = \alpha_0})$$ | ||
+ | |||
+ | Que lemos: | ||
+ | |||
+ | <WRAP center round box 60%> | ||
+ | "O número de frutos por plantas é uma variável binomial negativa, cujo logaritmo do parâmetro $\mu$ é uma função linear das variáveis preditoras $X_i$, e o parâmetro $k$ é uma constante." | ||
+ | |||
+ | </ | ||
+ | |||
+ | |||
+ | |||
+ | Vamos calcular a máxima verosimilhança deste modelo com a binomial negativa e comparar os modelos com o critério de informação de Akaike (AIC). | ||
+ | |||
+ | <code rsplus> | ||
+ | negbinNLL< | ||
+ | ypred< | ||
+ | -sum(dnbinom(fec, | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | Tentamos | ||
+ | |||
+ | $$\sigma^2= \mu + \frac{\mu^2}{k}$$ | ||
+ | |||
+ | Então podemos estimar um valor aproximado de k com: | ||
+ | <code rsplus> | ||
+ | med< | ||
+ | vari< | ||
+ | k.init < | ||
+ | k.init | ||
+ | </ | ||
+ | |||
+ | E então usamos este valor como palpite inicial para o valor de $k$ na otimização: | ||
+ | |||
+ | <code rsplus> | ||
+ | mod.negbin< | ||
+ | </ | ||
+ | |||
+ | E agora conferimos os parâmetros estimados: | ||
+ | |||
+ | <code rsplus> | ||
+ | summary(mod.negbin) | ||
+ | </ | ||
+ | |||
+ | E podemos comparar os modelos com a função AICtab , que expressa o grau de plausibilidade relativa do modelo Poisson, comparado com a binomial negativa: | ||
+ | |||
+ | <code rsplus> | ||
+ | AICtab(mod.pois, | ||
+ | </ | ||
+ | |||
+ | O modelo com mais apoio dos dados, ou mais plausível, é o modelo com distribuição Poisson. Porém, a diferença nos valores do AIC é menor que 2, o que indica que o modelo com a Binomial Negativa tem plausibilidade equivalente, | ||
+ | |||
+ | |||
+ | ===== Modelos com distribuição binomial: Infestação por Fusarium sp. ===== | ||
+ | |||
+ | Agora pensemos que os frutos das mesmas plantas solanáceas são atacados pelo fungo //Fusarium sp.//, murchando-os. Pensemos que esse fungo habita no solo e portanto só ataca os frutos quando eles amadurecem e caem. | ||
+ | |||
+ | Vamos usar a distribuição binomial para descrever o número de frutos infestados, entre o total de frutos produzidos pelas planta. A probabilidade de infestação dos frutos pode ser constante ou depender de algum fator como por exemplo o grau de | ||
+ | umidade relativa do micro-habitat onde se encontra a planta. O número de " | ||
+ | |||
+ | $$Y \ \sim \ \mathrm{Bin}(p = f(\beta_0 + \beta_i X_i), \ N = n_i)$$ | ||
+ | |||
+ | Que lemos: | ||
+ | |||
+ | <WRAP center round box 60%> | ||
+ | "O número $Y$ de frutos infestados de cada planta é uma variável binomial cuja uma função do parâmetro $p$ é uma função linear das variáveis preditoras $X_i$, e o parâmetro $N$ corresponde ao total de frutos $n_i$ de cada planta." | ||
+ | </ | ||
+ | |||
+ | |||
+ | Nas seções seguintes explicamos qual será a função de ligação $f(\cdot)$ neste caso. | ||
+ | |||
+ | ==== Simulando os dados ==== | ||
+ | |||
+ | Já temos um vetor com número de frutos de cada planta em nossa amostra. Primeiro descartamos as plantas sem frutos: | ||
+ | <code rsplus> | ||
+ | fec1< | ||
+ | num.plant< | ||
+ | </ | ||
+ | |||
+ | E simulamos o número de frutos atacados por planta: | ||
+ | |||
+ | Agora vamos simular uma variável ambiental. Por exemplo, o grau de umidade do solo na vizinhança da planta, que varia entre 30 a 100%, com probabilidade uniforme. | ||
+ | |||
+ | <code rsplus> | ||
+ | set.seed(4444) | ||
+ | ur< | ||
+ | </ | ||
+ | |||
+ | E usamos a **função de ligação logística** para determinar e posteriormente simular o grau de infestação do fungo de acordo a umidade | ||
+ | relativa do ambiente. Esta função estabelece seguinte relação do parâmetro $p$ com as variáveis preditoras $X_i$ | ||
+ | |||
+ | $$p \ = \frac{e^{\beta_0+\beta_i X_i}}{1+e^{\beta_0+\beta_i X_i}}$$ | ||
+ | |||
+ | A logística restringe os resultados esperados ao intervalo entre 0 a 1, mesmo que a variável | ||
+ | preditora tenha valores muito grandes ou pequenos, por isso é adequada para descrever o parâmetro $p$ nos | ||
+ | modelos de distribuição binomial. Assim como a função de ligação log para processos Poisson, a logística " | ||
+ | |||
+ | $$\ln \frac{p}{1-p} \ = \beta_0+\beta_iX_i $$ | ||
+ | |||
+ | E novamente encontramos uma transformação do parâmetro -o logito $\ln(p/ | ||
+ | |||
+ | Vamos então usar tudo isso para construir a simulação de efeito das preditoras sobre a proporção de frutos murchos: | ||
+ | |||
+ | <code rsplus> | ||
+ | a<- -4 | ||
+ | b<- 7 | ||
+ | ydet< | ||
+ | plot(ur, | ||
+ | frut.mur< | ||
+ | </ | ||
+ | |||
+ | O número de frutos intactos é o complemento dos murchos. | ||
+ | |||
+ | <code rsplus> | ||
+ | frut.sau <- fec1-frut.mur | ||
+ | </ | ||
+ | |||
+ | Para uma avaliação visual, plotamos os fruto sãos e murchos por planta e arranjamos as plantas em ordem crescente exposição à umidade relativa: | ||
+ | |||
+ | <code rsplus> | ||
+ | datos< | ||
+ | datos.ur< | ||
+ | conjun< | ||
+ | conjun.m< | ||
+ | |||
+ | barplot(t(conjun.m), | ||
+ | xlab= " | ||
+ | legend(" | ||
+ | arrows(15.8, | ||
+ | text(60,64, " | ||
+ | </ | ||
+ | |||
+ | ==== Ajuste do modelo ==== | ||
+ | |||
+ | Para ajustar nosso modelo binomial definimos sua função de verossimilhança: | ||
+ | |||
+ | <code rsplus> | ||
+ | binomNLL< | ||
+ | prob.det=exp(a+b*ur)/ | ||
+ | -sum(dbinom(frut.mur, | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | E agora vamos encontrar o mínimo da função de log-verossimilhança negativa com otimização computacional com a função '' | ||
+ | |||
+ | Otimizamos: | ||
+ | <code rsplus> | ||
+ | mod.bin< | ||
+ | </ | ||
+ | |||
+ | <box red 75% |Pergunta> | ||
+ | Como no tutorial anterior, temos que definir valores dos parâmetros para o otimizador iniciar. O comando acima usou um "chute informado" | ||
+ | frutos murchos/ | ||
+ | </ | ||
+ | |||
+ | |||
+ | Alternativamente podemos usar a interface de fórmula da função '' | ||
+ | |||
+ | <code rsplus> | ||
+ | mod.bin2< | ||
+ | start = list(a= -3, b = 9)) | ||
+ | </ | ||
+ | |||
+ | Avaliamos os perfis de verossimilhança: | ||
+ | |||
+ | <code rsplus> | ||
+ | par(mfrow=c(1, | ||
+ | plotprofmle(profile(mod.bin)) ## carregue o pacote sads para ter esta função | ||
+ | par(mfrow=c(1, | ||
+ | </ | ||
+ | |||
+ | |||
+ | Finalmente comparamos a função logística simulada com a estimada. No gráfico, o tamanho do ponto é proporcional ao número de frutos que a planta tinha. | ||
+ | |||
+ | <code rsplus> | ||
+ | prop.mur< | ||
+ | par(las=1) | ||
+ | plot(ur, prop.mur, | ||
+ | a.esti< | ||
+ | b.esti< | ||
+ | curve(exp(a+b*x)/ | ||
+ | curve(exp(a.esti+b.esti*x)/ | ||
+ | legend(" | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== GLMs ===== | ||
+ | |||
+ | Para modelos Poisson e binomiais como os dos tutoriais acima há uma teoria específica e um método de ajuste mais eficiente. São os [[http:// | ||
+ | |||
+ | Neste tutorial vamos comparar os resultados | ||
+ | |||
+ | ==== glm Poisson ==== | ||
+ | |||
+ | Uma regressão de uma variável Poisson como a que fizemos equivale a um //glm// com distribuição Poisson e função de ligação log. | ||
+ | Compare os resultados do modelo Poisson que ajustamos com o '' | ||
+ | |||
+ | <code rsplus> | ||
+ | glm.pois <- glm(fec~phos, | ||
+ | summary(glm.pois) | ||
+ | summary(mod.pois) | ||
+ | AIC(mod.pois) | ||
+ | AIC(glm.pois) | ||
+ | </ | ||
+ | |||
+ | Cada vez que fazemos um //glm// com | ||
+ | distribuição Poisson e função de ligação log, compramos a premissa de uma relação exponencial entre a variável preditora e o valor esperado da variável dependente. Isso é o mesmo que supor uma relação linear entre a variável preditora e o logaritmo do valor esperado da dependente. | ||
+ | |||
+ | ====glm Binomial==== | ||
+ | Uma regressão de uma variável binomial como a que fizemos equivale a um //glm// com distribuição binomial e função de ligação logística. | ||
+ | Compare os resultados do modelo binomial que ajustamos com o '' | ||
+ | |||
+ | <code rsplus> | ||
+ | glm.bin <- glm(cbind(frut.mur, | ||
+ | | ||
+ | summary(mod.bin) | ||
+ | summary(glm.bin) | ||
+ | </ | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | \\ | ||
+ | ------------------ | ||
+ | \\ | ||
+ | |||
+ | ====== Questões para discussão ====== | ||
+ | |||
+ | ===== Predador com saciação ===== | ||
+ | |||
+ | Em um experimento, | ||
+ | |||
+ | ===DICAS: | ||
+ | - Comece inspecionando gráficos do número de (a) girinos predados pelo número inicial e (b) da proporção de predados em relação ao número inicial. | ||
+ | - Quando está abaixo da saciação o predador não ncessariamente captura 100% das preasas disponíveis. Pode ser que ele capture uma proporção fixa das presas. A função de ligação logística pode ser generalizada para qualquer assíntota $M$: | ||
+ | |||
+ | $$p \ = \ \frac{M e^{a + bX}}{1+ e^{a + bX}}$$ | ||
+ | |||
+ | ===Dados=== | ||
+ | * {{: | ||
+ | |||
+ | |||
+ | |||
+ | ===== Número de parasitas por hospedeiro ===== | ||
+ | |||
+ | Tomou-se uma amostra de 120 peixes, dos quais contaram-se todos os ectoparasitas. De cada peixe tomou-se o comprimento e registrou-se o sexo. Use as funções glm e glm.nb para investigar a relação entre número de parasitas e atributos dos peixes. | ||
+ | |||
+ | ===DICA: | ||
+ | Comece inspecionando os gráficos das relações entre a variável resposta e cada uma das preditoras. | ||
+ | |||
+ | ===Dados=== | ||
+ | * {{: | ||
+ | |||
+ | ===== Modelando média e dispersão ===== | ||
+ | |||
+ | Use o conjunto de dados a seguir para construir e comparar modelos de regressão Poisson e binomial negativa. Avalie todas as hipóteses de efeito linear da variável preditora com função de ligação log. | ||
+ | |||
+ | ===DICA: | ||
+ | Comece enumerando os modelos possíveis. Para a regressão binomial negativa o efeito pode ser sobre a média e/ou o parâmetro de dispersão. Para cada distribuição há os modelos de ausência de efeitos. | ||
+ | |||
+ | ===Dados=== | ||
+ | {{: | ||
+ | |||
+ | ====== Exercícios ====== | ||
+ | |||
+ | Faça os exercícios 205.1 e 205.2 no sistema [[http:// | ||
+ | |||
+ | ====== Recursos para Estudo ====== | ||
+ | |||
+ | ===== Leituras ===== | ||
+ | === Principais === | ||
+ | * Bolker, B.M. 2008 Ecological Models and Data in R Princeton: Princeton University Press: | ||
+ | * Cap.6 - Likelihood and all that, seção 6.3.1 | ||
+ | * Cap.9 - Standard Statistics Revisited, seção 9.4 | ||
+ | |||
+ | === Complementares === | ||
+ | * Crawley, M.J. 2007. The R Book. (caps.13, | ||
+ | |||
+ | ==== Para saber mais sobre glms==== | ||
+ | |||
+ | * Dobson, A.J. 1990. An Introduction to Generalized Linear Models. London: Chapman and Hall. | ||
+ | * McCullagh P. & Nelder, J.A. 1989. Generalized Linear Models. London: Chapman and Hall. | ||
+ | * [[http:// | ||
+ | * Rodríguez, G. 2007. [[http:// | ||
+ | |||
+ | |||
+ | === Análises de resíduos em glms === | ||
+ | |||
+ | Os resíduos usados em regressão Gaussiana não são os melhores para diagnósticos de glms. Há vários outros tipos de cálculos de resíduos propostos. Um material básico para se aprofundar: | ||
+ | |||
+ | * As revisões clássicas sobre diagnóstico de GLMs são o capítulo 12 do livro de [[http:// | ||
+ | |||
+ | * [[https:// | ||
+ | | ||
+ | * [[https:// | ||
+ | |||
+ | ===Pseudo - R2=== | ||
+ | |||
+ | Quantidades análogas ao $R^2$ dos modelos lineares Gaussianos, propostas para glms e modelos com efeitos mistos. Têm o prefixo " | ||
+ | |||
+ | Ainda assim, estes pseudo-$R^2$, | ||
+ | |||
+ | * Ives, A.R. (2019). R2s for Correlated Data: Phylogenetic Models, LMMs, and GLMMs. [[https:// | ||
+ | * Nakagawa, S. & Schielzeth, H. (2013).A general and simple method for obtaining R2 from generalized linear mixed-effects models. [[https:// | ||
+ | * Nakagawa, S., Johnson, P.C.D. & Schielzeth, H. (2017).The coefficient of determination R2 and intra-class correlation coefficient from generalized linear mixed-effects models revisited and expanded. [[https:// | ||
+ | |||
+ | ==Pacotes no R == | ||
+ | |||
+ | * Stoffel, M.A., Nakagawa, S. & Schielzeth, H. (2017). rptR: Repeatability estimation and variance decomposition by generalized linear mixed-effects models. [[https:// | ||
+ | * Ives, A. & Li, D. (2018). rr2: An R package to calculate $R^2$s for regression models. [[https:// | ||
+ | |||
+ | ==== Generalized Additive Models (GAMs) ==== | ||
+ | |||
+ | GAMs são uma generalização de glms para incluir preditores não lineares. | ||
+ | |||
+ | * Hastie, T.J. and Tibshirani, R.J., 1990. Generalized additive models (Vol. 43). CRC press. //A referẽncia clássica// | ||
+ | * Capítulo 18 de Crawley, M.J. 2013. The R Book. Wiley & Sons. | ||
+ | * [[http:// | ||
+ | |||