historico:2014:ensaios:actis
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
historico:2014:ensaios:actis [2014/10/23 23:26] – [AIC] actispamela | historico:2014:ensaios:actis [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====Em busca da distribuição dos dados, método de máxima verossimilhança e o método de Akaike==== | ||
+ | ====Pamela Soledad Actis==== | ||
+ | *Universidad Estadual de Santa Cruz | ||
+ | *actispamela@gmail.com | ||
+ | |||
+ | ====Sincronia da respiração em cetáceos==== | ||
+ | Dentre diversos padrões comportamentais que os cetáceos apresentam, o sincronismo dentro dos grupos possui diversas particularidades. O termo sincrônico tipicamente inclui animais em proximidade uns de outros, realizando o mesmo comportamento no mesmo tempo (FELLNER et al., 2006). | ||
+ | No meu trabalho de maestria, pretendo estudar a sincronia da respiração dentro de duplas de Sotalia guianensis (Boto-cinza). | ||
+ | Neste trabalho a variável dependente é o tempo transcorrido em décimas de segundos desde que o primeiro golfinho da dupla respira, até a respiração do segundo animal (intervalo.resp). | ||
+ | Uns dos primeiros passos depois da coleta de dados, é encontrar a distribuição da variável dependente, para depois continuar com a seleção de variáveis que podem influir na sincronia. | ||
+ | ====Verossimilhança==== | ||
+ | Uma vez que se têm uma observação, | ||
+ | A lei da verossimilhança afirma que a observação X=x é uma evidencia que favorece a hipótese A sobre a hipótese B se e somente se PA(x) > PB(x). Ainda, esta lei postula que a razão dessas probabilidades (razão de verossimilhança) é o valor de evidência em favor de uma das hipóteses. Por tanto a força de evidência indica quantas vezes a Hipótese A é melhor que a hipótese B. | ||
+ | A função de verossimilhança o produtório das probabilidades atribuídas a cada observação, | ||
+ | |||
+ | ====AIC==== | ||
+ | Para a seleção dos modelos é utilizado o Critério de Seleção de Akaike (AIC). O AIC é um estimador da distância de Kullback-Leiber, | ||
+ | |||
+ | AIC = - 2 x ln[L(modelo)] + 2p | ||
+ | |||
+ | No qual L(modelo) é a função de verossimilhança do modelo e p é o número de parâmetros do modelo. Esse critério é mais seletivo que a log-verossimilhança negativa, pois o AIC penaliza ela pelo número de parâmetros. Essa diferença entre modelos é de fácil interpretação e permite uma rápida comparação e classificação de modelos candidatos. O modelo que obtiver o menor valor do AIC é o que estará mais próximo do modelo real. A seleção de modelo pode ser feita levando em conta a diferença entre AICs dos modelos, sendo que quando a diferença entre os AICs for menor ou igual a 2, ambos são igualmente plausíveis. O peso de evidência, ou seja, quanto um modelo é mais plausível que outro, também pode ser utilizado durante a seleção de modelos (Burnham & Anderson, 2002). | ||
+ | ====Distribuições ==== | ||
+ | A distribuição exponencial é a análoga contínua da distribuição geométrica. Ela pode ser usada para descrever o tempo de espera até a primeira ocorrência de um evento. A exponencial tem um parâmetro, lambda, que representa a taxa de ocorrência | ||
+ | |||
+ | |||
+ | |||
+ | A distribuição Weibull também é usada para descrever tempo contínuo de espera até que um evento aconteça. O seu parâmetro de forma define o tipo de memória que ela pode descrever. Se o parâmetro é igual a um, a Weibull reduz-se a uma exponencial e portanto não tem memória, quando o parâmetro de forma é maior que um cria-se um efeito de memória que pode ser interpretada como envelhecimento, | ||
+ | A variável Gama foi criada como uma extensão da exponencial, | ||
+ | |||
+ | ====Script==== | ||
+ | dados< | ||
+ | str(dados) | ||
+ | |||
+ | ir = dados$intervalo.resp | ||
+ | hist(ir, | ||
+ | x = ir | ||
+ | |||
+ | #weibull | ||
+ | nllweibull = function(escala, | ||
+ | -sum(dweibull(x, | ||
+ | |||
+ | parag.wei = mle2(nllweibull, | ||
+ | coef(parag.wei) | ||
+ | summary(parag.wei) | ||
+ | nllweibull.V = Vectorize( nllweibull, c(" | ||
+ | |||
+ | parag.wei.prof = profile(parag.wei) | ||
+ | par(mfrow=c(1, | ||
+ | plotprofmle(parag.wei.prof) | ||
+ | par(mfrow=c(1, | ||
+ | |||
+ | # | ||
+ | args(dexp) | ||
+ | nllexp = function(rate, | ||
+ | -sum(dexp(x, | ||
+ | media = mean(x) | ||
+ | parag.exp = mle2(nllexp, | ||
+ | coef(parag.exp) | ||
+ | summary(parag.exp) | ||
+ | nllexp.V = Vectorize( nllexp, c(" | ||
+ | |||
+ | parag.exp.prof = profile(parag.exp) | ||
+ | plotprofmle(parag.exp.prof) | ||
+ | par(mfrow=c(1, | ||
+ | |||
+ | #gamma | ||
+ | args(dgamma) | ||
+ | nllgam = function(shape, | ||
+ | -sum(dgamma(x, | ||
+ | media = mean(x) | ||
+ | var=sd(x) | ||
+ | sh = ((mean(x))^2)/ | ||
+ | parag.gam = mle2(nllgam, | ||
+ | coef(parag.gam) | ||
+ | summary(parag.gam) | ||
+ | nllgam.V = Vectorize( nllgam, c(" | ||
+ | |||
+ | parag.wei.prof = profile(parag.wei) | ||
+ | par(mfrow=c(1, | ||
+ | plotprofmle(parag.wei.prof) | ||
+ | par(mfrow=c(1, | ||
+ | |||
+ | # AICc | ||
+ | AICctab(parag.wei, | ||
+ | ====Resultado==== | ||
+ | > summary(parag.wei) | ||
+ | Maximum likelihood estimation | ||
+ | |||
+ | Call: | ||
+ | mle2(minuslogl = nllweibull, start = list(escala = 0.5, forma = 1)) | ||
+ | |||
+ | Coefficients: | ||
+ | | ||
+ | escala 4.261629 | ||
+ | forma 0.546116 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | -2 log L: 1750.774 | ||
+ | |||
+ | > summary(parag.exp) | ||
+ | Maximum likelihood estimation | ||
+ | |||
+ | Call: | ||
+ | mle2(minuslogl = nllexp, start = list(rate = (1/media))) | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error z value | ||
+ | rate 0.1668362 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | -2 log L: 1959.101 | ||
+ | > summary(parag.gam) | ||
+ | Maximum likelihood estimation | ||
+ | |||
+ | Call: | ||
+ | mle2(minuslogl = nllgam, start = list(shape = sh, scale = var/media)) | ||
+ | |||
+ | Coefficients: | ||
+ | | ||
+ | shape 0.415023 | ||
+ | scale 14.442303 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | -2 log L: 1690.219 | ||
+ | |||
+ | > AICctab(parag.wei, | ||
+ | dAICc df weight | ||
+ | parag.gam | ||
+ | parag.wei | ||
+ | parag.exp 266.9 1 <0.001 | ||
+ | |||
+ | Para os dados aqui presentes e entre as Distribuições aqui propostas, a distribuição gamma parece ser a que melhor ajusta os dados do intervalo de tempo entre respirações de duplas de Sotalia guianensis. Já que ela tem o menor valor de log verossimilhança negativa, o menor delta AICc e peso um. | ||
+ | ====Bibliografia==== | ||
+ | * Item de lista não ordenadaBatista, | ||
+ | * Item de lista não ordenadaBolker, | ||
+ | * Item de lista não ordenadaBurnham, | ||
+ | * Item de lista não ordenadaFellner, | ||
+ | ====Citação==== | ||
+ | |||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | |||
+ | Actis,P.S. 2014. Em busca da distribuição dos dados, por médio do método de máxima verossimilhança e o método de Akaike. In: Prado , P.I & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// | ||