historico:2014:ensaios:boesing
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
historico:2014:ensaios:boesing [2014/10/24 18:25] – lari.boesing | historico:2014:ensaios:boesing [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ===== A Abordagem de Verossimilhança e a avaliação de processos ecológicos no contexto da Ecologia da Paisagem===== | ||
+ | ===Andrea Larissa Boesing=== | ||
+ | |||
+ | * Laboratório de Ecologia da Paisagem e Conservação | ||
+ | * Universidade de São Paulo | ||
+ | * lari.boesing@gmail.com | ||
+ | |||
+ | < | ||
+ | “Quem mensura o paraíso, a terra, o mar e o céu, | ||
+ | De modo a buscar folclore ou excitação, | ||
+ | Deixe-o avisado de um idiota ser.” | ||
+ | Sebastian Brant, Ship of Fools, 1494. | ||
+ | </ | ||
+ | |||
+ | |||
+ | Não podemos investigar fenômenos cientificamente, | ||
+ | |||
+ | Deste modo, a ciência é um processo de aprendizado da natureza em que ideias competem sobre como o mundo funciona são elaboradas e contrastadas com observações (Hilborn & Mangel 1997), e estas ideias são usualmente expressadas primeiramente como hipóteses e em segundo momento como equações matemáticas ou modelos (Johnson & Omland | ||
+ | |||
+ | Se temos dados que podem ser explicados por mais de uma hipótese, e cada hipótese é um modelo que atribui alguma probabilidade aos dados, podemos expressar essa probabilidade através da Função de Verossimilhança (Johnson & Omland 2004). Em outras palavras, a ideia por trás da função de verossimilhança é que encontremos o melhor modelo probabilístico que se ajuste aos nossos dados. Diferente da abordagem estatística clássica/ | ||
+ | |||
+ | Na prática, a inferência por Verossimilhança se dá basicamente em três passos: i) a escolha do modelo; ii) o ajuste dos dados ao modelo; iii) a seleção do melhor modelo (Prado & Batista 2014). Para deixar mais claro como a inferência por verossimilhança funciona, vou utilizar um conjunto de dados que faz parte das primeiras amostragens do meu projeto de tese. | ||
+ | |||
+ | =====Contextualização===== | ||
+ | Parte da minha tese tem o objetivo de entender como que estão estruturadas as comunidades de aves do ponto de vista funcional (DFu) e filogenético (DFi) em paisagens com diferentes gradientes de cobertura florestal e diferentes contextos de matriz agrícola. Os dados utilizados aqui correspondem a amostragens por ponto de escuta em 13 paisagens que detém um gradiente de cobertura florestal que varia entre ~5 e 60% emersas em uma matriz predominante de pastagem. Os pontos foram estabelecidos aos pares (quatro pares/ | ||
+ | |||
+ | |||
+ | **1)Escolhendo o Modelo:** | ||
+ | A primeira etapa é investigar a qual tipo de distribuição de probabilidade nossos dados se enquadram: existem várias possibilidades (e.g. Gaussiana, Poisson, Binomial) e para cada tipo de dado coletado, existe uma função matemática da distribuição bem descrita e com parâmetros bem conhecidos (ver Capítulo 4 Bolker 2008- ‘Bestiário das Distribuições’). Quando trabalhamos com contagens (e.g. riqueza e abundância de espécies em um dado local), em geral os dados se enquadram em uma distribuição de Poisson, que é constituída basicamente pelo parâmetro λ, que de uma maneira mais simples, é o nosso valor esperado (ou também, a média amostral dos dados). | ||
+ | |||
+ | X ~ ƒ (X| λ) | ||
+ | |||
+ | No caso dos dados apresentados no histograma abaixo (Figura 01), o λ têm valor 10.5 (que é o número médio de espécies de aves por ponto de escuta – aqui o tipo de ambiente – floresta ou pastagem – foram contabilizados conjuntamente). Neste caso, lambda é o parâmetro da distribuição. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Figura 01: Distribuição da riqueza de espécies de aves por ponto de escuta no corredor Cantareira-Mantiqueira no estado de São Paulo (dados preliminares, | ||
+ | |||
+ | |||
+ | Sabendo a que distribuição de probabilidade seus dados pertencem, uma tarefa crucial é selecionar as variáveis de interesse com as quais serão construídos os modelos. Embora pareça uma tarefa fácil, ela não é trivial. A inferência por verossimilhança trabalha com um espaço amostral criado pelo pesquisador, | ||
+ | |||
+ | Usando os dados de riqueza de aves por ponto de escuta nas diferentes paisagens (Figura 02), vamos construir cinco hipóteses (ou cinco modelos) concorrentes, | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Figura 02: Número de espécies de aves por Ponto de Escuta no corredor Cantareira- Mantiqueira no estado de São Paulo (dados preliminares, | ||
+ | |||
+ | |||
+ | **2) Ajuste dos dados ao modelo: | ||
+ | A segunda etapa consiste na adequação dos parâmetros dos modelos para que os dados tenham o melhor ajuste possível nos modelos. Esse ajuste pode ser feito pela análise de máxima verossimilhança, | ||
+ | |||
+ | ƒx (θ|X=x) | ||
+ | |||
+ | Esta função indica a verossimilhança de uma dada hipótese, dado que se obteve uma observação X = x. (Batista 2009). Entretanto, quando fazemos um estudo tomamos uma série de amostras, as quais em geral, são constituídas por observações independentes. Em outras palavras, a probabilidade de se obter a amostra, dado a hipótese A, é igual ao produto das probabilidades das observações individuais, | ||
+ | |||
+ | < | ||
+ | - Σln. ƒ (xi|θ) | ||
+ | </ | ||
+ | |||
+ | Esta função de log-verossimilhança negativa precisa ser minimizada para encontrar a Máxima Verossimilhança, | ||
+ | |||
+ | |||
+ | **3) Seleção e Comparação de Modelos:** | ||
+ | Com a solução de máxima verossimilhança de cada modelo, a tarefa agora é selecionar o melhor modelo ou o melhor conjunto de modelos dentre o conjunto de modelos candidatos. Akaike (1973) propôs o uso da distancia de Kullback-Leibler como base fundamental para a seleção de modelos. Entretanto, a distância K-L não pode ser computada sem o conhecimento da realidade completa e dos parâmetros de cada modelo candidato (Burnham & Anderson 2002), e Akaike encontrou uma maneira bastante rigorosa de estimar esta distancia K-L baseado na função de log-verossimilhança no seu ponto máximo (Burnham & Anderson 2002), que ficou conhecida como // | ||
+ | |||
+ | AIC = −2 ln [L{µ}] + 2p = 2L{µ} + 2p | ||
+ | |||
+ | O melhor modelo será àquele que apresentar o menor valor da AIC, e comumente é usado o valor de dois, valor abaixo do qual os melhores modelos se encontram. Se mais de um modelo ficar abaixo deste valor, ambos são considerados igualmente plausíveis (Batista 2009). | ||
+ | |||
+ | |||
+ | Tabela 01: Modelos concorrentes e valores de AIC para cada modelo se utilizando os dados de riqueza de aves por ponto de escuta amostradas no Sistema Cantareira-Mantiqueira do estado de São Paulo (dados preliminares, | ||
+ | |||
+ | |||
+ | ^ Modelo | ||
+ | | Fc + Hab (Int) | 1199.2 | ||
+ | | Fc + Hab (Adi) | 1202.8 | ||
+ | | Fc | 1211.4 | ||
+ | | Hab | 1391.8 | ||
+ | | Nulo | 1400.4 | ||
+ | |||
+ | |||
+ | Pelo método de seleção de AIC, o modelo que melhor explica os dados é o modelo interativo entre cobertura florestal e habitat (Hip.3; Tabela 01). Isso quer dizer, que não só a cobertura florestal é importante na determinação da riqueza por ponto de amostragem, como também o habitat em que ele está inserido; não só isso, mas que as comunidades de aves da matriz e de ambiente florestal são afetadas diferentemente, | ||
+ | |||
+ | |||
+ | {{ : | ||
+ | |||
+ | Figura 03: Relação entre a riqueza de espécies de aves por Ponto de Amostragem e a cobertura florestal da paisagem. | ||
+ | |||
+ | |||
+ | {{ : | ||
+ | |||
+ | Figura 04: Riqueza de espécies de aves por Ponto de Amostragem estimada seguindo o aumento da cobertura florestal da paisagem. | ||
+ | |||
+ | |||
+ | Este é apenas um exemplo de como a abordagem por verossimilhança pode ser bastante útil ao se avaliar um dado conjunto de dados ou um processo no contexto a ecologia da paisagem. Uma discussão atual entre ecólogos da paisagem gira em torno de separar a influência relativa da perda de habitat versus fragmentação (Metzger & Villard 2014), onde embora estes dois fenômenos ocorram simultaneamente, | ||
+ | |||
+ | Em nosso exemplo, existem //n// outras variáveis que podem estar influenciando a riqueza de espécies de aves por ponto de escuta no contexto da paisagem, como por exemplo, o tamanho do fragmento florestal ou a extensão da matriz, presença/ | ||
+ | |||
+ | Deste modo, embora haja todo um instrumental tentador que podem ser utilizados para investigarmos um caso específico no contexto da Ecologia da Paisagem e a abordagem de verossimilhança seja muito adequada para este fim, bastante cautela deve ser tomada ao selecionar as variáveis que estarão compondo seus modelos. | ||
+ | |||
+ | |||
+ | |||
+ | =====Referências bibliográficas===== | ||
+ | |||
+ | Banks-Leite, | ||
+ | |||
+ | Batista, J.L.F. 2009. Verossimilhança e Máxima Verossimilhança. Centro de Métodos Quantitativos, | ||
+ | |||
+ | Bolker, B. 2008. Ecological Models and data in R. Princeton University Press, Princeton and Oxford. | ||
+ | |||
+ | Burnham, K.P. & Anderson, D.R. 2002. Model selection and multimodel inference. A practical information - theoretic approach. Springer, New York. | ||
+ | |||
+ | Gotelli, N.J., Ellison, A.M. 2011. Principios de Estatística em Ecologia. Artmed, Porto Alegre. | ||
+ | |||
+ | Hilborn, R. and Mangel, M. (1997) The Ecological Detective: Confronting Models With Data, Princeton University Press. | ||
+ | |||
+ | Johnson, J. B. & Omland, K. S. 2004. Model selection in ecology and evolution. Trends in Ecology and Evolution, 19:101-10. | ||
+ | |||
+ | Martensen, A. C., Ribeiro, M. C., Banks-Leite, | ||
+ | |||
+ | Prado, P.I., Batista, J.L.F. 2014. Modelagem estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// | ||
+ | |||
+ | Villard, M., Metzger, J.P. 2014. Beyond the fragmentation debate: a conceptual model | ||
+ | to predict when habitat configuration really matters. Journal of Applied Ecology 51:309-318. | ||
+ | |||
+ | =====Citação===== | ||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | |||
+ | Boesing, A.L. 2014. A abordagem de verossimilhança e a avaliação de processos ecológicos no contexto da Ecologia da Paisagem. In: Prado , P.I & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// | ||