historico:2014:ensaios:barbosa
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
historico:2014:ensaios:barbosa [2014/10/31 20:53] – romina.b | historico:2014:ensaios:barbosa [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ======A inferência por Verossimilhança como ferramenta para a modelagem da distribuição de espécies no programa Maxent====== | ||
+ | |||
+ | ===Romina Vanessa Barbosa=== | ||
+ | |||
+ | *Pós-Graduação em Oceanografia Biológica, Laboratório de Dinâmica Bêntica, Instituto Oceanográfico da Universidade de São Paulo. | ||
+ | |||
+ | *romina.b@usp.br | ||
+ | |||
+ | Nos últimos anos os Modelos de Distribuição de Espécies (SDMs, siglas em inglês), também chamados de modelos de adequabilidade de habitat, são utilizados para análise de dados de ocorrência de espécies, tanto de amostragens planejadas quanto de bancos de dados obtidos de museus ou repositórios de informação disponíveis (ex. Global Biodiversity Information Facility (www.gbif.org)). | ||
+ | |||
+ | Os SDMs são utilizados para extrair informações sobre os padrões ou processos subjacentes. Estes modelos são fundamentalmente importantes na área da ecologia e conservação, | ||
+ | |||
+ | Alguns programas ou pacotes do “R programing” implementam diferentes algoritmos como por exemplo o método MaxEnt (Maxima Entropia). Neste ensaio focarei no processamento de dados realizado pelo programa Maxent | ||
+ | |||
+ | O processo de modelagem consta de diferentes partes; formulação, | ||
+ | O método MaxEnt usa a covariância entre os dados de ocorrência e os dados das variáveis ambientas (background sample) para estimar a razão f1(z)/f(z). Ou seja, faz uma estimativa da distância ou diferença entre f1(z) (o que é consistente com os dados de ocorrência), | ||
+ | |||
+ | Considerando P(x) e Q(x) duas distribuições de probabilidade distintas, a Distância de Kullback-Leibler (DKL) entre ambas é dada por: | ||
+ | DKL(P||Q) = P(x ) log (P(x )/Q(x )) | ||
+ | |||
+ | O modelo que tiver menor divergência terá menor perda de informação (Burnham and Anderson, 2001), ou seja, que representará melhor o processo que gerou os dados. A distribuição do maxent que minimiza a ER é a mesma que a distribuição de Gibbs que máximiza a log-verossimilhança (Pietra et al., 1997), a qual pertence a família Exponencial. | ||
+ | |||
+ | Distribuição de Gibbs: | ||
+ | |||
+ | f1(z) = f(z) . e η(z) | ||
+ | |||
+ | onde η(z)= α + β.h(z), | ||
+ | e α é uma constante de normalização que garante que f(z) se integre a 1. | ||
+ | |||
+ | Portanto, o objetivo do Maxent é modelar e η(z) , o que garante a razão f1(z)/f(z). Esse e um modelo log-linear, similar a os modelos Generalizados Lineares (MLGs). Para resolver o problema Maxent precisa achar os coeficientes β (betas) do modelo, sendo estes os parâmetros que medem ou pesam a contribuição de cada característica ou variável ambiental para a presença da espécie. Maxent lida com essa questão definindo um limite de erro padrão ou desvio máximo permitido (Phillips & Dudik, 2008), sendo: | ||
+ | |||
+ | λj= λ √(s2[hj]/ | ||
+ | |||
+ | λj é o parâmetro de regularização para a variável hj. | ||
+ | |||
+ | Esse parâmetro corresponde à largura do intervalo de confiança e, portanto, ele toma a forma do erro padrão (expresso na raiz quadrada) multiplicado pelo parâmetro λ de acordo com o nível de confiança desejado. Assim, o limite do erro padrão λj é calculado para cada variável, sendo s2[hj] a variância da variável ambiental hj para os sítios de presencia m. | ||
+ | |||
+ | Em geral não conhecemos o valor dos parâmetros e portanto eles são estimados a partir das amostras. O programa ajusta o modelo fazendo a estimativa dos parâmetros que maximiza a função de log-verossimilhança, | ||
+ | |||
+ | A função de log-verossimilhança consiste na aplicação de um logaritmo na função de verossimilhança. Esta função se baseia no Principio de Verossimilhança, | ||
+ | |||
+ | Na abordagem de Log-Verossimilhança o espaço amostral é irrelevante (Batista, 2009). Assim, essa abordagem e mais adequada para analises de distribuição de espécies com dados apenas de presença já que a log-verossimilhança faz o calculo nesses sítios (Elith et al., 2011), sem considerar o espaço amostral. Além disso, com esta abordagem é possível comparar quantas hipóteses se desejar. | ||
+ | |||
+ | Há várias hipóteses sobre as relações entre as variáveis ambientais e seus efeitos sobre a presencia da espécie, ou seja que existem vários modelos possíveis para os quais se calcula a máxima log-verossimilhança. Assim, o Maxent gera modelos resultantes de todas as possíveis combinações de pares de co-variáveis (linear, produtos, quadrática, | ||
+ | |||
+ | Um modelo complexo pode ter um valor grande de log-verossimilhança. Entretanto, um modelo complexo tende a ser específico, | ||
+ | |||
+ | Os modelos gerados no Maxent tem uma interpretação probabilística natural, dando uma gradação suave de condições mais adequadas para condições menos adequadas a qual pode ser representada por pixels num mapa da área estudada. Contudo, logo após escolher um modelo precisamos fazer uma boa analise baseada nos dados e na informação biológica/ | ||
+ | |||
+ | =====Referências Bibliográficas: | ||
+ | |||
+ | Araújo, M.B., Guisan, A., 2006. Five (or so) challenges for species distribution modelling. J. Biogeogr. 33, 1677–1688. doi: | ||
+ | |||
+ | Austin, M.., 2002. Spatial prediction of species distribution: | ||
+ | |||
+ | Breiman, L., 2001. Statistical Modeling : | ||
+ | |||
+ | Burnham, K.P., Anderson, D.R., 2001. Model Slection and Multimodel Inference, Second Edi. ed. doi: | ||
+ | |||
+ | Elith, J., Phillips, S.J., Hastie, T., Dudík, M., Chee, Y.E., Yates, C.J., 2011. A statistical explanation of MaxEnt for ecologists. Divers. Distrib. 17, 43–57. doi: | ||
+ | |||
+ | Graham, C.H., Ferrier, S., Huettman, F., Moritz, C., Peterson, a T., 2004. New developments in museum-based informatics and applications in biodiversity analysis. Trends Ecol. Evol. 19, 497–503. doi: | ||
+ | |||
+ | Phillips, S.J., Anderson, R.P., Schapire, R.E., 2006. Maximum entropy modeling of species geographic distributions. Ecol. Modell. 190, 231–259. doi: | ||
+ | |||
+ | Phillips, S.J., Avenue, P., Park, F., 2004. A Maximum Entropy Approach to Species Distribution Modeling 655–662. | ||
+ | |||
+ | Prado, P.I. & Batista, J.L.F. , 2014. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// | ||
+ | |||
+ | =====Citação===== | ||
+ | |||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | Barbosa, R.V., 2014. A inferência por Verossimilhança como ferramenta para Modelagem da distribuição de espécies no programa Maxent. In: Prado, P.I. & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// | ||