historico:2014:ensaios:costa
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anterior | |||
historico:2014:ensaios:costa [2014/10/25 12:17] – karine.costa | historico:2014:ensaios:costa [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====SELEÇÃO DE MODELOS, SELEÇÃO DE VARIÁVEIS E INTERAÇÕES==== | ||
+ | ===Karine Costa=== | ||
+ | *Pós-Graduação em Ecologia - USP | ||
+ | |||
+ | *karine.costa97@gmail.com | ||
+ | |||
+ | Durante a disciplina me deparei com dois conceitos claramente distintos, inicialmente, | ||
+ | |||
+ | ===Seleção de modelos=== | ||
+ | |||
+ | Modelos são expressões matemáticas de hipóteses sobre a relação entre uma ou mais variáveis preditoras e a variável resposta (Johnson & Omland, 2004). A seleção de modelos pelo método de máxima verossimilhança busca encontrar o modelo mais plausível dado um conjunto de dados conhecidos. Dessa forma, é possível formular um modelo para cada hipótese e escolher o modelo que é melhor suportado pelos dados. Um dos critérios de seleção de modelos é o Critério de Informação de Akaike – AIC. O AIC é uma medida de distância relativa do modelo proposto ao mecanismo real que gerou os dados observados (Burnhan & Anderson, 2002). O AIC penaliza o modelo conforme o número de parâmetros presentes no modelo. De acordo com esse critério, todos os modelos com delta AIC inferior ou igual a 2, são igualmente plausíveis. Assim, o AIC pode ser visto como uma medida de ruindade do ajuste, pois quanto maior o valor do AIC, menor a probabilidade dos dados ocorrerem segundo aquele modelo (ou menor a plausibilidade do modelo, dado os dados) (Gotelli & Ellison, 2011). | ||
+ | |||
+ | ===Seleção de variáveis: outra aplicação do critério de informação de Akaike=== | ||
+ | |||
+ | Em estudos ecológicos a seleção de variáveis é aplicada quando há múltiplas variáveis preditoras e o objetivo é saber quais dessas variáveis é importante na determinação da variável resposta, por exemplo, quando múltiplos fatores ambientas (temperatura, | ||
+ | |||
+ | Em uma abordagem frequentista, | ||
+ | |||
+ | Uma alternativa mais adequada para avaliar a importância das variáveis é calcular a importância relativa de cada variável, baseada nos //pesos de Akaike// dos modelos que incluem essa variável. Nesse método, soma-se os pesos dos modelos em que a variável está presente e é obtida a // | ||
+ | |||
+ | ===Seleção de modelos vs. Seleção de variáveis=== | ||
+ | |||
+ | Dessa forma, na **seleção de modelos** se comparam modelos que representam diferentes hipóteses esperadas para a relação (que pode ou não ser linear) entre variáveis preditora e resposta. Na **seleção de variáveis**, | ||
+ | |||
+ | ===Quando a hipótese é um modelo aditivo=== | ||
+ | |||
+ | Em ecologia da paisagem, muitas vezes são levados em conta múltiplas características do ambiente e da paisagem que podem atuar sobre o processo ou padrão de interesse. Para ilustrar essa situação, utilizarei como exemplo parte do meu projeto de mestrado que procura entender qual a influência de características ambientais sobre a biomassa de fragmentos florestais na Mata Atlântica. | ||
+ | |||
+ | Um dos processos ecológicos mais importantes decorrentes do desmatamento e fragmentação de paisagens naturais e que causa uma redução acentuada da biomassa florestal é o efeito de borda (Laurance, et al. 2011). Para fragmentos de Mata Atlântica, a distância até a qual se estende o efeito de borda é incerta. Assim, ao longo de um gradiente borda-interior do fragmento, o efeito de borda pode ser mais ou menos intenso ou até inexistente. Dessa forma, é importante saber como ocorre a variação da biomassa ao longo desse gradiente. Um fator da paisagem que pode influenciar a biomassa em um fragmento florestal é o uso do solo adjacente ao fragmento (a matriz da paisagem), uma vez que tipos de uso do solo podem atenuar ou acentuar o efeito de borda, por serem mais ou menos contrastantes com a floresta. Outro fator que pode influenciar a biomassa é a idade do fragmento, que pode refletir o estágio sucessional da vegetação e o tempo total de acúmulo de carbono. Assim, a biomassa em um fragmento florestal, é potencialmente influenciada pelas três variáveis discretas, distância da borda (três fatores), tipo de matriz (dois fatores) e idade do fragmento (dois fatores). | ||
+ | |||
+ | Neste caso, há um interesse em saber se existe influência dessas variáveis na biomassa e quais das variáveis são mais importantes na definição da biomassa nos fragmentos florestais. A biomassa pode ser resultado da influência da ação de somente uma das variáveis, ou da ação independe (aditiva) de duas variáveis ou três variáveis. A estratégia para avaliar essa situação seria a construção de modelos lineares simples formados por somente uma das variáveis (// | ||
+ | |||
+ | ===Quando a interação entre as variáveis também interessa=== | ||
+ | |||
+ | E se o efeito total das variáveis preditoras não for somente a adição dos efeitos isolados de cada variável? Muitas vezes as variáveis preditoras podem interagir e causar efeitos distintos sobre a variável resposta. Assim, além do efeito isolado e aditivo das variáveis, há um efeito causado pela interação entre as variáveis preditoras. // | ||
+ | |||
+ | Seguindo o exemplo apresentado anteriormente, | ||
+ | // | ||
+ | // | ||
+ | |||
+ | Quando colocamos para concorrer um conjunto de modelos dentre os quais estão presentes modelos simples, aditivos e com interação, | ||
+ | |||
+ | ===Considerações=== | ||
+ | |||
+ | Ainda não cheguei a respostas para as minhas dúvidas, mas fiz algumas reflexões sobre as duas formas de abordar a situação. Na primeira forma de abordagem, interpretar o caso como uma **seleção de modelos**, caso selecionássemos um modelo com a presença de interação, | ||
+ | |||
+ | =====Referências bibliográficas===== | ||
+ | |||
+ | Burnham, K.P. & Anderson, D.R. 2002. Model selection and multimodel inference. A practical information - theoretic approach. Springer, New York. | ||
+ | |||
+ | Crawley, M.J. 2007. The R Book. New York, Wiley. | ||
+ | |||
+ | Gotelli, N.J & Ellison. A.M. 2011. Princípios de estatística em ecologia. Artmed. Porto Alegre, 528p. | ||
+ | |||
+ | Johnson, J. B. & Omland, K. S. 2004. Model selection in ecology and evolution. Trends in Ecology and Evolution, 19:101-10 | ||
+ | |||
+ | Laurance, W. F., J. L. C. Camargo, R. C. C. Luizao, S. G. Laurance, S. L. Pimm, E. M. Bruna, P. C. Stouffer, G. B. Williamson, J. Benitez-Malvido, | ||
+ | |||
+ | =====Citação===== | ||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | |||
+ | Costa, Karine M. 2014. SELEÇÃO DE MODELOS, SELEÇÃO DE VARIÁVEIS E INTERAÇÕES. In: Prado , P.I & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// | ||
+ | |||