historico:2014:ensaios:bertoncello
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anterior | |||
historico:2014:ensaios:bertoncello [2014/10/24 20:27] – ricardobertoncello | historico:2014:ensaios:bertoncello [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== Seleção de modelos como alternativa para estudo de estruturação de comunidades vegetais ====== | ||
+ | === Ricardo Bertoncello === | ||
+ | * Departamento de Ecologia, Instituto de Biociências- USP | ||
+ | *ricardobertoncello@gmail.com | ||
+ | |||
+ | Uma vez que é impossível coletar todos os dados espaciais e temporais para entendermos exatamente como a natureza funciona, precisamos fazer isso através de observações pontuais que nos permitam inferir sobre o restante dos dados não coletados. Para tanto, é preciso transformar as ideias em equações matemáticas (ou modelos) que simplificam o funcionamento do sistema e ainda assim consigam explicar boa parte das variações observadas (Johnson et al 2004). Tradicionalmente a ciência vinha se desenvolvendo no paradigma frequentista, | ||
+ | |||
+ | A abordagem de seleção de modelos, por sua vez, pode comparar múltiplas hipóteses (inclusive uma hipótese nula) e ver dentre as hipóteses (isso é, ideias transformadas em equações matemáticas) qual a mais adequada (ou as mais adequadas) baseada no conjunto de dados existente (Hilborn & Mangel 1997). Isso significa que mais de um modelo pode explicar os dados com probabilidade semelhante, e ainda que haja outros modelos melhores para explicar os dados, mas que não foram elencados pelo pesquisador. Haja vista a complexidade dos sistemas naturais, a possibilidade de testar diversas teorias concorrentes ao mesmo tempo em detrimento a uma única ideia parece diminuir o caminho para o cientista gerar um modelo que explique seus dados de maneira mais efetiva. | ||
+ | |||
+ | Além disso, a análise frequentista se baseia no Teorema Central do Limite para construir Intervalos de Confiança ou testar hipóteses sobre o valor do parâmetro (Batista 2009). Isso significa que existiria um universo amostral teórico, do qual se pressupõe haver suficiência amostral para representá-lo. Dessa maneira as distribuições seriam relacionadas à esse universo teórico e não à amostra propriamente dita, pois representariam o “comportamento das estimativas baseado na repetição incontável do processo de amostragem” (Batista 2009). Entretanto, na prática não ocorre essa repetição incontável do processo de amostragem científica. | ||
+ | |||
+ | |||
+ | Por outro lado, existe uma análise denominada de verossimilhança, | ||
+ | |||
+ | |||
+ | Entretanto, a análise de verossimilhança não considera o número de parâmetros existentes em cada modelo. Quanto maior o número de parâmetros maior a chance de o modelo explicar melhor os dados. Todavia, um modelo com muitos parâmetros perde o poder de generalização e acaba ficando muito restrito a uma situação específica. Pelo princípio da parcimônia, | ||
+ | |||
+ | |||
+ | O critério de Akaike penaliza a log-verossimilhança negativa com duas vezes o número de parâmetros. Essa proporção não é arbitrária, | ||
+ | |||
+ | |||
+ | Uma vez que a comparação dos modelos é relativa ao mesmo conjunto de dados, não faz sentido compararmos valores absolutos gerados por conjuntos de dados diferentes. Dentro de um mesmo conjunto de dados o AIC estabelece valores que representam o quão plausível são os diferentes modelos. Em termos gerais, considera-se que se a diferença de AIC for menos ou igual a 2, não há diferença entre os modelos comparados. Caso a diferença seja entre 4 e 7 existe uma diferença considerável, | ||
+ | |||
+ | Dentro da área que estou desenvolvendo meu trabalho, proceder às análises através de seleção de modelos parece ser uma alternativa bastante adequada. De acordo com Hilborn & Mangel (1997), a abordagem de modelos pode ser adequada em pesquisas de longo prazo, com poucas réplicas e com dificuldade para se manter um controle fiel. No trabalho que estou desenvolvendo estamos interessados nas forças estruturadoras das comunidades vegetais. Para isso, usamos um projeto de restauração ecológica onde tivemos a oportunidade de configurar diferentes modelos de plantio para averiguar a influência da proximidade das plantas de diferentes estágios sucessionais, | ||
+ | |||
+ | Dentre as diferentes abordagens possíveis, escolhemos trabalhar com modelos mistos, pois esse tipo de abordagem é considerada adequada quando há auto correlação espacial e temporal, além de diferenças nas respostas entre os blocos do experimento de campo (Crawley, 2013). As análises foram feitas com um conjunto parcial de dados que foi obtido até o momento. Com os conhecimentos obtidos na presente disciplina espera-se entender melhor o que está por trás da seleção de modelos e refinar as análises quando utilizarmos todo o conjunto de dados que está sendo coletado. | ||
+ | |||
+ | ===== Referências bibliográficas ===== | ||
+ | Batista, J.L.F. 2009 Verossimilhança e Máxima Verossimilhança. | ||
+ | |||
+ | Burnham, K. P., & Anderson, D. R. (2002). Model Selection and Multimodel Inference: A Practical-Theoretic Approach, 2nd ed. New York, Springer-Verlag. | ||
+ | |||
+ | Crawley MJ (2013) The R Book. John Wiley and Son Ltd. Chichester, West Sussex, United Kingdom, 2nd Edition. | ||
+ | |||
+ | Hilborn, R. & Mangel, M. (1997). The Ecological Detective – Confronting Models with Data. Princeton, Princeton University Press. | ||
+ | |||
+ | Johnson, J. B. & Omland, K. S. (2004). Model selection in ecology and evolution. Trends in Ecology and Evolution 19: | ||
+ | |||
+ | Bertoncello, | ||