historico:2014:ensaios:duarte
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anteriorPróxima revisão | Revisão anterior | ||
historico:2014:ensaios:duarte [2014/10/24 12:45] – mmeloduarte | historico:2014:ensaios:duarte [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== Trade-off entre variância e viés e suas implicações na predição do estoque de carbono por florestas em processo de restauração ====== | ||
+ | === Marina Melo Duarte === | ||
+ | * Laboratório de Silvicultura Tropical, Escola Superior de Agricultura "Luiz de Queiroz", | ||
+ | * mmeloduarte@gmail.com | ||
+ | |||
+ | ===== Introdução ===== | ||
+ | |||
+ | Durante o doutorado, que inicio neste semestre, estudarei o estoque de carbono/ | ||
+ | |||
+ | A importância desse tipo de estudo se deve ao fato de que é muito provável que o cenário de mudanças climáticas vivido atualmente esteja relacionado à emissão de gases de efeito estufa na atmosfera, como o dióxido de carbono (Stern, 2007). O desmatamento é a segunda maior fonte antrópica de emissão de carbono à atmosfera (van der Werf et al., 2009) e a incorporação desse elemento pela vegetação é uma relevante forma de se reverter esse processo (Angelsen, 2009). Assim, é de grande importância monitorar o teor de carbono da vegetação (van der Werf et al., 2009). Da mesma forma, é importante que, no planejamento de um projeto de restauração florestal, se possa predizer quanto um plantio poderá estocar de biomassa (e, consequentemente, | ||
+ | |||
+ | Um dos assuntos abordados durante a disciplina que se mostrou muito relevante em estudos de predições, | ||
+ | |||
+ | ===== Explicando a teoria: O trade-off entre viés e variância na modelagem estatística ===== | ||
+ | |||
+ | Quando realizamos um experimento, | ||
+ | |||
+ | A seleção de modelos atua na minimização do erro quadrático médio. Porém, como ele tem os componentes viés e variância, eles devem dividir entre si esse erro. Especialmente os modelos aninhados, em que um modelo está contido dentro do outro, alternarão os valores de viés e variância um em detrimento do outro (Forster, 2000). | ||
+ | |||
+ | Existe um “trade-off”, | ||
+ | |||
+ | É comum ocorrerem dois tipos de erro devido ao trade-off entre viés e variância: o sobreajuste (overfitting) e sub-ajuste (underfitting). Sobreajuste ocorre quando são incorporados ao modelo detalhes que são específicos da amostra em questão e que não necessariamente refletem processos da natureza. É diminuído seu viés, mas são incorporados efeitos espúrios ao modelo e ocorre perda desnecessária de precisão. Já o sub-ajuste ocorre quando informações importantes contidas nos dados não são incorporadas ao modelo, fazendo com que ele seja simplificado, | ||
+ | |||
+ | Como podemos lidar com esse dilema de escolha entre viés e variância? | ||
+ | |||
+ | É recomendado se trabalhar com amostras de tamanho suficiente para a proposição dos modelos desejados. Amostras de tamanho muito pequeno podem levar a estimativas de parâmetros por verossimilhança apresentando alto viés (Bolker, | ||
+ | |||
+ | Podemos atuar também no momento da proposição de modelos. Devem ser propostos apenas modelos coerentes com a realidade e com a teoria que se conhece de cada área de estudo. Por outro lado, deve-se fazer esforço para incluir na análise todos os modelos que façam sentido biologicamente, | ||
+ | |||
+ | Outro momento em que podemos atuar na redução dos problemas de sobreajuste ou de sub-ajuste é na seleção de modelos. Essa seleção pode ser feita de formas diferentes, por distintas abordagens, como por teste de razão de verossimilhança, | ||
+ | |||
+ | ===== Mas como essa teoria está relacionada a estudos de predição do estoque de carbono em florestas em restauração? | ||
+ | |||
+ | Quando resolvemos restaurar uma floresta com finalidade de sequestro de carbono, é desejável que, desde o início do projeto, possa-se ter uma noção de quanto carbono ela poderá incorporar no futuro e que fatores podem maximizar esse processo. Assim, é útil construir modelos de acúmulo de biomassa por florestas ao longo do tempo, com finalidade de predição. Esses modelos devem incorporar como parâmetros fatores que possam interferir no acúmulo de biomassa, como, por exemplo, o número de espécies presentes, os grupos funcionais dessas espécies, características de solo e clima etc.. De tal forma, a partir da presença desses fatores, no início do processo de restauração, | ||
+ | |||
+ | Contudo, como foi exposto, para modelos preditivos, deve-se atentar ao trade-off entre viés e variância. É de grande importância que se analisem quais fatores realmente interferem no comportamento dos dados estudados, a fim de que parâmetros importantes não sejam deixados de lado na formulação de um modelo (sub-ajuste). Por outro lado, se forem acrescentados parâmetros que não refletem o processo que gerou a distribuição de dados, mas que refletem ruídos nos dados coletados, haverá sobreajuste e o modelo perderá sua eficiência de predição, distanciando-se de seu objetivo. | ||
+ | |||
+ | É importante que os modelos propostos sejam razoáveis: tenham comportamento coerente com teorias e processos observados na natureza. A literatura nos indica que, no início do processo de colonização de uma área desmatada, a competição entre as árvores é mínima, permitindo altas taxas de recrutamento e de crescimento. Essa competição é maximizada quando ocorre o fechamento do dossel (Alberti et al., 2008). Dessa forma, logo no início, o acúmulo de carbono por uma floresta é baixo, pela baixa razão fotossíntese/ | ||
+ | |||
+ | Contudo, apesar de se considerar que florestas maduras atingem estabilidade na quantidade de biomassa, Lewis e colaboradores (2009) expõem que, na realidade, essa biomassa não se mantém exatamente constante ao longo do tempo, mas flutua entre períodos de crescimento constante e períodos de grande baixa por eventos estocásticos de morte de árvores. Esse é um exemplo de informação que, se incorporado a um modelo de predição de biomassa em florestas ao longo do tempo, poderá gerar sobreajuste. Como a morte de árvores é um evento estocástico, | ||
+ | |||
+ | Apenas para fins ilustrativos, | ||
+ | |||
+ | {{ : | ||
+ | **Figura 1**: Pontos representam medidas do teor de carbono em floresta em processo de restauração ao longo do tempo (dados fictícios) e linhas representam dois modelos para ajustar esses dados. | ||
+ | |||
+ | {{ : | ||
+ | **Figura 2**: Curvas representadas pelos modelos 1 e 2 por um período de tempo além da coleta de dados. | ||
+ | |||
+ | Assim, podemos contrapor teorias ecológicas com teorias da modelagem para melhor nos orientar em como proceder nos estudos a serem realizados. Como se pode observar, este ensaio não tem a pretensão de esgotar o assunto trade-off entre viés e variância e muito menos de apresentar uma resposta sobre como resolver o dilema proposto. Contudo, ele mostra o quanto é importante explorar e lidar cuidadosamente com essa questão quando se realizam estudos preditivos. | ||
+ | | ||
+ | ===== Referências bibliográficas ===== | ||
+ | |||
+ | ALBERTI, G. PERESSOTTI, A. PIUSSI, P., ZERBI, G. 2008. Forest ecosystem carbon accumulation during a secondary succession in the Eastern Prealps of Italy. Forestry, 81: 1-11. doi: | ||
+ | |||
+ | ANDERSON, D.R. BURNHAM, K.P. 1999. General strategies for the analysis of ringing data. Bird Study, 46: S261–S270. doi: | ||
+ | |||
+ | ANGELSEN, A. 2009. Introduction. In: ANGELSEN, A. (Ed.). Realising REDD+: National strategy and policy options. Bogor: Center for International Forestry Research (CIFOR). p. 1-12. | ||
+ | |||
+ | BOLKER, B.M. 2008. Ecological Models and Data in R. Princeton and Oxford: Princeton University Press. 508 p. | ||
+ | |||
+ | BURNHAM, K.P. ANDERSON, D.R. HUYVAERT, K.P. 2011. AIC model selection and multimodel inference in behavioral ecology: some background, observations, | ||
+ | |||
+ | FORSTER, M. 2000. Key concepts in model selection: Performance and generalizability. Journal of Mathematical Psychology, 44: 205–231. doi: | ||
+ | |||
+ | GOUGH, C.M. VOGEL, C.S. SCHMID, H.P. CURTIS, P.S., 2008. Controls on annual forest carbon storage: lessons from the past and predictions for the future. Bioscience, 58: 609–622. doi: | ||
+ | |||
+ | HASTIE, T. TIBSHIRANI, R. FRIEDMAN, J. 2009. The elements of statistical learning. Second edition. New York: Springer Series in Statistics Springer New York Inc. 739 p. | ||
+ | |||
+ | LEWIS, S.L. LOPEZ-GONZALEZ, | ||
+ | |||
+ | STERN, N. 2007. The Economics of Climate Change: The Stern Review. Cambridge and New York: Cabridge University Press. 575p. | ||
+ | |||
+ | VAN DER WERF, G.R., MORTON, D.C., DEFRIES, R.S., OLIVIER, J.G.J., KASIBHATLA, P.S., JACKSON, R.B., COLLATZ, G.J., RANDERSON, J.T. 2009. CO2 emissions from forest loss. Nature Geoscience, 2: 737–738. doi: | ||
+ | |||
+ | |||
+ | =====Citação===== | ||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | |||
+ | Duarte, M.M. 2014. Trade-off entre variância e viés e suas implicações na predição do estoque de carbono por florestas em processo de restauração. In: Prado , P.I. & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// |