Seleção de Modelos de Volume de Madeira
Renata Aparecida Serio Abranches
renatabranches@yahoo.com.br
Introdução
O inventário florestal consiste no uso de fundamentos da teoria de amostragem para a determinação ou estimativa de características quantitativas ou qualitativas da floresta (SCOLFORO & MELLO, 2006).
Dentre as características quantitativas resultantes do inventário florestal, podemos citar por exemplo, o volume de madeira de uma dada área de interesse.
Para isso não é necessário determinar o volume de madeira de todas as árvores de um povoamento, pode ser feita uma “estimativa” do volume das árvores a partir do volume de algumas árvores que são abatidas (COUTO et al., 1989).
Nessas árvores abatidas é realizada a cubagem rigorosa, utilizando-se de técnicas que se baseiam na medição do diâmetro e altura ao longo do fuste (SCOLFORO & THIERSCH, 2004). A cubagem caracteriza o comportamento do diâmetro ao longo do tronco e determina o volume real dessas árvores.
O volume dessas árvores abatidas, pode ser obtido pelo emprego de diferentes fórmulas, entre elas, podemos citar as fórmulas de Smalian, Huber, Newton e Hohenald (ANDRADE, 2006). E a partir desse processo é possível obter alguns fatores úteis para a estimativa do volume das árvores em pé.
Os dados obtidos na cubagem são analisados empregando-se técnicas de regressão linear e não-linear com o intuito de definir uma equação adequada à predição do volume em árvores não-cubadas (ANDRADE, 2006).
A vantagem das equações de volume é o cálculo de volume sólido, árvore a árvore, através de modelos matemáticos, especialmente testados para apresentar os menores erros possíveis (COUTO & BASTOS, 1987).
Existem vários modelos denominados de dupla entrada, que explicam o volume através de duas variáveis, no caso o diâmetro tomado a 1,30 metros de altura do solo e a altura, podendo citar entre esses os modelos de Spurr, Schumacher-Hall, Honner, Ogaya, Takata, Meyer entre outros (SCOLFORO, 2005).
Apesar da eficiência de alguns modelos, os mesmos nem sempre se ajustam a todas as espécies e condições, sendo recomendável testá-los por meio de estatísticas adequadas identificando o melhor para cada caso (THOMAS et al., 2006).
O objetivo final de testar vários modelos de regressão é obter um modelo que apresente condições de explicar o fenômeno estudado, com baixa possibilidade de erro (COUTO & BASTOS, 1987).
Procedimento Padrão na Escolha do Melhor Modelo
Para comparar e selecionar o melhor modelo de regressão, a análise pode se basear em alguns critérios de seleção, como: Coeficiente de Determinação (R²), Erro-Padrão da Estimativa (Syx) entre outros.
O R² expressa a quantidade de variação da variável dependente que é explicada pelas variáveis independentes. Quanto mais próximo de um for o valor do R², melhor terá sido o ajuste (MACHADO et al., 2002).
O Erro-Padrão da Estimativa indica a precisão do ajuste de um modelo matemático, e somente deve ser utilizado como comparador quando as variáveis dependentes apresentarem a mesma unidade de medida. Quanto menor o Erro-Padrão da Estimativa, melhores são as estimativas obtidas com a equação (THOMAS et al., 2006).
As medidas de precisão R² e Syx não devem ser utilizadas isoladamente para o julgamento da precisão do modelo, pois podem fornecer informações enganosas sobre o ajuste. O recomendado é completá-las fazendo uma análise gráfica de resíduos, que é decisiva na avaliação da qualidade das estimativas, pois permite detectar se há ou não tendenciosidade na estimativa da variável dependente ao longo de toda a linha de regressão (SCOLFORO et al., 2004).
Escolha do Modelo pela Inferência da Verossimilhança
A inferência estatística da verossimilhança baseia-se em ajustar modelos através de dados, sendo que os parâmetros são variáveis e os dados fixos.
A lei de verossimilhança pressupõe que se uma hipótese A é mais plausível que uma hipótese B, significa que a probabilidade atribuída ao valor observado é maior em A do que em B, bem como a razão dessas probabilidades, denominada de razão de verossimilhança é o valor de evidência em favor de uma das hipóteses. Sendo assim, a razão de verossimilhança é uma mensuração numérica precisa e objetiva da força da evidência estatística (ROYALL, 2004).
Na seleção de modelos, as hipóteses concorrentes são representadas por diferentes modelos que são confrontados simultaneamente com um conjunto de dados. Para essa seleção do modelo, foi desenvolvido o critério de Akaike (AIC), que se origina da minimização da informação ou distância de Kulback-Leibler (K-L) como base para a seleção de modelos, onde a informação K-L é uma medida da distância entre o modelo verdadeiro e um modelo candidato (DAL BELLO, 2010).
Um dos critérios de comparação de modelos é o Critério de Informação de Akaike, que penaliza o número de parâmetros na log-verosimilhança negativa do modelo, que pode ser utilizada através da fórmula (AIC = −2 ln [L(modelo)] + 2 p), onde: L(modelo) é a função de verossimilhança do modelo e p é o número de parâmetros do modelo (BATISTA, 2008).
Um valor de AIC individual, não pode ser por si só interpretável, apenas quando compara um AIC em relação a outros valores de AIC (BURNHAM, 2002). Após o cálculo de AIC para cada modelo ajustado, o que apresentar menor valor de AIC, apresentará o melhor o modelo dentre aqueles analisados, ou seja, permite uma rápida comparação entre os modelos candidatos.
É recomendado também o cálculo das diferenças (Δi) de AIC, que pode ser obtido através da fórmula “Δi = AICi – AICmin”. Nesse caso, se os modelos apresentarem diferença entre os AICs de menor ou igual a 2, estes podem ser considerados indiferentes (BOLKER, 2007).
Com o uso da verossimilhança não iremos interpretar os dados apenas utilizando medidas de precisão para compará-los dois a dois e escolher o modelo que melhor representa os dados, mas analisaremos as relações, obtidas através do método AIC, podendo comparar todos os modelos simultaneamente e identificar qual foi o mais plausível, ou seja, com a utilização desse método, a confiabilidade de escolha do melhor modelo aumenta.
Ressaltando que quando se utiliza do método da máxima verossimilhança, os modelos candidatos estarão se ajustando aos dados e não os dados se ajustando ao modelo, possibilitando um maior entendimento em relação ao seu conjunto de dados.
Referências Bibliográfica
ANDRADE, C. L.; CALEGARIO, N.; SCOLFORO, J. R. S. Análise de algumas alternativas para obter o coeficiente angular da reta no método da altura relativa. Ciência Florestal, v. 16, n. 3, p. 303-317, 2006.
BATISTA, J.L.F. 2008. Inferência em Recursos Florestais e Ecologia: A abordagem da Verossimilhança. Palestra no ciclo de seminários do Programa de Pós-Graduação em Estatística e Experimentação Agronômica, Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, SP. 24 p.
BOLKER, B.M. 2007. Ecological Models and Data in R Princeton: Princeton University Press. 485 p.
BURNHAM, K.P. & ANDERSON, D.R. 2002. Model selection and multimodel inference. A practical information - theoretic approach. Second Edition. Springer, New York. 454 p.
COUTO, H. T. Z. & BASTOS, N. L. M. Modelos de equações de volume e relações hipsométricas para plantações de Eucalyptus no Estado de São Paulo. IPEF, Piracicaba, n. 37, p. 33-44, dez. 1987.
COUTO, H. T. Z.; BATISTA, J. L. F.; RODRIGUES, L. C. E. Mensuração e gerenciamento de pequenas florestas. Documentos Florestais, Piracicaba,v. 5, p. 1-37, nov. 1989.
DAL BELLO, L. H. A. Modelagem em experimentos mistura-processo para otimização de processos industriais. Tese de doutorado - Pontifícia Universidade Católica do Rio de Janeiro, Departamento de Engenharia Industrial. 2010.
MACHADO, S. A.; CONCEIÇÃO, M. B.; FIGUEIREDO, D. J. Modelagem do volume individual para diferentes idades e regimes de desbaste em plantações de Pinus oocarpa. Revista Ciências Exatas e Naturais, Vol. 4, nº 2, jul/dez. p.185-197. 2002.
ROYALL, R. M. 2007. The likelihood paradigm for statistical evidence. In: The nature of scientific evidence (eds. ML Taper and SR Lele), University of Chicago Press, pp 119–152.
SCOLFORO, J. R.; OLIVEIRA, A. D.; DAVIDE, A. C. Manejo sustentado das candeias Eremanthus erythropappus (DC.) McLeisch e Eremanthus incanus (Less.) Less. Lavras: Departamento de Ciências Florestais. 2004. 18p.
SCOLFORO, J.R.S. & MELLO, J.M. 2006. Inventário Florestal. Lavras: UFLA/FAEPE. 561p.
SCOLFORO, J.R.S. & THIERSCH, C. R. 2004. Biometria Florestal: medição, volumetria e gravimetria. Lavras: UFLA/FAEPE. 285 p.
SCOLFORO, J.R.S. 2005. Biometria Florestal: Parte I: Modelos de regressão linear e não linear, Parte II: Modelos para relação hipsométrica, volume, afilamento e peso de mat´ria seca. Lavras: UFLA/FAEPE. 352 p.
THOMAS, C. et al. Comparação de equações volumétricas ajustadas com dados de cubagem e análise de tronco. Ciência Florestal, Santa Maria, v. 16, n. 3, p. 319-327, 2006.
Citação
Este ensaio é um produto de disciplina BIE 5781 (Modelagem Estatística para Ecologia e Recursos Naturais) da pós-graduação da Universidade de São Paulo.