Tabela de conteúdos
Mudança de paradigma na análise de dados em ecologia
Anna Abrahão
- Pós-Graduação em Ecologia, Universidade Estadual de Campinas
- anna.abrahao@gmail.com
A abordagem histórica
O método científico baseado nas ideias “falsificacionistas” de Popper trata a ciência como um produto. A ideia de Popper é que não se pode provar nada, apenas se pode falsear uma hipótese (Gotelli & Elison 2011). Esse processo gera uma assimetria entre verificação e falsificação. Qualquer observação que contradiz a hipótese leva à sua rejeição. No entanto, nunca haverá evidência suficiente para provar que uma hipótese é verdadeira, nem que uma hipótese é “mais verdadeira” que outra. Ora, se o objetivo da ciência é buscar a verdade, do que adianta só ter certeza da falsidade de uma declaração, e nunca saber o quão próximo da verdade a outra hipótese se encontra? A inferência estatística clássica é baseada nessa visão epistemológica. Uma hipótese, ou seja, uma declaração geral a respeito do mundo natural. Essa hipótese é tratada como científica se ela puder ser colocada à prova por experimentação ou observação. Até aí, tudo bem. O problema é que uma hipótese pode ser representada por vários modelos (Hilborn 1997). Na estatística clássica, uma hipótese é representada por apenas um modelo, que é confrontado com um modelo nulo. Se o modelo nulo não é rejeitado, com base na probabilidade fornecida por estatística com distribuição assimptótica (valor de P), aceitamos a nossa hipótese. E os outros modelos, onde ficam? Não ficam.
A abordagem alternativa
Uma abordagem alternativa à estatística clássica é a inferência por verossimilhança. Nessa abordagem, várias hipóteses concorrentes, ou uma mesma hipótese com modelos diferentes que a representam podem ser comparadas simultaneamente (Edwards 1992). Mas o que é a verossimilhança? É a probabilidade que um modelo atribui aos dados. A explicação mais plausível será então aquela que atribuir a maior probabilidade aos dados, ou seja, que tem maior força de evidência (Batista 2009). Ao comparar modelos diferentes, no entanto, necessitamos de critérios para tornar as decisões menos subjetivas. Um dos critérios muito utilizados em ecologia atualmente é o Critério de Informação de Akaike (AIC). O AIC utiliza a verossimilhança de modelos desfavorecendo os modelos com mais parâmetros. O interessante é que o AIC é uma medida relativa. Ele só pode ser utilizado para ser comparado com o AIC de outro modelo aplicado aos mesmos dados. E a maior vantagem é que o modelo com AIC menor (é o que tem maior verossimilhança) pode ser considerado não somente como o modelo que se ajusta melhor aos dados (entre os modelos que estão sendo comparados), mas também o modelo que perde menos informação com relação ao modelo verdadeiro, que é desconhecido.
Com isso, nós mudamos completamente a nossa forma de fazer ciência. A abordagem dedutiva de Popper, que parte de uma generalização e a aplica a casos particulares é substituída pela abordagem não dedutiva, que usa casos particulares para propor uma conclusão geral. Ao invés de procurar evidências que falseiem uma explicação, procuramos evidências que apoiam uma explicação (Rieppel 2004). Não utilizamos mais testes de significância, mas procuramos uma “balança” para dar créditos diferentes a hipóteses diferentes (Edwards 1992). Essa transição entre a estatística frequentista clássica e inferência por verossimilhança na ecologia seria então um período de mudança de paradigma no sentido entendido por Kuhn? Chegou o momento em que acumulamos experiência suficiente que contradiga o paradigma frequentista para derrubá-lo? Parece que sim, que cada vez mais a inferência por verossimilhança, bem como a inferência Bayesiana estão tomando força (Burnham & Anderson 2014). Isso se deve ao fato que a estatística atribui valores de P à dados nunca observados (Royall 2007), e portanto parte de uma lógica que não se sustenta. Segundo Rao (1992 apud Burnham & Anderson 2014), ao testarmos uma hipótese nula estamos fazendo a pergunta errada e obtendo uma resposta confusa para o problema. Já que a hipótese alternativa nunca é testada, ela nunca será falseada. Dessa forma, a seleção de modelos por máxima verossimilhança fornece uma alternativa intuitiva para a análise de dados.
Por que mudar?
A inferência por verossimilhança nos fornece a força de evidência de um modelo com relação a outro (Batista 2009). Não precisamos mais de hipótese nula formal, valores de P, distribuição assimptótica de uma estatística engessada (Burnham & Anderson 2014). Podemos então entender a ciência como processo e confrontar as nossas hipóteses com outras, que se modificam a cada tomada de dados, ou observação. Esse novo paradigma entende também que o efeito de um processo é mais importante que sua significância, principalmente em ecologia (Hilborn 1997). Como qualquer mudança de paradigma, ela levará um tempo para se instalar, principalmente porque até hoje os programas escolares e universitários seguem ensinando a estatística frequentista. Esperamos que os futuros usuários da estatística, aqui vista como ferramenta, mas também como processo epistemológico, se adaptem e aperfeiçoem o referencial teórico, bem como o ferramental utilizado na estatística, e que ela faça mais sentido para os iniciantes da verossimilhança do que ela fez para os iniciantes da frequentista.
Referências bibliográficas
Batista, J.L.F. 2009 Verossimilhança e Máxima Verossimilhança. Burnham, K. P. & Anderson, D.R. 2014. P values are only an index to evidence: 20th- vs. 21st-century statistical science. Ecology 95:627–630.
Gotelli, N.J & Ellison. A.M. 2011. Princípios de estatística em ecologia. Artmed. Porto Alegre, 528p. Hilborn, R. & Mangel, M. (1997). The Ecological Detective – Confronting Models with Data. Princeton, Princeton University Press.
Rieppel, O. (2004). What happens when the language of science threatens to break down in systematics: a Popperian perspective In: Williams, D.A. & Forey, P. L. Milestones in systematics. Boca Raton, CRC Press.
Royall, R. M. (2007) The likelihood paradigm for statistical evidence. In: The nature of scientific evidence (eds. ML Taper and SR Lele), University of Chicago Press, pp 119–152.
Citação
Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo:
Abrahão, A. 2014. Mudança de paradigma na análise de dados em ecologia. In: Prado , P.I & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http://cmq.esalq.usp.br/BIE5781.