historico:2014:ensaios:koffler
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Próxima revisão | Revisão anterior | ||
historico:2014:ensaios:koffler [2014/09/21 21:26] – criada sheina.koffler | historico:2014:ensaios:koffler [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== Distribuições de Probabilidade: | ||
+ | ==Sheina Koffler== | ||
+ | * Pós-Graduação em Ecologia, Instituto de Biociências - USP | ||
+ | * sheina.koffler@usp.br | ||
+ | A modelagem estatística vem ganhando cada vez mais espaço nos estudos em ecologia e é cada vez mais frequente lermos artigos com termos como “generalized linear models”, “likelihood” ou “AIC”. Neste ensaio pretendo abordar algumas vantagens do uso da Seleção de Modelos por Verossimilhança em relação à Estatística Clássica (Frequentista) para realização de inferência. Particularmente, | ||
+ | |||
+ | Podemos destacar como pontos divergentes entre a inferência por seleção de modelos e a inferência frequentista: | ||
+ | |||
+ | **1) O número de hipóteses a serem contrastadas** | ||
+ | |||
+ | Na inferência frequentista, | ||
+ | |||
+ | **2) Método empregado no teste de hipótese** | ||
+ | |||
+ | Para rejeitar hipóteses na inferência frequentista, | ||
+ | |||
+ | **3) Distribuições de probabilidades empregadas** | ||
+ | |||
+ | Em grande parte dos testes estatísticos frequentistas, | ||
+ | |||
+ | ===Transformação dos dados para distribuição normal: por que não?=== | ||
+ | |||
+ | Diversos métodos de transformação dos dados estão disponíveis (p. ex. raiz quadrada, log, valor inverso, logito, arco-seno da raiz quadrada) e é possível verificar empiricamente qual o melhor método para seu conjunto de dados. Esse procedimento nem sempre é simples (alguns manuais sugerem que você peça ajuda a um estatístico!) e em muitos livros de didáticos, não são discutidos eventuais problemas das transformações (Osborne, 2002). As transformações mudam a escala da medida dos valores, geralmente aumentando a escala de forma mais acentuada para os valores menores (lado esquerdo da distribuição), | ||
+ | |||
+ | {{: | ||
+ | **Figura 1.** (Acima) Densidade de probabilidade para valores observados (simulados a partir de uma distribuição exponencial conhecida) e seu respectivo gráfico quantil-quantil para inspeção de normalidade (a linha indica os valores esperados para uma distribuição normal). (Abaixo) Densidade de probabilidade para valores transformados para log e o respectivo gráfico quantil-quantil, | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | **Figura 2.** Relação entre valores observados e valores transformados para log, referentes à figura 1. Observa-se uma grande mudança da escala, além de uma relação curvilínea que prejudica a interpretação dos valores no resultado da análise. | ||
+ | |||
+ | ===Seleção de Modelos por Verossimilhança: | ||
+ | |||
+ | |||
+ | Como exposto acima, nem sempre a transformação dos dados para normalização é uma boa estratégia a ser implementada. Além disso, nos estudos de ecologia e evolução, as variáveis frequentemente seguem outras distribuições, | ||
+ | |||
+ | ===Um exemplo prático=== | ||
+ | |||
+ | |||
+ | Em meu mestrado, estudei a produção de machos em uma abelha social nativa. A pergunta do projeto foi se a produção de machos seria influenciada pela quantidade de alimento estocada na colônia. Para isso, realizei um experimento em que a quantidade de alimento foi manipulada nas colônias (tratamento A: aumento do estoque, tratamento B: redução do estoque, controle: ausência de mudança no estoque). Durante três meses após a manipulação, | ||
+ | |||
+ | Recentemente, | ||
+ | |||
+ | **Tabela 1.** Sumário dos resultados da seleção de modelos para o experimento sobre proporção de machos produzidos em relação à quantidade de alimento disponível. Os modelos construídos referem-se a modelos mistos, em que a identidade da colônia foi inserida como fator aleatório. No entanto, essa questão não é o foco do ensaio e não será discutida. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | |||
+ | Como vantagens dessa análise, destaco: uso da distribuição de probabilidades adequada ao conjunto de dados coletado e análise de múltiplas hipóteses conjuntamente. Utilizando a distribuição binomial, modelei a probabilidade de produzir-se machos, mas incluindo na análise os números absolutos de machos e operárias, o que não estava incluso na análise frequentista, | ||
+ | |||
+ | **Referências bibliográficas: | ||
+ | |||
+ | Batista, J. 2009. Verossimilhança e Máxima Verossimilhança. Material de estudo que acompanha aula sobre o tema. Centro de Métodos Quantitativos (http:// | ||
+ | |||
+ | Bolker, B. M. 2008. Ecological models and data in R, Princeton University Press. | ||
+ | |||
+ | Bolker, B. M., M. E. Brooks, C. J. Clark, S. W. Geange, J. R. Poulsen, M. H. H. Stevens, and J.-S. S. White. 2009. Generalized linear mixed models: a practical guide for ecology and evolution. Trends in ecology & evolution 24: 127-135. | ||
+ | |||
+ | Burnham, K. P., and D. R. Anderson. 2002. Model selection and multimodel inference: a practical information-theoretic approach, | ||
+ | |||
+ | Hilborn, R. 1997. The ecological detective: confronting models with data, vol. 28, Princeton Unive rsity Press. | ||
+ | |||
+ | Johnson, J. B., and K. S. Omland. 2004. Model selection in ecology and evolution. Trends in ecology & evolution 19: 101-108. | ||
+ | |||
+ | Osborne, Jason (2002). Notes on the use of data transformations. Practical Assessment, Research & Evaluation, 8(6). < | ||
+ | |||
+ | |||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | |||
+ | Koffler, S. 2014. Distribuições de Probabilidade: |