historico:2014:ensaios:moraes
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Próxima revisão | Revisão anterior | ||
historico:2014:ensaios:moraes [2014/09/21 11:49] – criada paula.bio08 | historico:2014:ensaios:moraes [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== Entendendo os Modelos Lineares Generalizados (GLMs) ====== | ||
+ | == Paula Elias Moraes == | ||
+ | * Pós-Graduação em Zoologia, Universidade de São Paulo | ||
+ | * paula.bio08@gmail.com | ||
+ | |||
+ | Dentre todos os temas abordados na disciplina, e que serão úteis para o meu projeto de mestrado, o tema Modelos Lineares Generalizados (GLMs) é bastante importante porque a análise dos meus dados será feita pelos GLMs. | ||
+ | |||
+ | Nosso conhecimento e entendimento acerca de qualquer sistema real são sempre incompletos, | ||
+ | |||
+ | Todo modelo estatístico é descrito pela relação entre uma componente aleatória (variável resposta) e os componentes sistemático (variável preditora sob um parâmetro) e residual (erro experimental). O modelo clássico de regressão, chamado modelo normal linear, é mais simples e bastante utilizado em análises de dados. Na equação desse modelo: Y= βX + ɛ, o valor observado da variável resposta (Y) é modelado como uma função linear da variável preditora (X), sob um parâmetro (β) a ser estimado, e ɛ é uma variável aleatória, seguindo uma distribuição normal, µ=0 e σ=1 (Olsson 2002). No entanto, para muitas situações práticas, as suposições de normalidade e linearidade fogem bastante dos dados reais (Bolker 2008). Com isso, novas técnicas estatísticas para os modelos de regressão foram surgindo, como as seguintes classes de modelos: modelos de regressão não linear e modelos lineares generalizados (Bolker 2008). | ||
+ | |||
+ | Até a década de 70, a suposição de normalidade ainda era presente nos modelos não lineares. Em seguida, Nelder e Wedderburn (1972) formularam os modelos lineares generalizados, | ||
+ | |||
+ | Os modelos lineares generalizados são uma extensão dos modelos lineares e usados em situações em que a variância não é constante (como a variável resposta com zeros inflados) e os erros não seguem distribuição normal (como os erros binomiais em dados de proporção) (Nelder e Wedderburn 1972). Ambas as situações são bastante frequentes em dados coletados em campo. Os GLMs relacionam a distribuição aleatória da variável resposta ao componente sistemático (ou preditor linear) através da função de ligação. O preditor linear é a soma linear dos valores preditos (ɳ= ∑xβ, sendo x as variáveis preditoras e β os parâmetros a serem estimados pelos dados) e é obtido com a transformação da variável resposta pela função de ligação (Crawley 2007). Ou seja, a função de ligação estabelece uma relação linear entre o valor observado e os valores preditos. | ||
+ | |||
+ | Associa-se a cada tipo de dado uma distribuição de probabilidade, | ||
+ | |||
+ | A análise dos dados por GLMs envolve três etapas: (1) formulação, | ||
+ | |||
+ | Os GLMs apresentam algumas limitações, | ||
+ | |||
+ | No meu projeto de mestrado, pretendo avaliar o efeito sinergético da perda do habitat e da caça sobre a ocorrência de espécies de mamíferos de maior porte em região de fronteira agrícola da Amazônia Oriental. A obtenção dos dados de pressão de caça e ocorrência dos mamíferos foi feita a partir de questionários estruturados já aplicados por meio de entrevistas em domicílios distribuídos em 20 áreas de estudo. Então, os efeitos da cobertura florestal e pressão de caça sobre a “frequência de avistamento” de cada espécie serão analisados através de modelos de regressão lineares generalizados. | ||
+ | |||
+ | A variável resposta “frequência de avistamento” será modelada como uma variável binomial, isto é, a proporção de entrevistados que avistaram a espécie. Para cada espécie e tempo de avistamento (15 dias ou seis meses), será construído um conjunto de modelos candidatos que consistirá de (1) um modelo constante, ou seja, sem as variáveis independentes, | ||
+ | |||
+ | =====Referências bibliográficas===== | ||
+ | |||
+ | Grimm, V. & Railsback, S. F. (2005). Individual-based Modeling and Ecology. Princeton: Princeton University Press. | ||
+ | |||
+ | Lindsey, J. K. (2007). Applying Generalized Linear Models.Springer. | ||
+ | |||
+ | Olsson, U. (2002). Generalized Linear Models - An Applied Approach. Lund: Studentlitteratur. | ||
+ | |||
+ | Bolker, B.M. (2008). Ecological Models and Data in R. Princeton: Princeton University Press. | ||
+ | |||
+ | Nelder, J.A. & Wedderburn, R.W. (1972). Generalized Linear Models. Journal of the Royal Statistical Society A, 135(3): 370-384. | ||
+ | |||
+ | Guisan et al. (2002). Generalized linear and generalized additive models in studies of species distributions: | ||
+ | |||
+ | Crawley, M.J. (2007). The R Book. New York, Wiley. | ||
+ | |||
+ | Burnham, K.P. & Anderson, D.R. (2002). Model selection and multimodel inference. A practical information - theoretic approach. Springer, New York. | ||
+ | |||
+ | Turkman, M. & Silva, G. (2000). Modelos Lineares Generalizados - da teoria à prática, Universidade Técnica de Lisboa. | ||
+ | |||
+ | =====Citação===== | ||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | |||
+ | Moraes, P.E. 2014. Entendendo os Modelos Lineares Generalizados (GLMs). In: Prado , P.I & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// | ||
+ | |||
+ | |||
+ | |||