historico:2014:ensaios:raices
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anteriorRevisão anterior | |||
historico:2014:ensaios:raices [2014/10/24 16:29] – julia.raices | historico:2014:ensaios:raices [2022/11/24 14:12] (atual) – edição externa 127.0.0.1 | ||
---|---|---|---|
Linha 1: | Linha 1: | ||
+ | ====== Mini-Ensaio sobre Verossimilhança ====== | ||
+ | === Júlia Raíces === | ||
+ | * Departamento de Genética e Biologia Evolutiva - Instituto de Biociências - USP | ||
+ | * julia.raices@gmail.com | ||
+ | |||
+ | |||
+ | "// | ||
+ | - Fernando < | ||
+ | |||
+ | |||
+ | ===== Introdução ou Verossimilho-quê? | ||
+ | |||
+ | |||
+ | Em geral, durante nossa formação como cientistas (e também como não-cientistas), | ||
+ | |||
+ | |||
+ | Nesse momento, é importante fazer algumas ressalvas: A ideia de que as distribuições serão sempre gaussianas, vem do teorema contral do limite, que especifica que a distribuição das médias das amostras tende a uma distribuição gaussiana, a medida que os ensaios tendem ao infinito. Porém, esse teorema nem sempre é aplicável, e embora possa ser verdade para as médias nem sempre o é para os dados em si, por exemplo em distribuições não simétricas, | ||
+ | |||
+ | |||
+ | A verossimilhança vem nos falar sobre nossas hipóteses e dados e modelos e parâmetros de uma outra perspectiva que pensa que vários modelos podem ser usados para explicar aqueles dados e que algum (ou alguns) desses modelos será mais verossímil ((O [[http:// | ||
+ | |||
+ | |||
+ | Antes de chegarmos ao cálculo de fato da verossimilhança algumas outras questões precisam ser elucidadas. A primeira delas é a Lei de Verossimilhança, | ||
+ | |||
+ | |||
+ | Por fim, a função de verossimilhança é a função de densidade do modelo na qual a observação (dados) é fixa e o parâmetro é variável $\mathcal{L}${hipótese | dados} (Batista, 2009), e pode assim obter valores muito diferentes para modelos diferentes, tornando difícil a comparação. Quando analisamos uma função de verossimilhança o que buscamos encontrar é o melhor (ou os melhores) parâmetro para aquele conjunto de dados, e para isso basta maximizar a função de verossimilhança: | ||
+ | |||
+ | |||
+ | Assim como na abordagem clássica havia um intervalo de confiança no qual a probabilidade da hipótese testada era mais alta, na abordagem por verossimilhança temos um intervalo de verossimilhança dentro do qual os valores do parâmetro são igualmente verossímeis. Tais intervalos são muito importantes pois toda predição tem incertezas associadas (Bolker, 2008), e ao criarmos um intervalo de valores possív | ||
+ | eis tornamos essas incertezas menores (pois tem mais valores que consideramos possíveis). | ||
+ | |||
+ | |||
+ | ===== A função de Log-Verossimilhança Negativa ===== | ||
+ | |||
+ | Como já mencionado na seção anterior, a verossimilhança pode vir em escalas muito grandes e diferentes para diferentes modelos, dificultando a sua manipulação e comparação para decidir sobre o uso de um ou outro modelo ou parâmetros (Batista, 2009). Além disso, trabalhar com logaritmos é matematicamente mais fácil, mas não obrigatoriamente mais fácil para pessoas não-matemáticas (( mas não se preocupe, números menores mas maiores que 1 são mais fáceis pra todo mundo e é só isso que o log vai fazer)). Assim, a função logarítmica com base e((sim, e é um número, que é aproximadamente 2.718281828 )), ou logaritmo natural (ou logaritmo neperiano), é usada na sua função de verossimilhança para tornar os valores mais palpáveis, ficando assim: $$ log[\mathcal{L}(hipótese | dados)] $$ depois disso, é só colocar um sinal de menos na frente e temos a função de log-verossimilhança negativa: $$ -log[\mathcal{L}(hipótese | dados)] $$ | ||
+ | |||
+ | |||
+ | Tornar a função negativa implica que agora vamos buscar o mínimo da função de log-verossimilhança negativa (Batista, 2009), pois antes | ||
+ | estavamos buscando o máximo da função de verossimilhança. Em geral, como a verossimilhança é um número (em geral!) positivo menor que um, a log-verossimilhança negativa vai ser um número positivo maior que um, tornando a manipulação desses números muito mais fácil (mesmo pra quem não é matemática). | ||
+ | |||
+ | |||
+ | ===== Massa, mas como eu uso isso? ou Aplicações Práticas (ou nem tanto) ===== | ||
+ | |||
+ | Uma possível aplicação prática na área de genética e expressão gênica para tais princípios e funções se relaciona a expressão de genes durante a espermatogênese de // | ||
+ | |||
+ | |||
+ | Por exemplo, nada impede que nos genes antigos tenhamos uma distribuição de Bernoulli, pois muitos genes tem expressão baixa ou zero, pois foram selecionados ao longo de muitas gerações para não serem expressos nessa fase, enquanto genes novos tem uma distribuição exponencial pois muitos deles são expressos nessa fase, pois ainda não passaram por amarras de seleção que diminuiriam a expressão de boa parte deles. | ||
+ | |||
+ | |||
+ | Uma outra aplicação (nem tão) prática muito interessante pode ser vista no campo da educação. A atribuição de notas a estudantes segue uma distribuição gaussiana também por questões filosóficas, | ||
+ | |||
+ | |||
+ | A concepção de que as notas atribuidas a estudantes não precisam seguir uma distribuição normal, pode ser um primeiro passo numa revolução muito neccessária ao sistema educacional atual. A noção de que não se trata de atribuir um modelo já criado ao nosso conjunto de dados (nesse caso o corpo estudantil e seus desempenhos), | ||
+ | |||
+ | |||
+ | ===== Referências bibliográficas ===== | ||
+ | |||
+ | Batista, J.L.F. 2009 Verossimilhança e Máxima Verossimilhança. | ||
+ | |||
+ | Bolker, B.M. 2008 Ecological Models and Data in R, Princeton: Princeton University Press. | ||
+ | |||
+ | Lewin-Koh N., Taper, M. L. & Lele, S. R. (2004). A brief tour of statistical concepts. *In:* The nature of scientific evidence (eds. ML Taper and SR Lele), University of Chicago Press. | ||
+ | |||
+ | |||
+ | ===== Citação ===== | ||
+ | |||
+ | Este ensaio é um produto de disciplina da pós-graduação da Universidade de São Paulo. Para citá-lo: | ||
+ | |||
+ | Raíces, J. 2014. Mini-Ensaio sobre Verossimilhança. In: Prado , P.I & Batista, J.L.F. Modelagem Estatística para Ecologia e Recursos Naturais. Universidade de São Paulo. url: http:// |