Estimación de máxima verosimilitud
La estimación de máxima verosimilitud (EMV) es un enfoque para estimar parámetros para un modelo. Es uno de los aspectos centrales de la teoría de respuesta al ítem (TRI), especialmente para estimar parámetros del ítem (analizar preguntas) y estimar parámetros de la persona (puntuación). Este artículo proporcionará una introducción a los conceptos de EMV.
Contenido
- Historia de la estimación de máxima verosimilitud
- Definición de estimación de máxima verosimilitud
- Comparación de verosimilitud y probabilidad
- Cálculo de la estimación de máxima verosimilitud
- Características clave de la estimación de máxima verosimilitud
- Debilidades de la estimación de máxima verosimilitud
- Aplicación de la estimación de máxima verosimilitud
- Resumen sobre la estimación de máxima verosimilitud
- Referencias
1. Historia de la estimación de máxima verosimilitud
Aunque las primeras ideas sobre EMV aparecieron a mediados de la década de 1700, Sir Ronald Aylmer Fisher las desarrolló en un concepto más formalizado mucho más tarde. Fisher trabajó seminalmente en máxima verosimilitud desde 1912 hasta 1922, criticándose a sí mismo y produciendo varias justificaciones. En 1925, finalmente publicó “Métodos estadísticos para trabajadores de investigación”, uno de los libros más influyentes del siglo XX sobre métodos estadísticos. En general, la producción del concepto de máxima verosimilitud ha sido un gran avance en estadística.
2. Definición de estimación de máxima verosimilitud
Wikipedia define EMV de la siguiente manera:
En estadística, la estimación de máxima verosimilitud es un método para estimar los parámetros de una distribución de probabilidad asumida, dados algunos datos observados. Esto se logra maximizando una función de verosimilitud de modo que, bajo el modelo estadístico asumido, los datos observados sean los más probables. El punto en el espacio de parámetros que maximiza la función de verosimilitud se denomina estimación de máxima verosimilitud.
Merriam Webster tiene una definición ligeramente diferente para EMV:
Un método estadístico para estimar parámetros de población (como la media y la varianza) a partir de datos de muestra que selecciona como estimaciones aquellos valores de parámetros que maximizan la probabilidad de obtener los datos observados.
En resumen, EMV es un método que detecta los valores de los parámetros de un modelo. Estos valores de los parámetros se identifican de manera que maximicen la probabilidad de que el proceso diseñado por el modelo haya producido los datos que realmente se observaron. En pocas palabras, EMV responde a la pregunta:
¿Para qué valor de parámetro los datos observados tienen la mayor probabilidad?
3. Comparación de verosimilitud y probabilidad
Las definiciones anteriores contienen “probabilidad”, pero es importante no mezclar estos dos conceptos diferentes. Veamos algunas diferencias entre probabilidad y verosimilitud, para que puedas diferenciarlas.
Verosimilitud |
Probabilidad |
Se refiere a los eventos ocurridos con resultados conocidos. | Se refiere a los eventos que ocurrirán en el futuro. |
Las verosimilitudes no suman 1. | Las probabilidades suman 1. |
Ejemplo 1: Lancé una moneda 20 veces y obtuve 20 caras. ¿Cuál es la probabilidad de que la moneda sea justa? | Ejemplo 1: Lancé una moneda 20 veces. ¿Cuál es la probabilidad de que la moneda caiga cara o cruz cada vez? |
Ejemplo 2: Dados los resultados fijos (datos), ¿cuál es la verosimilitud de que haya valores de parámetros diferentes? | Ejemplo 2: Se da el parámetro fijo P = 0,5. ¿Cuál es la probabilidad de que se obtengan resultados diferentes? |
4. Cálculo de la estimación de máxima verosimilitud
La EMV se puede calcular como una derivada de una verosimilitud logarítmica en relación con cada parámetro, la media μ y la varianza σ2, que se iguala a 0. Hay cuatro pasos generales para estimar los parámetros:
- Solicitar una distribución de los datos observados
- Estimar los parámetros de la distribución utilizando la verosimilitud logarítmica
- Pegar los parámetros estimados en la función de probabilidad de una distribución
- Evaluar la distribución de los datos observados
5. Características clave de la estimación de máxima verosimilitud
- EMV opera con datos unidimensionales
- EMV utiliza solo datos “limpios” (p. ej., sin valores atípicos)
- EMV suele ser manejable computacionalmente
- EMV suele ser en tiempo real en las computadoras modernas
- EMV funciona bien para casos simples (p. ej., distribución binomial)
6. Debilidades de la estimación de máxima verosimilitud
- EMV es sensible a los valores atípicos
- EMV a menudo exige optimización de la velocidad y la memoria para obtener resultados útiles
- EMV a veces es deficiente para diferenciar entre modelos con distribuciones similares
- EMV puede ser técnicamente desafiante, especialmente para datos multidimensionales y modelos complejos
7. Aplicación de la estimación de máxima verosimilitud
Para aplicar EMV, se deben realizar dos supuestos importantes (generalmente denominados supuesto i.i.d.):
- Los datos deben distribuirse independientemente, es decir, la observación de cualquier punto de datos dado no depende de la observación de ningún otro punto de datos (cada punto de datos es un experimento independiente).
- Los datos deben estar distribuidos de forma idéntica, es decir, cada punto de datos se genera a partir de la misma familia de distribución con los mismos parámetros.
Consideremos varias aplicaciones mundialmente conocidas de EMV:
- Sistema de posicionamiento global
- Programas de teclado inteligente para sistemas operativos iOS y Android (p. ej., Swype)
- Programas de reconocimiento de voz (p. ej., el reconocedor de voz de código abierto SPHINX de Carnegie Mellon, Dragon Naturally Speaking)
- Detección y medición de las propiedades del bosón de Higgs en la Organización Europea para la Investigación Nuclear (CERN) mediante el Gran Colisionador de Hadrones (Francois Englert y Peter Higgs recibieron el Premio Nobel de Física en 2013 por la teoría del bosón de Higgs)
En términos generales, la EMV se emplea en agricultura, economía, finanzas, física, medicina y muchos otros campos.
8. Resumen sobre la estimación de máxima verosimilitud
A pesar de algunos problemas funcionales con EMV, como desafíos técnicos para datos multidimensionales y modelos multiparamétricos complejos que interfieren en la solución de muchos problemas del mundo real, EMV sigue siendo un enfoque estadístico poderoso y ampliamente utilizado para la clasificación y estimación de parámetros. EMV ha traído muchos éxitos a la humanidad tanto en el mundo científico como en el comercial.
9. Referencias
Aldrich, J. (1997). R. A. Fisher and the making of maximum likelihood 1912-1922. Statistical Science, 12(3), 162-176.
Stigler, S. M. (2007). The epic story of maximum likelihood. Statistical Science, 598-620.
Laila Issayeva M.Sc.
Latest posts by Laila Issayeva M.Sc. (see all)
- Estimación de máxima verosimilitud - noviembre 12, 2024