Regresión Logística Binaria con Minitab

Regresión Logística Binaria con Minitab

Regresión Logística Binaria con software Minitab

Se trata de obtener las probabilidades de ocurrencia de una variable de respuesta dicotómica, en función de los predictores, que pueden ser numéricos, nominales de tipo también dicotómico y categóricas cuyas categorías hay que recodificar en dicotómicas, mediante variables dummy, por ejemplo de una variable de 3 categorías generamos 3 variables dummies, en la que damos valor 1 si pertenece a la categoría en concreto, 0 para el resto. Este tipo de variables dependientes se consideran del tipo Binomial (éxito contra fracaso como convención), pueden ser del tipo de DEFECTUOSO versus NO DEFECTUOSO en un proceso de fabricación de piezas industriales, ENFERMO versus NO ENFERMO en Bioestadística, FUNCIONA una campaña de Marketing Digital o NO FUNCIONA, etc.

El Test de Hosmer-Lemeshow es la prueba más fiable en cuanto a bondad del ajuste, si resulta significativa, esto es, su p-valor asociado mayor que 0,05, se puede concluir con que tiene sentido el realizar un ajuste de regresión logística, siempre que el R cuadrado se considere lo suficientemente importante.

 

Predicción de la probabilidad de ocurrencia de la variable dependiente en Minitab

 

Predicción de la probabilidad de ocurrencia de la variable dependiente en Minitab, a partir de valores de configuración estimados/medidos por el usuario en un momento dado.

 

Regresión Logística con variables independientes categóricas recodificadas en dummies dicotómicas

 

La manera de conseguir que el Minitab realice la regresión logística binaria con variables dummies, esto es, recodificar una explicativa categórica de más de 2 categorías, en una dicotómica del tipo dummy (0 y 1), como se contempla en la captura de pantalla, en la que la variable ‘NIVEL’ tiene 3 valores (alto, medio, bajo), se recodifica en 3 variables nuevas que se crean, ‘ALTO’, ‘MEDIO’ y ‘BAJO’, de forma que si el caso/registro toma el valor ALTO, se le da el valor 1 a la primera y 0 para el resto:

regresión logistica recodificar en dummies con Minitab

 

Modelo logística con variables dummies

**IMPORTANTE: desactivar la casilla de 'Incluir el término constante en el modelo'.

variables significativas en modelo

Entrar a formar parte en el modelo de regresión aquellas variables cuyo p-valor asociado sea menor que 0,05 0 0,1, en funcion del alfa decidido para la investigación.

 

 

La relación de probabilidades indica que a partir de la medición, existe aproximadamente 1,4982 veces más probabilidades resultar defectuoso, valor del evento de respuesta binomial, que decidimos como 1 en la logística binaria, cuando definimos el modelo de ajuste de variable de respuesta categórico.

Todas las pruebas de bondad de ajuste son mayores que el nivel de significación de 0,05, no se puede rechazar el que se pueda llevar a cabo este modelo de regresión. El valor de Rindica que el modelo explica aproximadamente el 12,33% de la variabilidad en la variable respuesta. La prueba de Hosmer-Lemeshow no resulta estadísticamente .significativa

 

Bondad del Ajuste en Logística Binaria

Predicción de los valores con la regresión

 

Predecir los valores de la probabilidad de ocurrencia

 

Predecir los valores de la probabilidad de ocurrencia de la variable dependiente, a partir de valores que proporciona el usuario para las variables explicativas numéricas (predictores continuos), y las dicotómicas o dummies (predictores categóricos) del ajuste.

 

valores de predicción logística en Minitab

predicción para valores de probabilidad de defectuoso

La predicción para valores de probabilidad de defectuoso es del 70,19% (0,701997), una vez se ejecuta el modelo de predicción con los valores de las variables independientes de interés.