Regresión Múltiple con variable independiente dicotómica

Regresión Múltiple con variable independiente dicotómica

 

GLM con variable dicotómica en SPSS

 

GLM con variable dicotómica con SPSS

 

Salidas SPSS de modelo GLM con variable dicotómica

 

Al llevar a cabo un GLM (General Linear Model), lo que se  trata de predecir los valores de la variable dependiente continua (numérica) Y en función de los valores de varias variables independientes o predictoras (X1, X2, X3…, al menos una de ellas dicotómica/binaria). Los supuestos de partida son los de no multicolinealidad (que no aporten información redundante) entre las variables independientes, normalidad en la variable dependiente, e independencia de los errores, esto últimos lo testeamos con el estadístico de DurbinWatson (valores entre 1 y 3).

 

Regresión Múltiple con variable independiente dicotómica en Excel

En primer lugar, en la cinta de opciones Archivo, accedemos a ‘Opciones’, para poder añadir el complemento ‘Análisis de Datos’, que aparecerá al final de la barra de menú ‘Datos’, y desde el cual, podremos realizar múltiples análisis estadísticos a través de Microsoft Excel:

 

opciones y complementos de Excel

Análisis de Datos con Excel

 

Se procede a realizar el análisis estadístico de regresión múltiple, una vez se introducen o se exportan los valores de las variables de cara al análisis, se trabaja con la opción Análisis de Datos, como en cualquier Análisis Estadístico (nota: también se puede hacer añadiendo al Excel el plug-in RealStats).

 

Opciones de Análisis estadísticos en Excel

 

Opciones de Análisis estadísticos en Excel

 

Los coeficientes de regresión simbolizan el aumento (Betas mayor que 0) o decremento (menor que 0) en la variable dependiente, cuando la independiente se aumenta en una unidad, permaneciendo el resto de las variables explicativas como constantes. El p-valor asociado al estadístico de contraste de la T de Student define la validez de la variable de cara a aportar como regresora (predictora) del modelo/ajuste de regresión, en caso de ser menor que 0,05; lo que coincide con que el propio estadístico, caiga en la región de rechazo, esto es fuera del valor crítico que marca el valor de la propia T en las tablas, con n-k-1 grados de libertad, donde k viene representado por el número de variables explicativas en el Análisis de Regresión.

 

 

Resultados GLM con Excel

 

En el caso de tratarse de 2 variables dicotómicas, se puede recurrir a la técnica econométrica del ‘matching‘, esto es, una especie de solapamiento/encaje por normalidad de la variable dependiente en ambas variables.

 

 

estamatica@gmail.com