GLM con variable dicotómica en SPSS
Al llevar a cabo un GLM (General Linear Model), lo que se trata de predecir los valores de la variable dependiente continua (numérica) Y en función de los valores de varias variables independientes o predictoras (X1, X2, X3…, al menos una de ellas dicotómica/binaria). Los supuestos de partida son los de no multicolinealidad (que no aporten información redundante) entre las variables independientes, normalidad en la variable dependiente, e independencia de los errores, esto últimos lo testeamos con el estadístico de Durbin–Watson (valores entre 1 y 3).
Regresión Múltiple con variable independiente dicotómica en Excel
En primer lugar, en la cinta de opciones Archivo, accedemos a ‘Opciones’, para poder añadir el complemento ‘Análisis de Datos’, que aparecerá al final de la barra de menú ‘Datos’, y desde el cual, podremos realizar múltiples análisis estadísticos a través de Microsoft Excel:
Se procede a realizar el análisis estadístico de regresión múltiple, una vez se introducen o se exportan los valores de las variables de cara al análisis, se trabaja con la opción Análisis de Datos, como en cualquier Análisis Estadístico (nota: también se puede hacer añadiendo al Excel el plug-in RealStats).
Los coeficientes de regresión simbolizan el aumento (Betas mayor que 0) o decremento (menor que 0) en la variable dependiente, cuando la independiente se aumenta en una unidad, permaneciendo el resto de las variables explicativas como constantes. El p-valor asociado al estadístico de contraste de la T de Student define la validez de la variable de cara a aportar como regresora (predictora) del modelo/ajuste de regresión, en caso de ser menor que 0,05; lo que coincide con que el propio estadístico, caiga en la región de rechazo, esto es fuera del valor crítico que marca el valor de la propia T en las tablas, con n-k-1 grados de libertad, donde k viene representado por el número de variables explicativas en el Análisis de Regresión.
En el caso de tratarse de 2 variables dicotómicas, se puede recurrir a la técnica econométrica del ‘matching‘, esto es, una especie de solapamiento/encaje por normalidad de la variable dependiente en ambas variables.
estamatica@gmail.com