Diferencias en Diferencias con Stata (DIFF IN DIFF)
El método de las Diferencias en diferencias, es una técnica utilizada en Econometría que mide el efecto sobre la variable dependiente o de respuesta cuantitativa Y, de un tratamiento, en un determinado período en el tiempo. Un ejemplo de este modelo estadístico DIFF IN DIFF sería el de comprobar el impacto sobre una variable dependiente numérica, por ejemplo el peso, de un tratamiento específico (ejemplo: combinación de dieta y ejercicio) en un periodo de tiempo, un antes y un después.
Se trata de generar un modelo econométrico (equiparable a un ANOVA de 2 Factores con interacción) para indagar/comparar si el efecto de una determinada política, un tratamiento, ha surtido efecto, en cuanto que se ha producido un cambio en la variable de respuesta en estudio, y poder dar una magnitud de ese impacto, que vendrá definido de manera numérica por el estimador del coeficiente Beta de la interacción de tratamiento*tiempo, que ofrece la tabla del resultado de la regresión con Stata. Una posible aplicación, es la elaboración de programas públicos o privados de Formación, evaluación de políticas públicas para el fomento del empleo para su posterior implementación, si un determinado tratamiento ha surtido efecto con el tiempo, estudios observacionales, etc.
vídeo de Quantitative Shop
El modelo econométrico subyacente es de la forma:
Y*= β0 + β1*P + β2*T + α*(P*T) + ui
donde el α nos proporciona una medida del impacto o interacción del programa/tratamiento (P) en función del tiempo T, que es una variable dicotómica que refleja una medida tomada en un antes y un después.
El valor de β0 representa el valor medio de la variable dependiente de los individuos del grupo de control, antes del programa, es decir, cuando tanto el valor de la variable tratamiento P, como del tiempo T, son cero, esto es no se ha llevado a cabo el programa y estamos en el instante inicial.
Este modelo es equiparable a un ANOVA de 2 Factores, un factor tratamiento, un factor tiempo de exposición al tratamiento y la interacción de ambos, donde no es necesario realizar pruebas de comparaciones múltiples Post Hoc ya que ambos factores solo tienen 2 niveles.
STATA
Con el software econométrico STATA, podemos llevar a la práctica el modelo de regresión de las diferencias en diferencias, bien importando desde Excel, o copiando y pegando directamente en la ventana del editor de datos del programa.
ojo: El carácter de punto decimal es el punto en STATA, no la coma como en Excel, tened cuidado a la hora de importar!!!!!!!!!!!!!!.
Comandos de Stata para el modelo de regresión:
regress peso tiempo programa interacción
En los resultados de la regresión del modelo ‘diff in diff’ con Stata se observa que la interacción, esto es, el impacto, no resulta estadísticamente significativo al 95% de confianza (0,068<0,05), aunque si lo sería al 10% de nivel de significación (0,068<0,1) . Si hubiera resultado significativo al 5% o si el investigador/a trabaja con un nivel de confianza del 90%, la conclusión sería que el impacto del tratamiento (combinación de dieta, ejercicio y hábitos saludables) combinado con el tiempo (el antes y el después), ha llevado consigo una reducción de la variable de respuesta peso de 4,06 Kgs. Una posible solución es el probar a añadir más variables predictoras al ajuste, para tratar de conseguir que el p-valor asociado a la interacción/impacto resulte estadísticamente más pequeño en probabilidad de los valores 0,05 ó 0,01, al disminuir la desviación típica del error.
estamatica@gmail.com