Propensity Score Matching con STATA
Índice del Artículo
¿Qué es Propensity Score Matching y para qué se utiliza?
Con un Análisis del tipo del Propensity Score Matching (o Análisis de Propensión por Emparejamientos) en Bioestadística, se trata de intentar aproximarse lo más posible desde un estudio observacional a un estudio aleatorizado, de ahí su denominación de análisis cuasi-aleatorizado. En Econometría, el PSM puede servir para discernir la evaluación de impacto. El PSM trabaja por coincidencia de vecinos más cercanos, evitando de esta manera el sesgo en los resultados de conservar todas las observaciones por grupo, solo tiene en cuenta aquellas que el algoritmo de emparejamiento considera más cercanas. Cada PSM es diferente en función de las variables independientes (se pueden utilizar dummies) que se utilicen en el modelo probit o logit. PSM es una manera de solucionar una situación en la que no se dispone de un diseño controlado y aleatorizado, con un grupo experimental y un grupo control, con medición pretest-postest.
Instalación en STATA
Copiar esta línea de código en la ventana de Comando del software estadístico STATA (funciona desde la versión 14, no he probado con versiones anteriores), para instalar la librería de Propensity Score Matching:
ssc install psmatch2, replace
PSMATCH2 implementa el emparejamiento completo de Mahalanobis, y una variedad de métodos de ‘emparejamiento de puntuación de propensión’ (PSM),para ajustar las diferencias observables entre un grupo de tratados (observaciones=1) y un grupo de no tratados (observaciones=0), o entre 2 tratamientos diferentes.
psmatch2 variable_dependiente_dicotómica Edad Sexo Comorbilidades
Los resultados son diferentes en cuanto a p-valor, valores de los coeficientes Beta, efectos marginales e incluso ODDS RATIO si se tratara de un modelo probit e incluso logístico (logit), si no tenemos en cuenta los emparejamientos (MATCHING) con el algoritmo del vecino más cercano.
Graficar PSM
psgraph
psmatch2 TRATAMIENTO EDAD SEXO, out(HTA) common
Comparativa de medias entre los tratamientos
pstest IMC
Se puede llevar a cabo una comparativa de medias de las variables continuas del estudio, a través de un Test como el de la T de Student, en función de los 2 tratamientos del Propensity Score Matching con STATA, donde se suelen detectar las diferencias estadísticamente significativas que no se encontraban al no evitar el sesgo, si no se utiliza esta técnica, esto es, al hacer la misma comparativa teniendo en cuenta todos los casos de nuestra base de datos.
PSM comandos de menú de STATA
*MUY IMPORTANTE: guardar al final de sesión los resultados de la hoja de trabajo en STATA como un archivo .log, o ir copiando resultados significativos en un procesador de texto como el Word.