Análisis estadístico en TFM
Índice del Artículo
Análisis Descriptivo
Según se proceda desde un punto de vista paramétrico o no, en función del test de normalidad y de la prueba de homogeneidad de varianzas (homocedasticidad), los descriptivos a reflejar en el TFM son:
Test de Normalidad
Si el tamaño muestral es mayor de 30, el análisis estadístico de partida más conveniente para el TFM es la prueba de Kolmogorov-Smirnov-Lilliefors. En caso de no resultar estadísticamente significativo (p-valor>0,05), se puede proceder desde un punto de vista paramétrico con el contraste de hipótesis correspondiente. Para el caso de muestras pequeñas o piloto (n<30), se lleva a cabo el test de Shapiro-Wilks.
T de Student
Partiendo del cumplimiento del supuesto de normalidad (paramétrico), y con el ejemplo de una variable de respuesta continua del tipo de porcentaje (%), se establece una comparativa de medias entre los 2 grupos (muestras) que conforman la variable explicativa de respuesta (ejemplo: género):
Si el contraste resulta estadísticamente significativo (p-valor<0,05), a partir del p-valor asociado al estadístico de contraste de la t de Student, se concluye con que se aprecian diferencias estadísticamente significativas en media en la medición de la variable dependiente, en las 2 muestras.
U de Mann-Whitney
Partiendo del no cumplimiento del supuesto de normalidad (no paramétrico), y con el ejemplo de una variable de respuesta continua del tipo de porcentaje (%), se establece una comparativa de medianas entre los 2 grupos (muestras) que se extraen de la variable explicativa de respuesta (ejemplo: género):
Si el contraste resulta estadísticamente significativo (p-valor<0,05), a partir del p-valor asociado al estadístico de contraste de la U, se concluye con que se aprecian diferencias estadísticamente significativas en mediana o rangos promedio, en la medición de la variable dependiente, en las 2 muestras.
TABLA ANOVA
Siempre partiendo del cumplimiento de los supuestos de partida de Normalidad y Homocedasticidad (paramétrico) en las más de 2 muestras en las que se establece una comparativa de medias. En el caso de resultar estadísticamente significativo, se procede a realizar las correspondientes pruebas Post-Hoc de comparaciones múltiples:
Kruskal-Wallis
Siempre partiendo del cumplimiento de los supuestos de partida de Normalidad y Homocedasticidad (paramétrico) en las más de 2 muestras en las que se establece una comparativa de medianas o rangos promedio. En el caso de resultar estadísticamente significativo, se procede a realizar las correspondientes pruebas Post-Hoc de comparaciones múltiples.
Regresión Múltiple
Se trata de establecer un modelo predictivo de la variable de respuesta dependiente, a partir de las variables explicativas continuas (numericas) y/o dicotómicas, además de la influencia de cada variable independiente a partir de los valores de la coeficientes Beta, en el caso que dichos parámetros resulten estadísticamente significativos:
Siempre partiendo del cumplimiento de los supuestos de partida de no multicolinealidad (variables independientes no aportan información redundante), e independencia de los errores.
Regresión Logística Binaria
Determinar la probabilidad de ocurrencia de una variable dependiente dicotómica, en función de variables predictoras continuas-numéricas, variables dicotómicas, y variables categóricas recodificadas en dummies (dicotómicas). A partir de los valores de la ODD RATIO de cada variable, determinar el grado de influencia de esa variable explicativa en la probabilidad de ocurrencia del suceso dicotómico en estudio (mortalidad o probabilidad de contraer una enfermedad a partir de comorbilidades en Bioestadística, falla en una pieza en un proceso de fabricación, etc).
Contraste de % (proporciones o porcentajes)
Comparativa de proporciones o porcentajes en muestras independientes o muestras relacionadas (medición en un antes=PRE y un después=POST.