Análisis estadístico en TFM (Trabajo de Fin de Master)

Análisis estadístico en TFM (Trabajo de Fin de Master)

Análisis de Datos Estadísticos en el TFM

Análisis estadístico en TFM

Análisis Descriptivo

Según se proceda desde un punto de vista paramétrico o no, en función del test de normalidad y de la prueba de homogeneidad de varianzas (homocedasticidad), los descriptivos a reflejar en el TFM son:

Análisis Descriptivo en TFM

Test de Normalidad

Test de Normalidad

Si el tamaño muestral es mayor de 30, el análisis estadístico de partida más conveniente para el TFM es la prueba de Kolmogorov-Smirnov-Lilliefors. En caso de no resultar estadísticamente significativo (p-valor>0,05), se puede proceder desde un punto de vista paramétrico con el contraste de hipótesis correspondiente. Para el caso de muestras pequeñas o piloto (n<30), se lleva a cabo el test de Shapiro-Wilks.

Distribución Normal

 

T de Student

Partiendo del cumplimiento del supuesto de normalidad (paramétrico), y con el ejemplo de una variable de respuesta continua del tipo de porcentaje (%), se establece una comparativa de medias entre los 2 grupos (muestras) que conforman la variable explicativa de respuesta (ejemplo: género):

T de Student para TFM

Si el contraste resulta estadísticamente significativo (p-valor<0,05), a partir del p-valor asociado al estadístico de contraste de la t de Student, se concluye con que se aprecian diferencias estadísticamente significativas en media en la medición de la variable dependiente, en las 2 muestras.

T de Student con JAMOVI

 

U de Mann-Whitney

Partiendo del no cumplimiento del supuesto de normalidad (no paramétrico), y con el ejemplo de una variable de respuesta continua del tipo de porcentaje (%), se establece una comparativa de medianas entre los 2 grupos (muestras) que se extraen de la variable explicativa de respuesta (ejemplo: género):

U de Mann-Whitney en TFM

Si el contraste resulta estadísticamente significativo (p-valor<0,05), a partir del p-valor asociado al estadístico de contraste de la U, se concluye con que se aprecian diferencias estadísticamente significativas en mediana o rangos promedio, en la medición de la variable dependiente, en las 2 muestras.

 

TABLA ANOVA

Siempre partiendo del cumplimiento de los supuestos de partida de Normalidad y Homocedasticidad (paramétrico) en las más de 2 muestras en las que se establece una comparativa de medias. En el caso de resultar estadísticamente significativo, se procede a realizar las correspondientes pruebas Post-Hoc de comparaciones múltiples:

Tabla ANOVA para TFM

Tabla ANOVA de comparación de medias con SPSS

 

Kruskal-Wallis

Siempre partiendo del cumplimiento de los supuestos de partida de Normalidad y Homocedasticidad (paramétrico) en las más de 2 muestras en las que se establece una comparativa de medianas o rangos promedio. En el caso de resultar estadísticamente significativo, se procede a realizar las correspondientes pruebas Post-Hoc de comparaciones múltiples.

TFM con Kruskal-Wallis

Kruskal Wallis comparaciones múltiples

 

Regresión Múltiple

Se trata de establecer un modelo predictivo de la variable de respuesta dependiente, a partir de las variables explicativas continuas (numericas) y/o dicotómicas, además de la influencia de cada variable independiente a partir de los valores de la coeficientes Beta, en el caso que dichos parámetros resulten estadísticamente significativos:

TFM con regresión múltiple (glm)

Siempre partiendo del cumplimiento de los supuestos de partida de no multicolinealidad (variables independientes no aportan información redundante), e independencia de los errores.

Regresión Múltiple en Excel

 

Regresión Logística Binaria

Determinar la probabilidad de ocurrencia de una variable dependiente dicotómica, en función de variables predictoras continuas-numéricas, variables dicotómicas, y variables categóricas recodificadas en dummies (dicotómicas). A partir de los valores de la ODD RATIO de cada variable, determinar el grado de influencia de esa variable explicativa en la probabilidad de ocurrencia del suceso dicotómico en estudio (mortalidad o probabilidad de contraer una enfermedad a partir de comorbilidades en Bioestadística, falla en una pieza en un proceso de fabricación, etc).

Regresión Logística en RStudio

 

Contraste de % (proporciones o porcentajes)

Contraste de %

Comparativa de proporciones o porcentajes en muestras independientes o muestras relacionadas (medición en un antes=PRE y un después=POST.

Test para comparar Proporciones (%) en Minitab