Formación en Minitab 21
Índice del Artículo
Análisis Descriptivo
Histograma de frecuencias de la variable continua IMC segmentado por variable dicotómica complicación intrahospitalaria:
Gráficos de Barras
Histograma con más de 1 variable
La forma de generar un Histograma con más de 1 grupo en Minitab 21, nos proporciona además de la curva normal asociada a la distribución de los datos, los estadísticos básicos para el análisis descriptivos de las muestras.
Histograma con curva normal y líneas de referencia
Histograma con curva normal con líneas de referencia para representar los límites de especificación (o también pueden ser los límites de control sobre los que se pretenda que se mueva la variabilidad de nuestro proceso), como líneas verticales sobre la campana de Gauss de la curva normal.
Resumen gráfico
Mapa de calor en función de la media
Mapa de calor de los días de estancia en función de la media de IMC:
Resaltar valores atípicos en la base de datos
Destacar en rojo en la tabla de nuestra base de datos ‘master’ los valores atípicos o outliers, que pueden llegar a desvirtuar el posterior resultado de los análisis estadísticos a llevar a cabo en nuestro estudio.
Gráfico de cajas y bigotes (Box-Plot)
Tenemos 3 casos atípicos (outliers) para la medición de la variable dependiente en estudio para el factor Cultivo 1, siempre asignados a causas especiales, los cuales pueden desvirtuar los resultados del/los análisis estadístico posterior/es.
TEST DE HIPÓTESIS. ANÁLISIS ESTADÍSTICO
Comprobar supuesto de Normalidad
Se rechaza el que los distribución de los datos se distribuye normalmente a partir valores de probabilidad asociada al estadístico de Anderson-Darling menores de 0,05.
Datos aleatorios que se distribuyen Normal
Generar datos aleatorios que se distribuyen normalmente, según una media y una desviación típica determinada, y tantas filas (casos) como desee el/la usuario/a.
t de Student
Comparativa de las medias de 2 muestras, siempre bajo el cumplimiento de normalidad y homocedasticidad, para intentar detectar posibles diferencias estadísticamente significativas.
Se muestran diferencias estadísticamente significativas en media entre las puntuaciones de la variable de respuesta para ambos grupos (t=3.58, p<0.001)
Welch
T de Student de comparativa de medias de 2 grupos ante violación grave del supuesto de homogeneidad de varianzas.
Homogeneidad de 2 varianzas
Para testear la Homocedasticidad entre 2 muestras en Minitab 21 se accede desde la cinta de opciones de ‘Estadísticas básicas’.
Contraste de proporciones
Se trata de comprobar si se puede hacer inferencia respecto a diferencias entre proporciones poblacionales a través de proporciones muestrales, esto es, casos favorables partido por casos posibles.
Test de Friedman
Test de Friedman para indagar influencia en la medición de la variable dependiente de un tratamiento por bloques aleatorizados.
Se rechaza la hipótesis nula al tratarse de un p-valor asociado al estadístico del contraste menor de 0,05 luego al menos uno de tres tipos de publicidad (tratamiento) tiene un efecto diferente. La mediana de las respuestas para la publicidad en periódico (Me=13.30) es sensiblemente mayor, por lo que podría resultar más efectiva que los otros tipos de publicidad.
ANOVA de 1 factor
Se trata de detectar diferencias estadísticamente significativas en la medición de una variable continua respecto a más de 3 grupos, a partir de un p-valor asociado a la tabla ANOVA menor de 0,05, y siempre partiendo de la comprobación de los supuestos de partida de normalidad y homocedasticidad.
Prueba de comparaciones múltiples de Games-Howell ante el incumplimiento del supuesto de partida de la tabla ANOVA de homocedasticidad u homogeneidad de varianzas:
ANOVA de 2 factores
Se trata de corroborar si cada factor por separado como efecto principal, además de la interacción de ambos factores se aprecia como estadísticamente significativa para la medición de la variable continua de respuesta. Siempre bajo el supuesto de partida de normalidad, además del de homogeneidad de varianzas u homocedasticidad, a partir del test de esfericidad de Bartlett:
Comparaciones múltiples Post-Hoc en Anova de 2 factores, siempre a partir de la significatividad de los componentes principales y/o de la interacción del los 2 factores.
Análisis de Correlaciones
Un coeficiente de correlación lineal de Pearson próximo a 1 o -1, denota mucha correlación lineal entre las 2 variables, directa e inversa, respectivamente. En Ciencias Sociales y Psicología, a partir de 0,5 (hasta 1), o de -0,5 (hasta -1), se empieza a considera un relación importante entre las variables del cruce.
Regresión Múltiple
Regresión múltiple con supuestos de partida de no multicolinealidad y estadístico de Durbin-Watson de independencia de los errores con valores entre 1 y 3, además de % de variabilidad explicada por el modelo a partir del R cuadrado a justado de la regresión
Regresión Logística Binaria
Si de lo que se trata es de analizar la probabilidad de ocurrencia de una variable dicotómica del tipo de ‘EXITUS’, ‘ENFERMO’, etc., en función de unos determinados factores o variables explicativas, del tipo numérico y/o dicotómico, los comandos de menú de regresión logística binaria en Minitab para acceder a este tipo de análisis estadístico son:
Se trata de establecer un modelo predictivo para la variable dependiente en función de los valores de la/s independiente/s, como ocurre en cualquier regresión, con la diferencia de que en este análisis, la variable de respuesta es probabilidad de ocurrencia de un evento dicotómico. Los resultados de la regresión logística en Minitab con la odd ratio, serían del tipo:
El factor colesterol resulta estadísticamente significativo, tener hipercolesterolemia aumente 5 (5,0078) veces la probabilidad de EXITUS (valor 1 de la dicotómica dependiente), a partir de los valores de la ODD RATIO.
CONTROL ESTADÍSTICO DE PROCESOS
Gráficas de Control
Gráfica de control Xbarra-R para muestras tamaño 5, basada en rangos (rango definido como la diferencia entre el valor máximo y mínimo de la muestra de los 5 casos), en Minitab 21. Si la muestra es mayor de 8, la gráfica sería la Xbarra-S, y está basada en las desviaciones típicas. ¿Es nuestro proceso estable en el tiempo?. Si se aprecian puntos, en cuanto medias de cada muestra (o rangos de cada muestra de 5), fuera de los límites de control que establece el algoritmo, puede indicar que el proceso se está descentrando. Si el valor de la media de los rangos supera el valor de los límites de especificación, por ejemplo +/-2, puede ser que tengamos demasiada variabilidad en el proceso, es decir no se está produciendo con la variabilidad adecuada. Ambos gráficos (medias y rangos) se miran de manera conjunta.
Capacidad
En este caso se considera relevante el cumplir el supuesto de normalidad en los datos de nuestras muestras, además de proporcionar los límites de especificación superior e inferior, además del valor objetivo.
Si el Pp es mayor que 1 (potencial) el proceso de fabricación que estamos desarrollando tiene unos buenos valores de capacidad, puedo fabricar conforme a mis tolerancias, es decir conforme a mis límites de especificación. Un Ppk mayor que 1 va más allá en cuanto a que las cosas se están haciendo bien. Si Pp y Ppk no son iguales, el proceso no está centrado.
Si el Ppk es menor que el Pp: tengo que reducir la variabilidad del proceso para ser capaz