Minitab, software estadístico para Ingeniería
Índice del Artículo
DEPURACIÓN DE LA BASE DE DATOS
PRUEBA DE NORMALIDAD
La hipótesis nula es que los datos se comportan como una distribución Normal contra la alternativa de que no siguen tal función. En el caso de que el p-valor sea menor que el alfa, nivel de significación fijado por el investigador (por defecto de 0,05), se rechaza el que los valores de la variable continua de interés se distribuyen Normalmente. Existen procedimiento de transformación de datos, uno de ellos es estandarizar (tipificar), esto es, restar la media y dividir por la desviación típica cada valor de la variable para que, de esta manera, se cumpla la Normalidad. Otras operaciones que se utilizan pueden ser la de aplicar logaritmos, como puede ser el logaritmo neperiano, fácilmente revertible después la transformación con su inversa, la exponencial, además de algunas otras transformaciones.
La evidencia, en cuanto al p-valor, sostiene la hipótesis de que los datos provienen de una distribución Normal si esta probablidad es mayor que 0,1 al 90% de confianza, y de 0,05 al 95% de nivel de confianza, esto es, 5% de nivel de significación, probabilidad de rechazar la hipotesis nula de Normalidad siendo cierta, que se fija previamente en la investigación.
CAPACIDAD DE PROCESOS
Se debe garantizar el enfrentarnos a un proceso controlado, basado en la estabilidad y el que los valores de la variable dependiente en estudio tiendan a distribuirse de manera Normal, o se pueda hacer una transformación para que esto efectivamente ocurra.
DIAGNÓSTICO DE LOS PROCESOS
La variable dependiente continua en estudio es la Longitud. Lo que se trata es de comprobar si los valores de esta variable de entrada se encuentran bajo control estadístico en este proceso. El Gráfico de Corridas contrasta la hipótesis de Aleatoriedad de estas mediciones, lo que implicaría variaciones Normales en las causas comunes inherentes al proceso, en el caso de que no se rechaze dicho Test.
La línea discontinua central se corresponde con la Mediana y cada punto representa una observación muestral. Se estudia el valor correspondiente a cada p-valor para determinar si hay variaciones en el proceso, y si están dentro o fuera de los 4 parámetros de control estadístico. Si el p-valor de conglomerados (1) es mayor que 0,05, se concluye que no hay variación debida a los clusters., de lo contrario se puede llegar a la conclusión de que aparece un sesgo por errores de muestreo. Dentro de la causa de mezclas (2), como el p-valor es menor que 0,05, lo que induce a pensar que puede haber 2 o más procesos que presentan interacción entre sí, aunque habría que ser cautos respecto a esta conclusión, al estar la significancia muy próxima a 0,05, por lo que quizá sería conveniente repetir el Test aumentando el tamaño muestral. El tercer contraste sería el de las tendencias (3), en el caso de resultar significativo, podría denotar desgaste en las herramientas, fallo en el calibrado de la maquinaria o en el desempeño de los turnos de trabajo. El último Test, el cuarto, es el de la oscilación (4), esto es, puntos en la gráfica que suben y bajan de manera errante, un p-valos significativo podría inducir problemas en el calibrado de los aparatos o en el desempeño de los operarios.
CONTRASTES DE HIPÓTESIS
PARAMÉTRICOS
CONTRASTES DE HIPÓTESIS DE LA MEDIA CON VARIANZA POBLACIONAL CONOCIDA:
El contraste de media poblacional con varianza poblacional conocida, está basado en la distribución Normal Z. En el desplegable señalado de la captura del cuadro de diálogo, podemos definir si el contraste es bilateral, unilateral superior, o unilateral inferior, en función de la hipótesis de media que quiera contrastar el investigador cómo alternativa, el cual a su vez define el nivel de significación de la prueba.
Tanto si el estadístico de contraste cae en la región de rechazo o región crítica, o lo que es lo mismo, el p-valor asociado dicho estadístico es menor que 0,05 (el Alfa en concreto que se defina un principio) se rechaza la hipótesis nula de que la media es igual/menor o mayor a un determinado valor que se pretende contrastar. Lo contrario es decir que el p-valor sea mayor que 0,05 ó 0,01, y el estadístico de contraste se encuentre dentro de la región de aceptación, nos lleva a la conclusión de que no existen evidencias estadísticamente significativas rechazar esa hipótesis nula sobre la media.
CONTRASTES DE HIPÓTESIS DE LA MEDIA CON VARIANZA POBLACIONAL DESCONOCIDA:
En este caso, y al desconocer la varianza (desviación típica) poblacional, se recurre al estadístico del contraste de la T de Student, una vez se cumplen los supuestos de partida de Normalidad y homogeneidad de varianzas, de todos los contrastes parmátricos.
CONTRASTES DE HIPÓTESIS DE IGUALDAD DE MEDIAS PARA MUESTRAS INDEPENDIENTES:
Se rechaza la hipótesis nula en función de que el p-valor asociado al estadístico del contraste de la T de Student de diferencia de medias sea menor que 0,05 ó 0,01, según el nivel de significación alfa, fijado por el investigador. En caso de rechazo, las diferencias entre ambas muestras son estadísticamente significativas, resultados que se extrapolan a la población al hacer inferencia.
CONTRASTES DE HIPÓTESIS DE IGUALDAD DE MEDIAS PARA MUESTRAS DEPENDIENTES O PAREADAS:
CONTRASTES DE HIPÓTESIS DE PROPORCIONES:
El p-valor asociado al estadístico del test nos indica si existen diferencias significativas entre ambas proporciones poblacionales, siempre en el supuesto de ser menor que 0,05, esto es, con un nivel de confianza del 95%.
NO PARAMÉTRICOS
U de Mann-Whitney (2 muestras independientes)
Una vez se violan los supuestos paramétricos de Normalidad y/o homogeneidad de varianzas, se procede a realizar el Test de la U de Mann-Whitney, un contraste de igualdad de medianas (o de diferencias de medianas igual a 0, es lo misno), en el caso de tratarse de 2 muestras de datos de variables independientes. Nuevamente el p-valor nos expone si existen diferencias estadísticamente significativas o no en mediana entre ambos grupos, según sea menor o mayor que el valor del nivel de significación fijado, normalmente de 0,05.
Wilcoxon de 2 muestras dependientes
Se trata del equivalente a la T de Student cuando lo que se estudia es el antes y el después de la medición de una variable continua, para el caso de contrastes no paramétricos.
Kruskal-Wallis (equivalente no paramétrico al ANOVA)
En este caso, se trata de un Test de comparación de medianas, sobre la variable de respuesta Y previamente apilada en una sola columna. Si es estadísticamente significativo es porque, al menos un par de medianas, presentan diferencias significativas entre sí.
ANOVA DE UN FACTOR
Comparación de las medias poblacionales de una variable dependiente continua, que se presupone se distribuye Normalmente y de manera Homocedástica (varianzas homogéneas), con Prueba Post Hoc de Dunnett para comprobar si existen diferencias estadísticamente significativas respecto del grupo de control, que define previamente el investigador.
MODELO DE REGRESIÓN CON 2 FACTORES
Modelo con 2 factores en Minitab, contraste de hipótesis de influencia de los factores por separado (efectos principales) y como interacción sobre una medición de variable dependiente numérica, una vez se cumplen los supuestos de partida de Normalidad y Homocedasticidad.
En qué medida los 2 Factores por separado y su interacción influyen en la variable dependiente continua, una vez se cumplen los supuestos de partida del modelo de ajuste, esto es, el de Normalidad (Test A-D) en los errores y Homocedasticidad, o lo que es lo mismo, homogeneidad entre las varianzas, con la prueba de esfericidad de Bartlett.
Supuesto de partida de Normalidad de los residuos:
Como el p-valor asociado al estadístico de Anderson-Darlin es mayor que 0,05, se cumple el supuesto de partida del modelo de normalidad en los errores. Para tener más certeza estadística aún del cumplimiento de este supuesto, sería conveniente comprobarlo con el contraste de normalidad de Kolmogorov-Smirnov.
Test de Homocedasticidad:
El p-valor del test de esfericidad de Bartlett es mayor que 0.05, luego se cumple también el supuesto de partida de Homecadisticad u homogeneidad de las varianzas.
Tabla ANOVA
Los valores p asociados al primer y segundo factor resultan estadísticamente significativos, esto es, menores que 0,05. La mezcla de pintura y el operador que realiza el trabajo influyen, de manera independiente,respecto a la variable dependiente continua, en este caso dureza. No ocurre lo mismo con la interacción de ambos factores, cuya significancia de 0,926 no resulta significativa, o lo que es lo mismo, mayor que 0,05, luego no se puede rechazar la hipótesis nula de que la interacción no influye. El modelo ajustado explica el 69,28% de la variabilidad.
CHI-CUADRADO
Test Chi-cuadrado de independencia de variables categóricas, si el valor de la significancia es menor que 0,05, el contraste de independencia resulta estadísticamente significativo, por lo que hay relación entre las categorías del cruce de 2 variables nominales. Un residuo tipificado o estandarizado mayor a 1,96 en valor absoluto, implica un cruce de categorías que está afectando a los resultados, la diferencia entre los valores observados y los esperados es significativa.
Ho: Las 2 variables categóricas son independientes
versus H1: Existe algún tipo de relación entre X e Y
estamatica@gmail.com