Distribución normal o campana de Gauss
La distribución normal o campana de Gauss fue utilizada por primera vez por Abraham de Moivre en un artículo del año 1733, como una respuesta a la problemática de la aproximación de la distribución binomial para tamaños muestrales grandes. Su resultado fue ampliado por Laplace (1812), en lo que se denomina Teorema de De Moivre-Laplace. Gauss justificó rigurosamente en 1809 su utilización, asumiendo una distribución normal de los residuos de una distribución de datos. El nombre de ‘campana de Gauss’ se ha asociado a la distribución normal porque tuvo mucha repecusión en su época, cuando analizaba resultados en Astronomía.
En variables cuantitativas-continuas (escala en SPSS), es la distribución que se presenta con mayor frecuencia y probabilidad, se puede llegar a afirmar que un suceso de la naturaleza cuando se repite un número muy grande de veces (tiende a infinito) se distribuye normalmente, por el teorema central del límite. Algunas características biológicas de los individuos siguen una distribución normal (pesos y alturas de personas adultas, presión arterial, errores aleatorios en muchas medidas de laboratorio en Bioestadística, etc). La normalidad está intimamente relaciona con la Simetría de la distribución, si la variable dependiente en estudio se acerca a la simetría 0, se puede intuir que tiende a distribuirse normalmente.
El proceso de tipificación, es un cambio de variable X a una variable Z, la cual se distribuye N(0,1) y está tabulada. Para tipificar dicha variable X, se resta su media, y se divide por la desviación típica.
Índice del Artículo
Tablas de la Normal (0,1)
El valor estándar recursivo de la distribución N(0,1) al 95% de nivel de confianza, o lo que es lo mismo, al 0.05 (5%) de nivel de significación, el que se utiliza normalmente en investigación, es de Z=1,96.
Valores exactos de la Normal (0,1) en Excel
Esta puede ser una manera de encontrar tanto los valores de probabilidad (percentiles) de la distribución normal a partir de valores tipificados, o encontrar esos propios valores a partir de probabilidades, sin necesidad de recurrir a tablas.
Test de Normalidad en SPSS
Como el valor de probabilidad asociado al estadístico del contraste es menor que 0,05, el test de normalidad resulta estadísticamente significativo, se rechaza el que los valores de la variable dependiente de respuesta sean normales, hay que proceder desde un punto de vista no paramétrico. Algunos investigadores consideran que a partir de un tamaño muestral lo suficientemente grande, se puede actuar de manera paramétrica, aún violando este supuesto de partida en pruebas como la comparativa de medias con la T de Student (2 medias) o la Tabla ANOVA (+ de 2 medias).
Test de Normalidad en STATGRAPHICS
Test de Normalidad en STATA
Ejemplo de comprobación del supuesto de la regresión de normalidad en los residuos o errores con el paquete estadístico-econométrico STATA.
Intuición de Normalidad en EXCEL
La normalidad en los datos en Excel se puede intuir a partir de valores del coeficiente de asimetría cercanos a 0, en el complemento ‘Análisis de Datos’ (activar en Opciones de Excel), en ‘Estadística Descriptiva.
Se puede intuir normalidad si las medianas se encuentran en el centro de la caja del diagrama Box-Plot para detectar los valores atípicos (outliers).
Test de Normalidad en MINITAB
Una muestra
Menú Estadísticas
Menú Gráfica de Probabilidad
El software estadístico y de capacidad de procesos MINITAB, suele trabajar con el estadístico de Anderson-Darling, y su p-valor asociado, para llevar a cabo la prueba de normalidad por defecto. Se puede obtener vía menú a partir de la opción ‘Gráfica de Probabilidad’. Para muestras menores de 50 (n<50), se considera más conveniente utilizar Ryan-Joyner, test parecido a Shapiro-Wilk de SPSS, Stata o Statgraphics, y que en el caso de resultar estadísticamente significativo, invita a un modo de proceder ‘no paramétrico’.
Varias muestras
No se puede rechazar la hipótesis de normalidad en ninguna de las 4 muestras en estudio, pues el valor de probabilidad asociado, es siempre mayor de 0,05 (5%), luego se procede desde un punto de vista paramétrico, con test como la T de Student o el ANOVA.