Distribuciones de probabilidad con SPSS
Índice del Artículo
Curva Normal en Histograma de Frecuencias
El comando ‘Frecuencias’ del menú ‘Descriptivos’, proporciona desde un punto de vista gráfico el histograma de frecuencias con la curva normal o campana de Gauss superpuesta sobre la distribución de la variable, además de los descripticos básicos (media, desviación típica y tamaño muestral), en la parte superior derecha.
Kolmogorov-Smirnov de 1 muestra
El test de Kolmogorov-Smirnov nos brinda una manera alternativa (y quizá más ortodoxa) de llevar a cabo la prueba de normalidad para justificar un modo de proceder paramétrico en posterior análisis estadísticos (como la T de Student, Tabla ANOVA, etc) a través de la corrección de Lilliefors, además de proporcionarnos otras pruebas de distribuciones como la Poisson para variables discretas (ejemplo: número de llegadas a la caja de un supermercado o estación de bus, tren, aeropuerto, etc), o las distribuciones de tipo continuo más relevantes, como la Uniforme (distribución equiprobable de los valores), o la Exponencial (tiempo de espera de esas llegadas).
Test de Normalidad con comando Explorar: opción Gráficos
Se cumple el supuesto de normalidad si el test de normalidad de Shapiro-Wilk el más conveniente para muestras menores de 30 observaciones, no resulta estadísticamente significativo, o si el valor de probabilidad asociado al estadístico de Kolmogorov-Smirnov-Lilliefors (muestras mayores de 30 casos), es mayor de 0.05, y por tanto se puede actuar de un modo paramétrico de cara a los contrastes de hipótesis a llevar a cabo.
Pruebas no paramétricas
Dentro de las Pruebas no paramétricas de una muestra para constatar las distribuciones de frecuencias por las que se rigen (o se aproximan) los datos, tenemos funciones de probabilidad discretas como la Binomial, basada en en n experimentos independientes donde se estudia el número de éxitos con probabilidad constante, o distribuciones continuas como la Chi-cuadrado, además de la prueba de rangos con signo de Wilcoxon (medianas) y el test de rachas para corroborar aleatoriedad de la muestra.
Transformar: Calcular variable (CDF acumulada)
A partir de la función CDF se puede obtener la expresión numérica del valor de la distribución de probabilidad en concreto (en captura de ejemplo, la distribución Uniforme).
Regresión
Se trata de generar el gráfico de la regresión que mejor se ajuste a los datos, empezando por el de regresión lineal simple, en el ejemplo el gráfico de regresión de los residuos tipificados muestra un R2 cuadrático que explica el 78.2% de la variabilidad de la variable de respuesta:
Gráfico de Dispersión (Regresión Lineal Simple)
Gráfico de dispersión en ventana de resultados de SPSS: