Tutorial de Statgraphics

Tutorial de Statgraphics

tutorial Statgraphics

Tutorial de Statgraphics

Análisis Estadístico con Statgraphics

tutorial Statgraphics

 

El paquete estadístico Statgraphics es un software profesional especialmente diseñado para facilitar el análisis estadístico de datos  de forma avanzada, ya sea en el aspecto Descriptivo de los mismos, técnicas Multivariantes: Anovas, Factorial, Conglomerados, Correspondencias, Discriminante; así como Intervalos de Confianza, Contrastes de Hipótesis Paramétricos (T de Student, Levene de Homocedasticidad) y No Paramétricos (U de Mann-Whitney, Wilcoxon, Kruskal-Wallis), técnicas de Marketing, control de calidad, etc.

 

datos externos Statgraphics

Análisis de Correlaciones entre variables numéricas (continuas)

correlaciones Statgraphics

Si el p-valor asociado al cruce de las 2 variables es menor que 0,05, se concluye con que existe relación/asociación/dependencia lineal entre las 2 variables del cruce. El asterisco (*) también denota que el contraste de independencia es estadísticamente significativo. El grado de la relación viene dado por el coeficiente de correlación lineal de Pearson, entre [-1;1].

 

Regresión Múltiple (GLM de Econometría)

GLM con Statgraphics

Las variables independientes cuyo p-valor asociado sea menor que 0,05 son las que entrar a formar parte del modelo de predicción de la variable dependiente. El R2 determina la bondad del ajuste o proporción de variabilidad explicada por el modelo de regresión múltiple o GLM. Previamente a la regresión se comprueban los supuestos de partida o hipótesis subyacentes del modelo: linealidad (correlación de la dependiente con las independientes), independencia de los errores, y no multicolinealidad entre las variables predictoras.

 

Supuesto de Normalidad

Normalidad Statgraphics

En la práctica, Normalidad Multivariante suele implicar Normalidad Univariante. Si en el contraste de Shapiro- Wilk (muestras menores de 50) o en el de Kolmogorov-Smirnov con la corrección de Lilliefors (mayores de 50) alguna variable no cumple el supuesto de Normalidad (p-valor asociado<0,05),  se concluye con que no se cumplirá la Normalidad Multivariante, siempre como norma general.

 

ANOVA Multi

Anova Statgraphics

 

A partir de la comprobación de los supuestos de partida de Normalidad, Homocedasticidad y Aleatoriedad se trata de discernir si la media de la variable dependiente continua es la misma en los 3 grupos que conforma una de las variables independientes o primer factor, en los 2 o más grupos que forma el segundo factor (a ambos contrastes se les denomina Efectos Principales), y  además si la interacción de estos 2 factores es estadísticamente significativa. Posteriormente se realizan las Pruebas POST HOC para cada uno de los factores.

 

Análisis de Conglomerados-Clusters

El Análisis de Conglomerados o Cluster Analysis es un análisis estadístico multivariado de clasificación de registros o casos. Los elementos tienden a agruparse en en grupos homogéneos, lo que se conoce como clusters =conglomerados, en función una serie de características que pueden presentar en común (distancias). Así, los diferentes casos  que presentan características similares  se asignan a un mismo conglomerado y los distintos a diferentes cluster.

cluster con Stagraphics

Análisis de Componentes Principales

Como ya sucedía en el Análsis Factorial Exploratorio, se transforman un conjunto de variables cuantitativas correlacionadas entre sí, en otro grupo de variables más reducido, Componentes Principales, que retienen gran parte de la variabilidad de los datos, minimizando la pérdida de información de las variables originales.

 

aná lisis de componentes principales Statgraphics

Lo que se trata es de reducir unas cuantas variables de tipo continuo a unos pocos componentes que expliquen una proporción de variabilidad importante (70-80%), a partir del criterio de eigenvalue de Kayser de retener aquellas componentes cuyo autovalor sea mayor que 1. En el ejemplo, las altas puntuaciones en peso de los componentes respecto del primer factor, parece denotar que se trata de asignaturas relacionadas con el ámbito de las Letras, la segunda componente parece correlacionarse con asignaturas de tipo científico. Otro criterio sería conservar aquellas componentes o factores donde el Gráfico de Sedimentación ‘hace codo’.

 

Análisis de Correspondencias

Análisis discriminante

 

Con este tipo de Análisis en Statgraphics se pretende clasificar las categorías o grupos de una variable dependiente dicotómica o de 3 o más categorías a partir de las variables independientes clasificadoras, elaborando modelos de predicción a partir de las Funciones Discriminantes. El coeficiente de determinación eta cuadrado (cuadrado de la correlación canónica) de cada función discriminante expresa la proporción de variabilidad de cada variable dependiente expresada por las independientes clasificadoras. La Lambda de Wilks ofrece el poder discriminante de cada Función, proporción de varianza de las puntuaciones discriminantes no explicada por las diferencias entre los grupos. La Matriz de Clasificación de % de casos correctamente clasificados, expone la capacidad predictiva del modelo, es decir sirve para predecir el grupo (categoría) en que será clasificado un nuevo cliente.

 

estamatica@gmail.com

 

Summary
software image
Author Rating
1star1star1star1star1star
Aggregate Rating
5 based on 7 votes
Software Name
Statgraphics
Operating System
Windows
Software Category
Estadística