Análisis Estadístico en Marketing
Índice del Artículo
Análisis Factorial
El Análisis Factorial se utiliza comunmente en Marketing, Sociología o Psicología, para comprobar la validez de una batería de Items (preguntas) sobre preferencias de los consumidores, una encuesta (por ejemplo con Google Survey) o un conjunto de respuestas o puntuaciones en escala Likert (ordinal) en torno a una componente o dimensión, validez del constructo, un primer acercamiento para detectar si nuestros items pueden llegar a considerarse como una escala de gestión del conocimiento, ya sea dentro de cada factor subyacente, o como un todo. En primer lugar se comprueba la asociación, relación o dependencia entre las variables mediante la Matriz de Correlaciones, requisito previo indispensable para llevar a cabo este análisis estadístico.
Se parte siempre del supuesto de Normalidad en los datos. El que las variables presenten correlaciones que sean significativas, nos proporciona la información de que las mismas se pueden explicar por factores comunes. El p-valor asociado debe ser próximo a 0.
- El valor del Determinante |D| de la matriz de correlaciones se debe aproximar a 0, lo que viene a indicar que las variables tienen correlaciones muy altas y se considera adecuado factorizar.
- Prueba de Esfericidad de Bartlett: Se contrasta el que la matriz de correlaciones es la identidad, si este Test es significativo, p-valor menor de 0.05, se puede afirmar que las variables están correladas y tiene sentido llevar a cabo un Análisis Factorial.
- Índice de Kaiser-Meyer-Oklin (KMO): La matriz de datos se considera factorizable si este coeficiente presenta valores superiores a 0.7, o lo que es lo mismo, se considera conveniente el llevar a cabo un Análisis Factorial.
- Criterio de Kaiser. Conservar aquellos factores, componentes o dimensiones que tengan autovalores (eigenvalue) superiores a la unidad. Otro criterio sería el de la proporción acumulada de varianza, en la que se consideran aquellos factores cuyo porcentaje acumulado de variabilidad esté por encima del 75-80%.
Con la Rotación Varimax se pretende gestionar una solución más sencilla e interpretable. Consiste en hacer girar los ejes de coordenadas que representan a los factores hasta conseguir que se saturen al máximo unas variables en unos ejes y otras en otros. Esta rotación ortogonal, maximiza la varianza de los factores, al mismo tiempo que tiende a minimizar el número de variables que tienen saturaciones altas en un determinado factor.
Detección de outliers (puntos raros) con el Gráfico Box-Plot, detección de casos aberrantes, para poder eliminar los casos que pueden desvirtuar los resultados del Análisis.
Análisis de Componentes Principales
Para llevar a cabo este tipo de análisis estadístico es condición sine qua non, el que las variables tienen que ser cuantitativas y tener correlación entre ellas. El eigenvalue mayor que 1 (Kaiser) y el gráfico de sedimentación (‘donde hace codo’) nos determinan el número de componentes a retener.
Análisis de Conglomerados
Los centroides nos dan información detallada de los clusters, para poder etiquetar o caracterizar los datos. El Dendograma nos proporciona, y siempre según el método de clasificación seleccionado previamente(por ejemplo, Ward), una manera gráfica de interpretar la formación de dichos conglomerados.
Análisis Discriminante
Estudio de clasificación de los casos respecto de una variable dependiente categórica, con las independientes cuantitativas. Cuanto más bajo sea la Lambda de Wilks, mejor será la discriminación del Análisis. El coeficiente Eta cuadrado (η2), se puede equiparar al R cuadrado de la regresión (coeficiente de determinación) entre la variable categórica y las variables independientes clasificadoras.
Análisis de Correspondencias
El objetivo es intentar establecer relaciones entre variables categóricas, a partir de las distancias euclídeas, generando un mapa perceptual, para analizar las asociaciones entre esas variables del tipo nominal.