Tips de Estadística 2024

Tips de Estadística 2024

Tips de Estadística 2024

Tips de Estadística 2024

 

Test de Normalidad

test de normalidad

 

T de Student 2 muestras relacionadas

 

WILCOXON

Test de Wilcoxon

 

Colinealidad. Problemas de multicolinealidad en modelo de ajuste de regresión múltiple.

La multicolinealidad es un término utilizado en estadística y econometría para describir la situación en la que 2 o más variables independientes en un modelo de regresión múltiple están fuertemente correlacionadas o correladas entre sí, por lo que podrían de alguna manera aportar información redundante.
La multicolinealidad puede causar varios problemas en el análisis de regresión de un modelo GLM, como:

  • Problemas de interpretación de coeficientes: Cuando las variables predictoras están altamente correlacionadas, puede volverse difícil discernir el efecto individual de cada variable sobre la variable dependiente.
  • Inestabilidad de los coeficientes: Pequeños cambios en los datos pueden llevar a grandes cambios en los coeficientes de regresión, lo que hace que los resultados sean menos confiables.
  • Aumento de la varianza de los coeficientes: Esto puede llevar a intervalos de confianza más amplios, lo que dificulta la precisión de las predicciones.
  • Problemas en las pruebas de hipótesis: Las pruebas de significancia individual de los coeficientes pueden volverse menos confiables.

Colinealidad en regresión múltiple

 

Bootstrapping

El ‘bootstrapping’ es una técnica estadística de remuestreo que se utiliza para estimar la distribución de una estadística de interés. La idea central del bootstrapping es generar múltiples muestras de tamaño igual al de la muestra original, seleccionando aleatoriamente observaciones con reemplazamiento.

El ‘bootstrapping’ es especialmente útil cuando no se conocen las propiedades estadísticas exactas de una estadística o cuando los métodos tradicionales son difíciles de aplicar. Proporciona una aproximación empírica de la distribución de una estadística basada en los datos observados.

Esta técnica es comúnmente utilizada en análisis estadísticos, validación de modelos y construcción de intervalos de confianza. Puede ser aplicada a diversas disciplinas, como la estadística, la econometría y el aprendizaje automático.

En el ejemplo se puede comprobar que tras la utilización de esta funcionalidad, las variables pasan a mostrar significatividad estadística de cara a la interpretación del modelo predictivo de regresión logística binaria:

 

Análisis de Correlación

El análisis de correlación es una técnica estadística que se utiliza para evaluar la relación entre 2 o más variables. El objetivo es medir la fuerza y dirección de la asociación entre las variables.

2 tipos comunes de coeficientes de correlación:

Coeficiente de correlación de Pearson (r): Mide la relación lineal entre dos variables continuas. El coeficiente varía de -1 a 1, donde -1 indica una correlación negativa perfecta, 0 indica ninguna correlación y 1 indica una correlación positiva perfecta. Un valor de 0.7, por ejemplo, indica una correlación fuerte, ya sea positiva o negativa (-0.7).

Coeficiente de correlación de Spearman (ρ): Mide la relación monotónica (no necesariamente lineal) entre dos variables de tipo ordinal (ejemplo: tipo Likert). Es útil cuando los datos no siguen una distribución normal o cuando existen posibles valores atípicos. Al igual que el coeficiente de Pearson, varía de -1 a 1.

Es importante destacar que la correlación no implica causalidad. Dos variables pueden estar correlacionadas sin que una cause la otra. Además, la correlación solo captura relaciones lineales, por lo que es posible que no detecte patrones más complejos.

 

Regresión Lineal Simple para dummies

Ajuste por modelo de regresión lineal simple con casi todos los matices a tener en cuenta de cara a plantear un modelo predictivo con un único factor explicativo:

REGRESION Lineal Simple para dummies

tipos de regresion no lineal en SPSS

 

Tablas cruzadas en ítems de respuesta múltiple

En SPSS (Statistical Package for the Social Sciences), la creación y análisis de ítems de respuesta múltiple se refiere a preguntas en las que los/as encuestados/as pueden seleccionar más de una opción como respuesta, por ejemplo en un cuestionario diseñado a través de Google Forms.

Se deben codificar las respuestas de manera que cada opción tenga un valor único (numérico entero). Por ejemplo, si la pregunta tiene opciones A, B y C, podrías asignar 1 a A, 2 a B y 3 a C.

respuestas múltiples en SPSS

 

Paramétrico versus no paramétrico

PARAMétrico VS NO PARAMÉTRICO

ANOVA de medidas repetidas

Modo de proceder paramétrico para establecer una comparativa de medias de varias muestras relacionadas/pareadas, cuando no se viola el cumplimiento del supuesto de normalidad en las mediciones.

anova de medidas repetidas

anova medidas repetidas

Test de Friedman

Comparativa de medianas o rangos promedio de varias muestras (condiciones) relacionadas/pareadas, cuando se viola el cumplimiento del supuesto de normalidad en las mediciones.

Test de Friedman