Estadística con RStudio

Estadística con RStudio

Estadística con RStudio

Estadística con Rstudio

 

Cargar archivo Spss (o Excel)

Importar una base de datos del paquete estadístico SPSS, para trabajar con ella desde RStudio.

Summary

Nos proporciona los estadísticos descriptivos básicos.

Summary descriptivos básicos

Describe

Obtener los estadísticos Descriptivos básicos con comando Describe, después de cargar la librería Hmisc.

Descriptivos con comando Describe

 

Histograma

histograma de frecuencias

Dispersión paquete Psych

Se obtienen las medidas de dispersión desviación típica y rango, además de las de Asimetría y Kurtosis.

Medidas de Dispersión en Rstudio

 

Gráfico Box-Plot

Gráfico de caja y bigotes a partir de 3 variables de tipo escalar (numérico).

Box Plot en Rstudio

 

Cuartiles y Percentiles

Se obtienen a partir de la función QUANTILE.

Percentiles en Rstudio

 

Rango Intercuartílico (RI)

IQR (variable numérica)

 

Test de Normalidad

Test de Shapiro-Wilk para muestras menores de 30, sin necesidad de cargar librerías. Test de Kolomogorov-Smirnov-Lilliefors con tamaño muestral mayor de 30, con la librería «nortest».

Test de normalidad en Rstudio

 

T-test de 1 muestra

En primer lugar cargamos las librerías.

install.packages(«car»)
install.packages («nortest»)

library (car)
library (nortest)

attach (data)

T Test de 1 muestra en Rstudio

Regresión Lineal Simple con Gráfico de Dispersión

¿Cómo hacer el gráfico de dispersión en RStudio?

La regresión lineal se una técnica #estadística que permite estimar la relación entre dos variables: una independiente (predictora) y una dependiente (respuesta). En otras palabras, nos ayuda a hacer predicciones.

¿Por qué es útil?. Porque permite responder preguntas como:

  • ¿Cómo influye el número de horas de estudio en las calificaciones?
  • ¿Cómo afecta el precio de la gasolina al consumo mensual?
  • ¿Cómo influye la publicidad en las ventas?

Regresión Lineal Simple en RStudio

 

T de Student de 2 muestras independientes

T de Student con RStudio

 

ANOVA de 1 Factor

Una vez se comprueban previamente los supuestos de partida de normalidad y homocedasticidad:

ANOVA de un factor

Se aprecian diferencias estadísticamente significativas en medias en al menos 2 tipos de energía (grupos), a partir del p-valor asociado al estadístico F con un valor ínfimo (próximo a 0), y por tanto significativo al 5% y al 1% (nivel de confianza del 99%).

Post-Hoc ANOVA

Pruebas Post-Hoc de Tukey

Una vez la tabla ANOVA resulta estadísticamente significativa, se detectan las diferencias entre los pares de grupos con las pruebas de comparaciones múltiples. En el gráfico, si el intervalo de confianza incluye al 0, no se aprecian diferencias entre esas 2 muestras.