Estadística con RStudio
Índice del Artículo
Cargar archivo Spss (o Excel)
Importar una base de datos del paquete estadístico SPSS, para trabajar con ella desde RStudio.
Summary
Nos proporciona los estadísticos descriptivos básicos.
Describe
Obtener los estadísticos Descriptivos básicos con comando Describe, después de cargar la librería Hmisc.
Histograma
Dispersión paquete Psych
Se obtienen las medidas de dispersión desviación típica y rango, además de las de Asimetría y Kurtosis.
Gráfico Box-Plot
Gráfico de caja y bigotes a partir de 3 variables de tipo escalar (numérico).
Cuartiles y Percentiles
Se obtienen a partir de la función QUANTILE.
Rango Intercuartílico (RI)
IQR (variable numérica)
Test de Normalidad
Test de Shapiro-Wilk para muestras menores de 30, sin necesidad de cargar librerías. Test de Kolomogorov-Smirnov-Lilliefors con tamaño muestral mayor de 30, con la librería «nortest».
T-test de 1 muestra
En primer lugar cargamos las librerías.
install.packages(«car»)
install.packages («nortest»)
library (car)
library (nortest)
attach (data)
Regresión Lineal Simple con Gráfico de Dispersión
¿Cómo hacer el gráfico de dispersión en RStudio?
La regresión lineal se una técnica #estadística que permite estimar la relación entre dos variables: una independiente (predictora) y una dependiente (respuesta). En otras palabras, nos ayuda a hacer predicciones.
¿Por qué es útil?. Porque permite responder preguntas como:
- ¿Cómo influye el número de horas de estudio en las calificaciones?
- ¿Cómo afecta el precio de la gasolina al consumo mensual?
- ¿Cómo influye la publicidad en las ventas?
T de Student de 2 muestras independientes
ANOVA de 1 Factor
Una vez se comprueban previamente los supuestos de partida de normalidad y homocedasticidad:
Se aprecian diferencias estadísticamente significativas en medias en al menos 2 tipos de energía (grupos), a partir del p-valor asociado al estadístico F con un valor ínfimo (próximo a 0), y por tanto significativo al 5% y al 1% (nivel de confianza del 99%).
Post-Hoc ANOVA
Una vez la tabla ANOVA resulta estadísticamente significativa, se detectan las diferencias entre los pares de grupos con las pruebas de comparaciones múltiples. En el gráfico, si el intervalo de confianza incluye al 0, no se aprecian diferencias entre esas 2 muestras.