Trucos y Tips de Estadística

Trucos y Tips de Estadística

Trucos y tips relacionados con la Estadística

 

Generar números aleatorios en función de una media y su desviación típica con MINITAB

 

trucos de estadística

 

Mediante esta secuencia de comandos de la barra de menús, se pueden generar números aleatorios para trabajar con contrastes de medias, varianzas o proporciones, así como con cualquier medición para lo análisis estadísticos. También tendría utilidad en la generación de valores de las variables, en torno a un valor central, para un simulacro de tabla dinámica o administración de escenarios en Excel.

 

Detectar y eliminar de ‘outliers’ (valores atípicos) con Minitab

 

valores atípicos con Minitab

 

Una vez finalizada la recogida de datos y definidas nuestras variables en estudios y su escala, se depura la base de datos, antes de proceder a realizar los correspondientes análisis estadísticos. Se selecciona la columna de la variable sobre la que se quieren conocer los valores atípicos y se accede con el botón derecho al menú contextual de la captura de pantalla de arriba. Se vuelve a seleccionar la columna, y con el botón derecho se eliminan los valores en rojo mediante los siguiente secuencia de comandos:

 

eliminar outliers con Minitab

 

Los valores atípicos u outliers son como los valores que están fuera del intervalo de lo normal en un análisis de sangre, se excluyen de nuestro análisis estadístico, en la fase depuración de la base de datos, para no incurrir en sesgos en los resultados y conclusiones de los test de hipótesis a contrastar.

 

Graficar distribuciones de probabilidad con Statgraphics y encontrar valores críticos sin necesidad de Tablas

Valores críticos en Tablas y graficar distribuciones

Graficar distribuciones de probabilidad

El software Statgraphics ofrece la opción de Graficar distribuciones de probabilidad, en la que el/la usuario/a introduce los parámetros de la distribución, además del nivel de confianza para obtener los valores críticos.

 

Gráfico Box-Plot para detectar valores atípicos y Test de Normalidad en JAMOVI

 

test de normalidad en Jamovi

Diagrama de caja y prueba de normalidad en JAMOVI

 

Resumen Tabla ANOVA en JAMOVI

Tabla ANOVA en JAMOVI

 

Recuperar cuadro de diálogo del último análisis estadístico en Minitab y SPSS

Atajo de teclado para recuperar último cuadro de diálogo en Minitab

Recuperar cuadro de diálogos de los últimos análisis estadísticos en Minitab Statistical Software, a través de vista ‘Navegador‘: CTRL+E (último cuadro de diálogo), barra de menú ‘Vista’+’Navegador’ todos los cuadros de diálogo generados en la sesión de Minitab.

Recuperar cuadro de diálogos últimos análisis estadísticos con Navegador

 

Recuperar últimos cuadros de dialogo a análisis estadístico con SPSS

 

Copiar formatos de valores de la variables o de tipo medida de variables en SPSS

Copiar formatos de valores y medidas de las variables en SPSS

 

Se pueden copiar los formatos de valores y medidas de las variables en SPSS, haciendo clic y botón derecho Copiar (CTRL+C) cuando aparece el menú contextual, seleccionando las casillas/celdas que se quieren pegar y CTRL+V. Es posible también copiar el formato de una única casilla en varias casillas a la vez en ‘Vista de Variables’.

 

Seleccionar varias tablas a copiar a la vez en Word de ventana de resultados de SPSS

Copiar varias tablas para Word en ventana de resultados de SPSS

 

Recodificar variables en Minitab

Recodificar en distintas variables en Minitab

 

Apilar/Desapilar columnas en Minitab

Apilar columnas en Minitab

En Minitab podemos dividir una columna de datos en varias (desapilar), o agrupar varias columnas en una sola columna (apilar) mediante esta opción, pues es la única manera de actuar a la hora de hacer determinados análisis estadísticos como los no paramétricos.

 

PERCENTILES en Minitab

Cálculo de percentiles en Minitab

 

Tablas de distribuciones de probabilidad como la Normal

tablas distribución Normal con Excel

Es posible encontrar lo valores correspondientes a un nivel de significación alfa de un contraste de hipótesis o de un intervalo de confianza, en el caso de realizar estos cálculos a mano, con esta sencilla fórmula para generar la tabla de distribución Normal con Excel, como ejemplo de la función de distribución más recurrente.

Funciones de probabilidad en Excel

 

Aplicar Test paramétricos si el tamaño muestral es mayor de 30

contrastes paramétricos si n>50

 

En este caso no hablamos de un truco, sino de un convenio aceptado por la mayoría de las personas que trabajan en Análisis Estadísticos y en trabajos como TFM, TFG, Abstract y Tesis Doctorales. Si el tamaño muestral es mayor de 30, y aunque la variable dependiente viole el supuesto de Normalidad, en cuyo caso lo más conveniente sería aplicar un Test no paramétrico, como es el caso de la U de Mann-Whitney como equivalente de la T de Student de muetras independientes, Wilcoxon como sustituto de la T de Student en muestras relacionadas, o Kruskal-Wallis en lugar de ANOVA. En esta situación especial, se puede proceder de una manera paramétrica, con el correspondiente Contraste, que se acaba de mencionar.

 

Contraste de 2 proporciones con Minitab

Contraste de % en Minitab

 

Siempre calculando la proporción muestral como casos favorables/ casos posibles, y como el p-valor asociado al contraste de proporciones es mayor de 0,05, no puede rechazarse la hipótesis nula de que las proporciones de los 2 grupos se comportan de manera parecida, lo cual puede ser debido a la escasez del tamaño muestral, pues desde un punto de vista descriptivo se comprueba que la % muestral del primer grupo es sensiblemente mayor que la del segundo grupo, lo que induce a pensar que con un tamaño muestral mayor, habría diferencias estadísticamente significativas en favor del primer porcentaje, siempre trabajando con 95% de confianza, fijado para la investigación.

 

T de Student de 2 muestras conociendo sus medias y DT

t de Student conociendo parámetros media y desviación típica con Minitab

Cómo llevar a cabo una comparativa de medias de muestras independientes a través del test de la t de Student conociendo parámetros media y desviación típica de ambas muestras (sin columnas de datos), con el software estadístico Minitab.

 

Tablas de frecuencias con SPSS

Ponderar casos con frecuencias absolutas en SPSS

 

Se recodifica en otra variable la marca de clase (valor central) de cada intervalo, y se construye la tabla de frecuencias con el comando ‘Ponderar casos’ del menú ‘Datos’ de SPSS, ponderando los casos mediante la columna de la frecuencia absoluta, número de veces que se repite cada valor de la variable, o del intervalo de la propia variable en estudio.

 

Conjuntos de respuesta múltiple en SPSS

Conjuntos de respuesta múltiple en SPSS

 

En el caso de tratarse de items por ejemplo dicotómicos de respuesta múltiple (se puede seleccionar más de una respuesta del desplegable de categorías de opción), el SPSS los trabaja de una manera especial, generando una variable conjunta de respuesta múltiple, que se puede cruzar con otras variables, por ejemplo, de tipo categórico como el género, grupos de edad, etc.

 

Arrastar archivo de Excel a SPSS para exportarlo directamente

Arrastrar archivo de Excel a SPSS directamente

 

ANOVA (teórico) de un factor con interpretación de la F

Tabla Anova a mano (a papel)

Tabla ANOVA gráficamente

Tabla ANOVA estadísticamente significativa, y captura de resultados de prueba Post Hoc de comparaciones múltiples de TUKEY con R-Commander. Los valores de probabilidad menores de 0,05 reflejan diferencias estadísticamente significativas en la comparativa de medias de cada par de tratamientos.

 

PRUEBAS POST-HOC DE COMPARACIONES MÚLTIPLES TRAS ANOVA SIGNIFICATIVO:

Pruebas Post Hoc de comparaciones múltiples del ANOVA

 

3 maneras de resolver un Contraste para la media poblacional de la T de Student

Contraste de hipótesis de media desde un punto de vista teórico

El test no resulta estadísticamente significativo, por un lado el estadístico del contraste se encuentra fuera de la Región Crítica de rechazo de la hipótesis nula (o lo que es lo mismo, dentro de la Región de Aceptación), el valor que se quiere contrastar del parámetro media poblacional está dentro del intervalo de confianza al 95%, y el p-valor es mayor que el nivel de significación (0,05 o 5%), es decir, la prueba no es estadísticamente significativa, luego no hay evidencias para rechazar la hipótesis nula de que la media es igual (o no es mayor) de 24, siempre trabajando al 95% de nivel de confianza, fijado para la investigación.

*se contrasta a partir de la t de Student pues la varianza poblacional es desconocida

Contraste de comparativa de medias desde un punto de vista teórico

Tipos de Error en test estadísticos

Tipos de Error estadístico

 

Técnicas BOOTSTRAP (SIMULAR MUESTREO)

Bootstrap en SPSS

En ausencia de otra información sobre la población en estudio, para hacer inferencia de lo muestral a lo poblacional, la distribución empírica de una muestra aleatoria de tamaño n de dicha población es la mejor representación de la distribución de la misma. La muestra observada se toma como modelo de la distribución desconocida. Para mejorar el conocimiento de la distribución real la técnica bootstrap realiza muestreos con reemplazamiento, teniendo en cuenta la distribución empírica, es decir se ‘remuestrea’ con reemplazamiento entre los valores de las observaciones/casos muestrales.

 

Aproximación de la Binomial a la Poisson. Aproximación de la Binomial a la Normal

Aproximación de la Binomial por la Normal

Si el n es lo suficientemente grande y la p, lo suficientemente pequeña, y ante la imposibilidad de encontrar estos valores extremos en la tabla de la distribución Binomial, se puede aproximar por la distribución Poisson (en ambos casos se trata de distribuciones discretas). Se suele aceptar el convenio de la aproximación de la Binomial por la Normal (continua), si el producto de los parámetros n y p, o lo que es lo mismo, np>5. El n es el tamaño de las muestras independientes de un suceso dicotómico de tipo Binomial, el p, la probabilidad de éxito, constante. El número de llegadas a una estación de bus, a un aeropuerto o a la caja de unos grandes almacenes, se distribuye de manera Poisson, en general, mientras que el tiempo en atenderlos, se distribuye Exponencial. Cuando un suceso se repite un número muy grande de veces (tiende a infinito), por el teorema central del límite, tiende a distribuirse como la campana de Gauss de una distribución Normal.

Aproximación de la Binomial por la Normal con np>5

 

estamatica@gmail.com