Trucos y tips relacionados con la Estadística
Índice del Artículo
Generar números aleatorios en función de una media y su desviación típica con MINITAB
Mediante esta secuencia de comandos de la barra de menús, se pueden generar números aleatorios para trabajar con contrastes de medias, varianzas o proporciones, así como con cualquier medición para lo análisis estadísticos. También tendría utilidad en la generación de valores de las variables, en torno a un valor central, para un simulacro de tabla dinámica o administración de escenarios en Excel.
Detectar y eliminar de ‘outliers’ (valores atípicos) con Minitab
Una vez finalizada la recogida de datos y definidas nuestras variables en estudios y su escala, se depura la base de datos, antes de proceder a realizar los correspondientes análisis estadísticos. Se selecciona la columna de la variable sobre la que se quieren conocer los valores atípicos y se accede con el botón derecho al menú contextual de la captura de pantalla de arriba. Se vuelve a seleccionar la columna, y con el botón derecho se eliminan los valores en rojo mediante los siguiente secuencia de comandos:
Los valores atípicos u outliers son como los valores que están fuera del intervalo de lo normal en un análisis de sangre, se excluyen de nuestro análisis estadístico, en la fase depuración de la base de datos, para no incurrir en sesgos en los resultados y conclusiones de los test de hipótesis a contrastar.
Graficar distribuciones de probabilidad con Statgraphics y encontrar valores críticos sin necesidad de Tablas
El software Statgraphics ofrece la opción de Graficar distribuciones de probabilidad, en la que el/la usuario/a introduce los parámetros de la distribución, además del nivel de confianza para obtener los valores críticos.
Gráfico Box-Plot para detectar valores atípicos y Test de Normalidad en JAMOVI
Resumen Tabla ANOVA en JAMOVI
Recuperar cuadro de diálogo del último análisis estadístico en Minitab y SPSS
Recuperar cuadro de diálogos de los últimos análisis estadísticos en Minitab Statistical Software, a través de vista ‘Navegador‘: CTRL+E (último cuadro de diálogo), barra de menú ‘Vista’+’Navegador’ todos los cuadros de diálogo generados en la sesión de Minitab.
Copiar formatos de valores de la variables o de tipo medida de variables en SPSS
Se pueden copiar los formatos de valores y medidas de las variables en SPSS, haciendo clic y botón derecho Copiar (CTRL+C) cuando aparece el menú contextual, seleccionando las casillas/celdas que se quieren pegar y CTRL+V. Es posible también copiar el formato de una única casilla en varias casillas a la vez en ‘Vista de Variables’.
Seleccionar varias tablas a copiar a la vez en Word de ventana de resultados de SPSS
Recodificar variables en Minitab
Apilar/Desapilar columnas en Minitab
En Minitab podemos dividir una columna de datos en varias (desapilar), o agrupar varias columnas en una sola columna (apilar) mediante esta opción, pues es la única manera de actuar a la hora de hacer determinados análisis estadísticos como los no paramétricos.
PERCENTILES en Minitab
Tablas de distribuciones de probabilidad como la Normal
Es posible encontrar lo valores correspondientes a un nivel de significación alfa de un contraste de hipótesis o de un intervalo de confianza, en el caso de realizar estos cálculos a mano, con esta sencilla fórmula para generar la tabla de distribución Normal con Excel, como ejemplo de la función de distribución más recurrente.
Aplicar Test paramétricos si el tamaño muestral es mayor de 30
En este caso no hablamos de un truco, sino de un convenio aceptado por la mayoría de las personas que trabajan en Análisis Estadísticos y en trabajos como TFM, TFG, Abstract y Tesis Doctorales. Si el tamaño muestral es mayor de 30, y aunque la variable dependiente viole el supuesto de Normalidad, en cuyo caso lo más conveniente sería aplicar un Test no paramétrico, como es el caso de la U de Mann-Whitney como equivalente de la T de Student de muetras independientes, Wilcoxon como sustituto de la T de Student en muestras relacionadas, o Kruskal-Wallis en lugar de ANOVA. En esta situación especial, se puede proceder de una manera paramétrica, con el correspondiente Contraste, que se acaba de mencionar.
Contraste de 2 proporciones con Minitab
Siempre calculando la proporción muestral como casos favorables/ casos posibles, y como el p-valor asociado al contraste de proporciones es mayor de 0,05, no puede rechazarse la hipótesis nula de que las proporciones de los 2 grupos se comportan de manera parecida, lo cual puede ser debido a la escasez del tamaño muestral, pues desde un punto de vista descriptivo se comprueba que la % muestral del primer grupo es sensiblemente mayor que la del segundo grupo, lo que induce a pensar que con un tamaño muestral mayor, habría diferencias estadísticamente significativas en favor del primer porcentaje, siempre trabajando con 95% de confianza, fijado para la investigación.
T de Student de 2 muestras conociendo sus medias y DT
Cómo llevar a cabo una comparativa de medias de muestras independientes a través del test de la t de Student conociendo parámetros media y desviación típica de ambas muestras (sin columnas de datos), con el software estadístico Minitab.
Tablas de frecuencias con SPSS
Se recodifica en otra variable la marca de clase (valor central) de cada intervalo, y se construye la tabla de frecuencias con el comando ‘Ponderar casos’ del menú ‘Datos’ de SPSS, ponderando los casos mediante la columna de la frecuencia absoluta, número de veces que se repite cada valor de la variable, o del intervalo de la propia variable en estudio.
Conjuntos de respuesta múltiple en SPSS
En el caso de tratarse de items por ejemplo dicotómicos de respuesta múltiple (se puede seleccionar más de una respuesta del desplegable de categorías de opción), el SPSS los trabaja de una manera especial, generando una variable conjunta de respuesta múltiple, que se puede cruzar con otras variables, por ejemplo, de tipo categórico como el género, grupos de edad, etc.
Arrastar archivo de Excel a SPSS para exportarlo directamente
ANOVA (teórico) de un factor con interpretación de la F
Tabla ANOVA estadísticamente significativa, y captura de resultados de prueba Post Hoc de comparaciones múltiples de TUKEY con R-Commander. Los valores de probabilidad menores de 0,05 reflejan diferencias estadísticamente significativas en la comparativa de medias de cada par de tratamientos.
PRUEBAS POST-HOC DE COMPARACIONES MÚLTIPLES TRAS ANOVA SIGNIFICATIVO:
3 maneras de resolver un Contraste para la media poblacional de la T de Student
El test no resulta estadísticamente significativo, por un lado el estadístico del contraste se encuentra fuera de la Región Crítica de rechazo de la hipótesis nula (o lo que es lo mismo, dentro de la Región de Aceptación), el valor que se quiere contrastar del parámetro media poblacional está dentro del intervalo de confianza al 95%, y el p-valor es mayor que el nivel de significación (0,05 o 5%), es decir, la prueba no es estadísticamente significativa, luego no hay evidencias para rechazar la hipótesis nula de que la media es igual (o no es mayor) de 24, siempre trabajando al 95% de nivel de confianza, fijado para la investigación.
*se contrasta a partir de la t de Student pues la varianza poblacional es desconocida
Tipos de Error en test estadísticos
Técnicas BOOTSTRAP (SIMULAR MUESTREO)
En ausencia de otra información sobre la población en estudio, para hacer inferencia de lo muestral a lo poblacional, la distribución empírica de una muestra aleatoria de tamaño n de dicha población es la mejor representación de la distribución de la misma. La muestra observada se toma como modelo de la distribución desconocida. Para mejorar el conocimiento de la distribución real la técnica bootstrap realiza muestreos con reemplazamiento, teniendo en cuenta la distribución empírica, es decir se ‘remuestrea’ con reemplazamiento entre los valores de las observaciones/casos muestrales.
Aproximación de la Binomial a la Poisson. Aproximación de la Binomial a la Normal
Si el n es lo suficientemente grande y la p, lo suficientemente pequeña, y ante la imposibilidad de encontrar estos valores extremos en la tabla de la distribución Binomial, se puede aproximar por la distribución Poisson (en ambos casos se trata de distribuciones discretas). Se suele aceptar el convenio de la aproximación de la Binomial por la Normal (continua), si el producto de los parámetros n y p, o lo que es lo mismo, np>5. El n es el tamaño de las muestras independientes de un suceso dicotómico de tipo Binomial, el p, la probabilidad de éxito, constante. El número de llegadas a una estación de bus, a un aeropuerto o a la caja de unos grandes almacenes, se distribuye de manera Poisson, en general, mientras que el tiempo en atenderlos, se distribuye Exponencial. Cuando un suceso se repite un número muy grande de veces (tiende a infinito), por el teorema central del límite, tiende a distribuirse como la campana de Gauss de una distribución Normal.
estamatica@gmail.com