Depuración de Datos

Depuración de Datos

Depuración de Datos previa a análisis estadísticos

Depuración de Datos

La depuración de datos previa a análisis estadísticos, es un faceta tan o más importante que el propio contrate de hipótesis posterior, ya se en una TFM (Trabajo de Fin de Master), TFG (Trabajo de Fin de Grado), Tesis, Maestría, Doctorado, Abstract científico para publicación, Paper para presentación, etc.

 

Depuración de la Base de Datos

Depuración de Datos

Seleccionar todos los valores a reemplazar (¡ojo!: valores, no nombres de las variables, etc) y sustituir el valor en blanco, o punto (.) o 0 por el valor 99, y de esta manera facilitar el trabajo posterior cuando se exporte la base de datos al software estadístico a utlilizar en el análisis, en el cual se definirán los valores missing (perdidos) como 99 o similar.

 

Eliminación de Outliers

Box-Plot de eliminación de casos atípicos

Se deben eliminar de nuestros estudio los casos atípicos o outliers que pueden desvirtuar el resultado y las conclusiones de los análisis estadísticos a llevar a cabo en la investigación. El propio gráfico o diagrama de cajas y bigotes o gráfico Box-Plot señala con un círculo los casos (filas) que se consideran atípicos, y que se considera importante no tener en cuenta para el análisis posterior, salvo que el tamaño muestral se considere lo suficientemente pequeño, como es el caso de las muestras piloto.

Eliminar casos con valores atípicos

Box Plot en Minitab

 

Recodificación de Variables en SPSS

Depuración de Datos Recodificar variables en SPSS

Existe la opción de recodificar en las mismas o en distintas (nuevas) variables, y de esta manera conseguir variables dicotómicas (ejemplo 0: NO, 1:SÍ), o politómicas de más de 2 categorías.

 

Eliminar casos que cumplen o no una determinada condición

Eliminar casos por condición en SPSS

 

Seleccionar casos que cumplen o no una determinada condición

Seleccionar casos si cumplen una o varias condiciones en SPSS:

Seleccionar casos si cumplen una o varias condiciones en SPSS

 

Segmentar archivos en SPSS

Segemtar archivos en SPSS

Cuando se trata de que los resultados de los estadísticos descriptivos, análisis estadísticos, etc, se muestren segmentados por una variable de interés que hace los grupos.