Tutorial de preparación de datos de SPSS para regresión

El editor de una revista encuestó a sus lectores sobre

su satisfacción general con alguna revista y
una serie de aspectos de calidad.

Los datos, parte de los cuales se muestran a continuación, se encuentran en magazine.sav.


Regresión escalonada de SPSS: objetivos

La principal pregunta de investigación es
¿Qué aspectos de la calidad tienen más impacto en la satisfacción general?
Ahora, cuando trabaje con datos del mundo real, lo primero que debe hacer es verificaciones de datos básicos. Este tutorial lo guía a través de esos. El análisis de regresión real de los datos preparados se cubre en el siguiente tutorial, Regresión escalonada en SPSS – Ejemplo.

Compruebe la codificación y los valores perdidos del usuario

Primero verificaremos si necesitamos establecer algún valor perdido del usuario. Un enfoque sólido aquí es ejecutar tablas de frecuencia mientras se muestran valores y etiquetas de valor.

* Mostrar valores y etiquetas de valor, así como nombres de variables y etiquetas en la salida.

establecer tnumbers ambos tvars ambos.

* Verifique las tablas de frecuencia para los valores perdidos del usuario.

frecuencias de satov a sat9.

Resultado

Regresión paso a paso de SPSS: comprobación del uso de valores perdidos

Establecer valores perdidos del usuario

Aprendemos dos cosas de nuestras tablas de frecuencias. Primero, todas las variables están codificadas positivamente: los valores más altos corresponden a actitudes más positivas. Si este no es el caso, una manera fácil de solucionarlo se presenta en SPSS Recode Values ​​with Value Labels.
En segundo lugar, debemos establecer 6 como valor perdido del usuario para nuestros aspectos de calidad. Lo haremos con la siguiente sintaxis. También echaremos un vistazo a nuestras distribuciones de frecuencia.

* Establezca 6 como valores perdidos del usuario para todas las variables de regresión.

valores perdidos sat1 a sat9 (6).

* Inspeccione histogramas pero no vuelva a crear tablas de frecuencia.

frecuencias satov a sat9
/ formato notable / * NO CREAR TABLAS * /
/ histograma.

Resultado

Regresión escalonada de SPSS: distribuciones de variables

Nuestros histogramas no muestran nada alarmante, excepto que muchas variables tienen variaciones bastante bajas. Esto tiende a dar como resultado correlaciones bastante limitadas, como veremos en un minuto.

Inspeccionar valores perdidos por caso

Ahora inspeccionaremos cómo se distribuyen nuestros valores perdidos en los casos con la siguiente sintaxis.

* Agregue los valores perdidos por caso como una nueva variable a los datos.

calcular mis1 = nmiss (satov a sat9).

* Aplicar etiqueta de variable a la nueva variable de falta.

etiquetas de variable mis1 «Número de faltas (del sistema o del usuario) de satov a sat9».

* Inspeccione los valores perdidos por caso.

frecuencias mis1.

Resultado

Regresión escalonada de SPSS: valores perdidos por caso

Los casos con muchos valores perdidos pueden complicar los análisis y los encontramos sospechosos. Pero, de nuevo, nos gustaría utilizar la mayor cantidad de datos posible. Si no permitimos ninguna pérdida, perderemos el 19% de nuestra muestra. Por lo tanto, decidimos excluir solo los casos con 4 o más valores perdidos.

Filtrar casos con 4 o más faltas

* Cree una variable de filtro para los casos con 3 o menos faltas.

calcular filt1 = (mis1

* Aplicar etiqueta de variable para filtrar la variable.

etiquetas de variable filt1 «Filtro para 3 o menos faltas de satov a sat9».

* Activar variable de filtro.

filtrar por filt1.

* Compruebe si el filtro funciona correctamente.

frecuencias mis1.

Inspeccionar valores perdidos por variable

También veremos cómo se distribuyen las faltas entre nuestras variables: ¿todas las variables tienen un número suficiente de valores válidos o necesitamos excluir una o más variables de nuestros análisis?

* Inspeccione los valores perdidos por variable.

descriptivos satov a sat9.

Resultado

Regresión escalonada de SPSS: valores perdidos por variable

Ninguna de nuestras variables parece problemática. El N más bajo se ve para sat6 (confiabilidad de la información). Quizás nuestros encuestados encontraron este aspecto difícil de juzgar.

Inspeccionar las correlaciones de Pearson

Por último, pero no menos importante, queremos asegurarnos de que nuestras correlaciones parezcan plausibles. Echaremos un vistazo rápido a toda la matriz de correlación.

* Inspeccione las correlaciones de Pearson.

correlaciones satov a sat9.

* Guarde el archivo de datos editado para la regresión.

guardar el archivo de salida ‘magazine_reg.sav’.

Resultado

Regresión escalonada de SPSS: correlaciones

Las cosas a tener en cuenta son las correlaciones en el «dirección incorrecta (positivo donde negativo tendría sentido o al revés). Esto puede resultar de que algunas variables estén codificadas positivamente y otras negativamente, pero ya vimos que ese no es el caso con nuestros datos.
Menos común pero muy problemático son las correlaciones cerca o igual a -1 o 1 que puede resultar de (casi) variables duplicadas. Esto tampoco es un problema aquí.
Ahora estamos listos para nuestro análisis de regresión. Dado que creamos una variable de filtro, guardaremos nuestros datos como magazine_reg.sav. Usaremos este archivo como entrada para nuestro próximo tutorial.