El editor de una revista encuestó a sus lectores sobre
su satisfacción general con alguna revista y
una serie de aspectos de calidad.
Los datos, parte de los cuales se muestran a continuación, se encuentran en magazine.sav.
La principal pregunta de investigación es
¿Qué aspectos de la calidad tienen más impacto en la satisfacción general?
Ahora, cuando trabaje con datos del mundo real, lo primero que debe hacer es verificaciones de datos básicos. Este tutorial lo guía a través de esos. El análisis de regresión real de los datos preparados se cubre en el siguiente tutorial, Regresión escalonada en SPSS – Ejemplo.
Compruebe la codificación y los valores perdidos del usuario
Primero verificaremos si necesitamos establecer algún valor perdido del usuario. Un enfoque sólido aquí es ejecutar tablas de frecuencia mientras se muestran valores y etiquetas de valor.
establecer tnumbers ambos tvars ambos.
* Verifique las tablas de frecuencia para los valores perdidos del usuario.
frecuencias de satov a sat9.
Resultado
Establecer valores perdidos del usuario
Aprendemos dos cosas de nuestras tablas de frecuencias. Primero, todas las variables están codificadas positivamente: los valores más altos corresponden a actitudes más positivas. Si este no es el caso, una manera fácil de solucionarlo se presenta en SPSS Recode Values with Value Labels.
En segundo lugar, debemos establecer 6 como valor perdido del usuario para nuestros aspectos de calidad. Lo haremos con la siguiente sintaxis. También echaremos un vistazo a nuestras distribuciones de frecuencia.
valores perdidos sat1 a sat9 (6).
* Inspeccione histogramas pero no vuelva a crear tablas de frecuencia.
frecuencias satov a sat9
/ formato notable / * NO CREAR TABLAS * /
/ histograma.
Resultado
Nuestros histogramas no muestran nada alarmante, excepto que muchas variables tienen variaciones bastante bajas. Esto tiende a dar como resultado correlaciones bastante limitadas, como veremos en un minuto.
Inspeccionar valores perdidos por caso
Ahora inspeccionaremos cómo se distribuyen nuestros valores perdidos en los casos con la siguiente sintaxis.
calcular mis1 = nmiss (satov a sat9).
* Aplicar etiqueta de variable a la nueva variable de falta.
etiquetas de variable mis1 «Número de faltas (del sistema o del usuario) de satov a sat9».
* Inspeccione los valores perdidos por caso.
frecuencias mis1.
Resultado
Los casos con muchos valores perdidos pueden complicar los análisis y los encontramos sospechosos. Pero, de nuevo, nos gustaría utilizar la mayor cantidad de datos posible. Si no permitimos ninguna pérdida, perderemos el 19% de nuestra muestra. Por lo tanto, decidimos excluir solo los casos con 4 o más valores perdidos.
Filtrar casos con 4 o más faltas
calcular filt1 = (mis1
* Aplicar etiqueta de variable para filtrar la variable.
etiquetas de variable filt1 «Filtro para 3 o menos faltas de satov a sat9».
* Activar variable de filtro.
filtrar por filt1.
* Compruebe si el filtro funciona correctamente.
frecuencias mis1.
Inspeccionar valores perdidos por variable
También veremos cómo se distribuyen las faltas entre nuestras variables: ¿todas las variables tienen un número suficiente de valores válidos o necesitamos excluir una o más variables de nuestros análisis?
* Inspeccione los valores perdidos por variable.
descriptivos satov a sat9.
Resultado
Ninguna de nuestras variables parece problemática. El N más bajo se ve para sat6 (confiabilidad de la información). Quizás nuestros encuestados encontraron este aspecto difícil de juzgar.
Inspeccionar las correlaciones de Pearson
Por último, pero no menos importante, queremos asegurarnos de que nuestras correlaciones parezcan plausibles. Echaremos un vistazo rápido a toda la matriz de correlación.
correlaciones satov a sat9.
* Guarde el archivo de datos editado para la regresión.
guardar el archivo de salida ‘magazine_reg.sav’.
Resultado
Las cosas a tener en cuenta son las correlaciones en el «dirección incorrecta (positivo donde negativo tendría sentido o al revés). Esto puede resultar de que algunas variables estén codificadas positivamente y otras negativamente, pero ya vimos que ese no es el caso con nuestros datos.
Menos común pero muy problemático son las correlaciones cerca o igual a -1 o 1 que puede resultar de (casi) variables duplicadas. Esto tampoco es un problema aquí.
Ahora estamos listos para nuestro análisis de regresión. Dado que creamos una variable de filtro, guardaremos nuestros datos como magazine_reg.sav. Usaremos este archivo como entrada para nuestro próximo tutorial.