- Crear diagrama de dispersión con línea de ajuste
- Cuadros de diálogo de regresión lineal de SPSS
- Interpretación de la salida de regresión de SPSS
- Evaluación de los supuestos de regresión
- Directrices de la APA para informar regresiones
Pregunta de investigación y datos
La Compañía X hizo que 10 empleados tomaran una prueba de coeficiente intelectual y desempeño laboral. Los datos resultantes, parte de los cuales se muestran a continuación, están en simple-linear-regression.sav.
Lo principal que la Compañía X quiere descubrir es
¿IQ predice el desempeño laboral? Y, si es así, ¿cómo?
Responderemos a estas preguntas ejecutando un análisis de regresión lineal simple en SPSS.
Crear diagrama de dispersión con línea de ajuste
Un gran punto de partida para nuestro análisis es un diagrama de dispersión. Esto nos dirá si el coeficiente intelectual y los puntajes de desempeño y su relación, si la hay, tienen algún sentido en primer lugar. Crearemos nuestro gráfico a partir de
y luego seguiremos las capturas de pantalla a continuación.
Personalmente me gusta tirar en
- a título que dice lo que mi audiencia está mirando básicamente y
- a subtitular que dice qué encuestados u observaciones se muestran y cuántos.
Al recorrer los diálogos se obtuvo la siguiente sintaxis. Así que ejecutémoslo.
SPSS Scatterplot con sintaxis de títulos
* Diagrama de dispersión con título y subtítulo de Gráficos -> Diálogos heredados -> Dispersión.
GRAFICO
/ SCATTERPLOT (BIVAR) = iq CON rendimiento
/ MISSING = LISTWISE
/ TITLE = ‘Rendimiento del diagrama de dispersión con IQ’
/ subtítulo ‘Todos los encuestados | N = 10 ‘.
Resultado
Derecha. En primer lugar, no vemos nada extraño en nuestro diagrama de dispersión. Parece haber una correlación moderada entre el coeficiente intelectual y el rendimiento: en promedio, los encuestados con puntajes de coeficiente intelectual más altos parecen tener un mejor desempeño. Esta relación parece más o menos lineal.
Agreguemos ahora una línea de regresión a nuestro diagrama de dispersión. Derecha-haciendo clic y seleccionando
abre una ventana del editor de gráficos. Aquí simplemente hacemos clic en el icono «Agregar línea de ajuste al total» como se muestra a continuación.
De forma predeterminada, SPSS ahora agrega una línea de regresión lineal a nuestro diagrama de dispersión. El resultado se muestra a continuación.
Ahora tenemos algunas primeras respuestas básicas a nuestras preguntas de investigación. R2 = 0,403 indica que el coeficiente intelectual representa aproximadamente el 40,3% de la varianza en las puntuaciones de desempeño. Es decir, IQ predice el rendimiento bastante bien en esta muestra.
Pero cómo ¿Podemos predecir mejor el desempeño laboral a partir del coeficiente intelectual? Bueno, en nuestro diagrama de dispersión y es rendimiento (mostrado en el eje y) y x es IQ (mostrado en el eje x). Así que eso será
rendimiento = 34,26 + 0,64 * IQ.
Entonces, para un solicitante de empleo con un coeficiente intelectual de 115, predeciremos 34.26 + 0.64 * 115 = 107.86 como su puntaje de desempeño futuro más probable.
Bien, eso nos da una idea básica sobre la relación entre el coeficiente intelectual y el rendimiento y la presenta visualmente. Sin embargo, todavía falta mucha información, significación estadística e intervalos de confianza. Así que vamos a buscarlo.
Cuadros de diálogo de regresión lineal de SPSS
Ejecutando de nuevo nuestro análisis de regresión mínima de
nos da una salida mucho más detallada. Las capturas de pantalla a continuación muestran cómo procederemos.
La selección de estas opciones da como resultado la siguiente sintaxis. Ejecútelo.
Sintaxis de regresión lineal simple de SPSS
* Regresión simple con gráficos de residuos e intervalos de confianza.
REGRESIÓN
/ FALTA LISTWISE
/ COEFF ESTADÍSTICAS SALIDAS CI (95) R ANOVA
/CRITERIA=PIN(.05) PUNTO (.10)
/ NOORIGEN
/ Rendimiento DEPENDIENTE
/ MÉTODO = INTRODUCIR iq
/ SCATTERPLOT = (* ZRESID, * ZPRED)
/ HISTOGRAMA DE RESIDUOS (ZRESID).
Salida de regresión de SPSS I – Coeficientes
Desafortunadamente, SPSS nos brinda muchos más resultados de regresión de los que necesitamos. Podemos ignorar la mayor parte con seguridad. Sin embargo, una tabla de gran importancia es la tabla de coeficientes mostrado a continuación.
Esta tabla muestra los coeficientes B que ya vimos en nuestro diagrama de dispersión. Como se indicó, esto implica la ecuación de regresión lineal que mejor estima el desempeño laboral a partir del CI en nuestra muestra.
En segundo lugar, recuerde que normalmente rechazamos la hipótesis nula si p <0,05. El coeficiente B de IQ tiene "Sig" op = 0.049. Es estadísticamente significativamente diferente de cero.
Sin embargo, su intervalo de confianza del 95% -en general, un rango probable para su valor poblacional- es [0.004,1.281]. Entonces, B probablemente no sea cero, pero bien puede estar muy cerca de cero. El intervalo de confianza es enorme -nuestro estimado para B no es nada preciso- y esto se debe al tamaño mínimo de muestra en el que se basa el análisis.
Resultado II de la regresión de SPSS – Resumen del modelo
Aparte de la tabla de coeficientes, también necesitamos el Resumen Modelo tabla para informar nuestros resultados.
R es la correlación entre los valores predichos de la regresión y los valores reales. Para la regresión simple, R es igual a la correlación entre el predictor y la variable dependiente.
R Plaza -la correlación al cuadrado- indica la proporción de varianza en la variable dependiente que es contabilizada por los predictores en nuestros datos de muestra.
Cuadrado R ajustado estima R-cuadrado al aplicar nuestra ecuación de regresión (basada en la muestra) a toda la población.
El r-cuadrado ajustado proporciona una estimación más realista de la precisión predictiva que simplemente el r-cuadrado. En nuestro ejemplo, la gran diferencia entre ellos, generalmente denominada contracción, se debe a nuestro tamaño de muestra mínimo de solo N = 10.
En cualquier caso, esta es una mala noticia para la Compañía X: IQ no De Verdad predecir el desempeño laboral tan bien después de todo.
Evaluación de los supuestos de regresión
Los principales supuestos para la regresión son
- Observaciones independientes;
- Normalidad: los errores deben seguir una distribución normal en la población;
- Linealidad: la relación entre cada predictor y la variable dependiente es lineal;
- Homocedasticidad: los errores deben tener una varianza constante en todos los niveles del valor predicho.
1. Si cada caso (fila de celdas en la vista de datos) en SPSS representa a una persona separada, generalmente asumimos que estos son «observaciones independientes”. A continuación, los supuestos 2 a 4 se evalúan mejor inspeccionando las gráficas de regresión en nuestro resultado.
2. Si normalidad se mantiene, entonces nuestros residuos de regresión deben estar (aproximadamente) distribuidos normalmente. El histograma a continuación no muestra una clara desviación de la normalidad.
El procedimiento de regresión puede agregar estos residuos como una nueva variable a sus datos. Al hacerlo, podría ejecute una prueba de Kolmogorov-Smirnov para comprobar su normalidad. Sin embargo, para la pequeña muestra que tenemos a mano, esta prueba difícilmente tendrá poder estadístico. Así que saltémoslo.
Los 3. linealidad y 4. homocedasticidad Los supuestos se evalúan mejor a partir de un gráfico de residuos. Esta es una gráfica de dispersión con valores predichos en el eje xy residuos en el eje y, como se muestra a continuación. Ambas variables se han estandarizado pero esto no afecta la forma del patrón de puntos.
Honestamente, la gráfica residual muestra una fuerte curvilinealidad. Dibujé manualmente la curva que creo que se ajusta mejor al patrón general. Asumir una relación curvilínea probablemente también resuelve la heterocedasticidad, pero las cosas se están volviendo demasiado técnicas ahora.
El punto básico es simplemente que algunas suposiciones no se cumplen.
Las soluciones más comunes para estos problemas, de peor a mejor, son
- postergación todos estos supuestos;
- mintiendo que los gráficos de regresión no indican ninguna violación de los supuestos del modelo;
- un no lineal transformación -como logarítmico– a la variable dependiente;
- encajando un con línea no recta modelo -que le daremos una oportunidad en un minuto.
Directrices de la APA para informar regresiones
La siguiente figura es, literalmente, una ilustración de libro de texto para informar la regresión en formato APA.
Crear esta tabla exacta a partir de la salida de SPSS es un verdadero dolor de cabeza. Editarlo es más fácil en Excel que en WORD, por lo que puede ahorrarle al menos algunos problemas.
Alternativamente, intente salirse con la suya copiando y pegando la salida de SPSS (sin editar) y finja no conocer el formato APA exacto.
Experimento de regresión no lineal
El tamaño de nuestra muestra es demasiado pequeño para ajustarse a algo más allá de un modelo lineal. Pero lo hicimos de todos modos, solo curiosidad. La opción más sencilla en SPSS está en
No vamos a discutir los diálogos pero pegamos la sintaxis a continuación.
Sintaxis de regresión no lineal de SPSS
* Regresión no lineal de Analizar – Regresión – Estimación de curvas.
TSET NEWVAR = NINGUNO.
CURVA DE AJUSTE
/ VARIABLES = rendimiento CON iq
/CONSTANTE
/ MODEL = cuadrático lineal
/ PLOT FIT.
Resultados
Nuevamente, nuestra muestra es demasiado pequeña para concluir algo serio. Sin embargo, los resultados sugieren un poco que un modelo curvilíneo se ajusta a nuestros datos mucho mejor que el lineal. No exploraremos más esto, pero queríamos mencionarlo; creemos que los científicos sociales suelen pasar por alto los modelos curvilíneos.
¡Gracias por leer!