Ejemplo de regresión de SPSS con interacción de moderación


Un médico deportivo mide habitualmente los porcentajes de músculos de sus clientes. También les pregunta cuántas horas a la semana suelen dedicar a la formación. Nuestro médico sospecha que los clientes que entrenan más también son más musculosos. Además, piensa que
la efecto del entrenamiento de la musculatura disminuye con la edad.
En el análisis de regresión múltiple, esto se conoce como efecto de interacción de moderación. La siguiente figura lo ilustra.


Interacción de moderación en el diagrama de regresión

Entonces, ¿cómo probar ese efecto de moderación? Bueno, normalmente lo hacemos en 3 pasos:

  1. si ambos predictores son cuantitativos, normalmente nos referimos a centrarlos primero;
  2. luego multiplicamos los predictores centrados en una variable predictora de interacción;
  3. finalmente, ingresamos tanto los predictores centrados en la media como el predictor de interacción en un análisis de regresión.

Regresión de moderación de SPSS: datos de ejemplo

Estos 3 predictores están todos presentes en muscle-percent-male-interactive.sav, parte del cual se muestra a continuación.


Vista de variables de regresión de moderación de SPSS

Hicimos el centrado medio con una herramienta sencilla que se puede descargar de SPSS Mean Centering and Interaction Tool.
Alternativamente, el centrado manual de la media tampoco es demasiado difícil y se explica en ¿Cómo calcular la media de los predictores de centro en SPSS?

Regresión de moderación de SPSS: cuadros de diálogo

Nuestra regresión de moderación no es diferente de cualquier otro análisis de regresión lineal múltiple: navegamos a

Flecha de menú de SPSS

Flecha de menú de SPSS

y complete los cuadros de diálogo como se muestra a continuación.


Regresión de SPSS con cuadros de diálogo de interacción de moderación

Haciendo clic PAGaste da como resultado la siguiente sintaxis. Ejecútelo.

* Regresión con predictores centrados en la media y predictor de interacción.

REGRESIÓN
/ FALTA LISTWISE
/ ESTADÍSTICAS COEFF OUTS R ANOVA ZPP
/CRITERIA=PIN(.05) PUNTO (.10)
/ NOORIGEN
/ DEPENDIENTE mperc
/ METHOD = ENTER cent_age cent_thours int_1
/ SCATTERPLOT = (* ZRESID, * ZPRED)
/ HISTOGRAMA DE RESIDUOS (ZRESID).

Regresión de moderación de SPSS – Salida de coeficientes


Salida de coeficientes de regresión de moderación de SPSS

Edad está relacionado negativamente con el porcentaje de músculo. En promedio, los clientes pierden 0.072 puntos porcentuales por año.
Capacitación las horas se relacionan positivamente con el porcentaje de músculo: los clientes tienden a ganar 0,9 puntos porcentuales por cada hora que hacen ejercicio a la semana.
El coeficiente B negativo para el Interacción El predictor indica que el efecto del entrenamiento se vuelve más negativo, o menos positivo, con el aumento de la edad.

Ahora, para que cualquier efecto tenga alguna importancia, debe ser estadísticamente significativo y tener un tamaño de efecto razonable.

En p = 0,000, los 3 efectos son altamente estadísticamente significativos. Como medidas del tamaño del efecto, podríamos usar las correlaciones semiparciales (indicadas como «Parte») donde

  • r = 0,10 indica un efecto pequeño;
  • r = 0,30 indica un efecto medio;
  • r = 0,50 indica un gran efecto.

El efecto del entrenamiento es casi grande y la edad y la interacción entre la edad y el entrenamiento son casi medianas. A pesar de estadístico importancia, creo que la interacción puede ignorarse si su correlación parcial r <0,10 más o menos, pero claramente ese no es el caso aquí. Por lo tanto, examinaremos la interacción en profundidad mediante un análisis de pendientes simple.

Con respecto a la parcelas residuales (no se muestra aquí), tenga en cuenta que

  • el histograma residual no parece completamente distribuido normalmente sino, más bien, bimodal. Esto depende de alguna manera del ancho del contenedor y no parece demasiado alarmante;
  • la gráfica de dispersión residual no muestra ningún signo de heterocedasticidad o curvilinealidad. En conjunto, estos gráficos no muestran violaciones claras de los supuestos de regresión.

Creación de grupos de edad

Nuestro análisis de pendientes simple comienza con la creación de grupos de edad. Me decantaré por grupos terciles: los más jóvenes, intermedios y el 33,3% de los mayores formarán mis grupos. Esta es una elección arbitraria:
también podemos crear 2, 3, 4 o cualquier número de grupos.
Tampoco son obligatorios los tamaños de grupo iguales y tal vez incluso algo inusual. En cualquier caso, la siguiente sintaxis crea los grupos de terciles de edad como una nueva variable en nuestros datos.

* Crear grupos de terciles de edad.

rango de edad
/ ntiles (3) en agecat3.

* Etiquetar nuevas variables y valores.

etiquetas de variable agecat3 ‘Grupo tercil de edad’.
etiquetas de valor agecat3 1 ‘Edades más jóvenes’ 2 ‘Edades intermedias’ 3 ‘Edades más altas’.

* Consultar estadísticas descriptivas de edad por grupo de edad.

significa edad por agecat3
/ cell count min max mean stddev.

Resultado


Estadística descriptiva por grupo de edad

Algunas conclusiones básicas de esta tabla son que

  1. nuestros grupos de edad tienen tamaños de muestra exactamente iguales de n = 81;
  2. las edades medias del grupo están distribuidas de manera desigual: la diferencia entre jóvenes e intermedios -unos 6 años- es mucho menor que entre intermedios y mayores -algunos 13 años;
  3. el grupo de edad más alto tiene una desviación estándar mucho mayor que los otros 2 grupos.

Los puntos 2 y 3 son causados ​​por la asimetría en la edad y discuten en contra utilizando grupos terciles. Sin embargo, creo que tener grupos de igual tamaño supera fácilmente ambas desventajas.

Análisis de taludes simples I – Ajustar líneas

Visualicemos ahora la interacción de moderación entre la edad y el entrenamiento. Comenzaremos creando un diagrama de dispersión como se muestra a continuación.


Menú de diagrama de dispersión de SPSS 840 1


Análisis de pendientes simples con diagrama de dispersión de SPSS

Haciendo clic PAGaste da como resultado la sintaxis siguiente.

* Cree un porcentaje de músculo de diagrama de dispersión por horas de entrenamiento no centradas por grupo de edad.

GRAFICO
/ SCATTERPLOT (BIVAR) = thours CON mperc POR agecat3
/ MISSING = LISTWISE
/ TITLE = ‘Porcentaje de músculos por horas de entrenamiento por grupo de edad’.

* Después de ejecutar el gráfico, agregue manualmente líneas de ajuste separadas.

Adición de líneas de ajuste independientes a la gráfica de dispersión

Después de crear nuestro diagrama de dispersión, lo editaremos haciendo doble clic en él. En la ventana del Editor de gráficos que se abre, hacemos clic en el icono etiquetado
Agregar línea de ajuste en subgrupos


SPSS Agregar línea de ajuste en subgrupos en el editor de gráficos

Después de agregar las líneas de ajuste, simplemente cerraremos el editor de gráficos. Nota menor: los diagramas de dispersión con líneas de ajuste (separadas) se pueden crear de una sola vez desde el Generador de gráficos en SPSS versión 25+, pero lo cubriremos en otro momento.

Resultado


Diagrama de dispersión de SPSS Líneas de ajuste separadas para grupos

Nuestras líneas de ajuste explican muy bien la naturaleza de nuestra edad al entrenar el efecto de interacción:

  • los 2 grupos de edad más jóvenes muestran un aumento constante en el porcentaje de músculo por horas de entrenamiento;
  • Sin embargo, para los clientes de mayor edad, el entrenamiento apenas parece afectar el porcentaje de músculo. Así es como se ve el efecto del entrenamiento en el porcentaje de músculo. moderado por edad;
  • en promedio, las 3 líneas aumentan. Este es el efecto principal de entrenamiento;
  • en general, la línea de ajuste para el grupo de mayor edad es más baja que para los otros 2 grupos. Este es nuestro efecto principal de edad.

Nuevamente, la similitud entre los 2 grupos más jóvenes puede deberse a la asimetría en las edades: las edades medias de estos grupos no son muy diferentes, pero muy diferente del grupo de edad más alto.

Análisis de pendientes simples II – Coeficientes

Después de visualizar nuestro efecto de interacción, probémoslo ahora: ejecutaremos una regresión lineal simple del entrenamiento en porcentaje muscular para nuestros 3 grupos de edad por separado. Una buena forma de hacerlo en SPSS es utilizando SPLIT FILE.

La sintaxis de REGRESIÓN se creó a partir del menú como anteriormente, pero con el entrenamiento (no centrado) como único predictor.

* Dividir archivo por grupo de edad.

ordenar los casos por agecat3.
archivo dividido en capas por agecat3.

* Ejecute regresión lineal simple con horas de entrenamiento no centradas en porcentaje de músculo.

REGRESIÓN
/ FALTA LISTWISE
/ ESTADÍSTICAS COEFF OUTS R ANOVA ZPP
/CRITERIA=PIN(.05) PUNTO (.10)
/ NOORIGEN
/ DEPENDIENTE mperc
/ METHOD = ENTER thours
/ SCATTERPLOT = (* ZRESID, * ZPRED)
/ HISTOGRAMA DE RESIDUOS (ZRESID).

* Dividir archivo.

dividir el archivo.

Resultado


Tabla de salida del análisis de pendientes simples de SPSS

La tabla de coeficientes confirma nuestros resultados anteriores:

para el grupo de edad más joven, el efecto del entrenamiento es estadísticamente significativo en p = 0,000. Además, su correlación parcial de r = 0,59 indica un gran efecto;
los resultados para el grupo de edad intermedia son aproximadamente similares a los del grupo más joven;
para el grupo de edad más alto, la correlación parcial de r = 0.077 no es sustancial. No lo tomaríamos en serio incluso si hubiera sido estadísticamente significativo, que no es en p = 0.49.

Por último, los histogramas residuales (que no se muestran aquí) no muestran nada inusual. La gráfica de dispersión residual para el grupo de mayor edad parece curvilínea excepto por algunos valores atípicos. Quizás deberíamos echar un vistazo más de cerca a este análisis, pero lo dejaremos para otro día.

¡Gracias por leer!