Creación de variables ficticias en SPSS Statistics

Introducción

Si está analizando sus datos usando una regresión múltiple y cualquiera de sus variables independientes se midió en un nominal o ordinal escala, necesitas saber cómo crear variables ficticias e interpretar sus resultados. Esto se debe a que las variables independientes nominales y ordinales, más ampliamente conocidas como variables independientes categóricas, no se puede ingresar directamente en un análisis de regresión múltiple. En su lugar, deben convertirse en variables ficticias. La excepción son las variables independientes ordinales que se ingresan en una regresión múltiple como variables independientes continuas, que no no deben convertirse en variables ficticias. Por lo tanto, en esta guía le mostramos cómo crear variables ficticias cuando tiene variables independientes categóricas.

Primero, presentamos el ejemplo que usamos para mostrar cómo crear variables ficticias en SPSS Statistics, antes de explicar cómo configurar sus datos en el Vista de variables y Vista de datos ventanas de SPSS Statistics para que pueda crear variables ficticias. Si no está familiarizado con el uso de variables ficticias, le recomendamos que lea algunos de los principios básicos de las variables ficticias y la codificación ficticia, incluidos: (a) la cantidad de variables ficticias que necesita crear en su análisis; y (b) cómo crear variables ficticias y codificación ficticia. En la siguiente sección de Procedimiento, presentamos el sencillo procedimiento de 3 pasos Crear variables ficticias procedimiento en SPSS Statistics que se puede utilizar para crear variables ficticias. Finalmente, explicamos la salida de SPSS Statistics después de ejecutar el Crear variables ficticias procedimiento, incluida la forma en que sus variables ficticias ahora se configurarán en el Vista de variables y Vista de datos ventanas de SPSS Statistics.

Nota 1: La configuración de datos y el procedimiento que sigue son idéntico para SPSS Estadísticas versiones 22 a 28así como el versión de suscripción de SPSS Estadísticas, con versión 28 y el versión de suscripción siendo el Últimas Versiones de SPSS Estadísticas. Sin embargo, en versión 27 y el versión de suscripciónSPSS Statistics introdujo una nueva apariencia en su interfaz llamada «Luz SPSS«, reemplazando el aspecto anterior de versiones 26 y versiones mas antiguasque se llamó «Estándar SPSS«. Por lo tanto, si tiene SPSS Statistics versiones 27 o 28 (o el versión de suscripción de SPSS Statistics), las imágenes que siguen serán de color gris claro en lugar de azul. Sin embargo, la configuración de datos y el procedimiento son idéntico.

Nota 2: si encuentra que los procedimientos en esta guía no cubren el tipo de variables ficticias que desea crear, contáctenos. Es posible que podamos agregar otra guía al sitio para ayudar.

Ejemplo utilizado en esta guía

En esta guía usaremos el ejemplo de 10 triatletas a quienes se les pidió que seleccionaran su deporte favorito de los tres deportes que realizan al hacer un triatlón: nadando, ciclismo y corriendo. Sus respuestas quedaron registradas en el variable independiente nominaldeporte_favorito, que tiene tres categorías: «natación», «ciclismo» y «carrera». Esta variable independiente nominal, deporte_favorito, debía incluirse en un análisis de regresión múltiple que también tenía varias variables independientes continuas. Como esta variable independiente fue categórico (es decir, variables nominales y variables ordinales puede clasificarse ampliamente como variables categóricas), se tuvieron que crear variables ficticias antes de poder ingresarlas en el análisis de regresión múltiple.

Importante: Tenga en cuenta que favorito_deporte es un variable nominalpero también puede crear variables ficticias para un variable ordinal. Además, el proceso para crear variables ficticias es el mismo independientemente de si tiene una variable ordinal o nominal, con la excepción de un pequeño cambio que debe realizar al configurar sus datos, que se explica a continuación.

Nota 1: El «categorías» de una variable independiente categórica también se conocen como «grupos» o «niveles«, pero el término «niveles» suele reservarse para categorías que tienen un orden (por ejemplo, la variable independiente ordinal, «nivel de condición física», podría tener tres niveles: «bajo», «moderado» y «alto»). Sin embargo, estos tres términos, «categorías», «grupos» y «niveles», se pueden usar indistintamente. En esta guía, nos referiremos a ellos como categoríaspero puede referirse a ellos como grupos o niveles si lo prefiere.

Nota 2: El término «factores«a veces se usa en lugar de»variables independientes categóricas» (es decir, variables independientes que son «ordinales» o «nominales»). Sin embargo, estos dos términos, «variables independientes categóricas» y «factores», se pueden usar indistintamente. En esta guía, nos referiremos a ellos como variables independientes categóricas y también verá que SPSS Statistics se refiere a ellas como variables independientes en lugar de factores en su procedimiento de regresión múltiple. Sin embargo, puede referirse a ellos como factores si lo prefiere.

Configuración de sus datos en SPSS Statistics

Al crear variables ficticias, comenzará con una única variable independiente categórica (p. ej., deporte_favorito). Para configurar esta variable independiente categórica, SPSS Statistics tiene un Vista de variables donde define los tipos de variable que está analizando y un Vista de datos donde ingresas tus datos para esta variable. En esta sección, primero le mostramos cómo configurar una variable independiente categórica en el Vista de variables ventana de SPSS Statistics, antes de mostrarle cómo ingresar sus datos en el Vista de datos ventana. Hacemos esto utilizando nuestra variable independiente categórica, favorito_deporte, que tiene tres categorías: «natación», «ciclismo» y «carrera».

La vista de variables en SPSS Statistics

Para una única variable independiente categórica (p. ej., deporte_favorito), su Vista de variables ventana se verá como la siguiente:

Nota: Puede acceder a la Vista de variables ventana en SPSS Statistics haciendo clic en el Vista de variables en la esquina inferior izquierda del software SPSS Statistics.

Configuración de vista de variable inicial en SPSS Statistics donde se ha configurado la variable independiente categórica, deporte favorito

El nombre de su variable independiente categórica debe ingresarse en la celda debajo del Nombre columna (por ejemplo, «deporte favorito» en fila Campo de fila 1 para representar nuestra variable independiente categórica, favorito_deporte. Hay ciertos caracteres «ilegales» que no se pueden ingresar en el Nombre celúla. Por lo tanto, si recibe un mensaje de error y desea que agreguemos una guía de SPSS Statistics para explicar cuáles son estos caracteres ilegales, comuníquese con nosotros.

Nota: Para su propia claridad, también puede proporcionar una etiqueta para sus variables en el Columna de etiqueta columna. Por ejemplo, la etiqueta que ingresamos para «deporte favorito» era «El deporte favorito de los triatletas«.

La celda debajo de la Valores La columna debe contener la información sobre las categorías de su variable independiente categórica (p. ej., «nadando«, «ciclismo» y «corriendo» para favorito_deporte. Para ingresar esta información, haga clic en la celda debajo del Valores columna para su variable independiente. Él Botón de tres puntos aparecerá el botón en la celda. Haga clic en este botón y el Etiquetas de valor aparecerá el cuadro de diálogo. Ahora necesita dar a cada categoría de su variable independiente un «valor», que ingrese en el valor: cuadro (por ejemplo, «1«), así como una «etiqueta», que ingresa en el cuadro Etiqueta: (p. ej., «nadando«). Al hacer clic en el Agregar botón botón la codificación aparecerá en el cuadro principal (por ejemplo, «1.00=»nadar» para favorito_deporte). La configuración de nuestra variable independiente categórica se muestra en la Etiquetas de valor cuadro de diálogo a continuación:

Cuadro de diálogo de etiquetas de valor donde se han introducido las categorías 1=natación, 2=ciclismo y 3=correr

La celda debajo de la Medida la columna debe mostrar Nominal Si tienes un nominal variable independiente (p. ej., deporte_favorito, como en nuestro ejemplo) o Nominal si tienes un ordinal variable independiente (por ejemplo, imagine una variable ordinal como «Índice de masa corporal» (IMC), IMC), que tiene cuatro niveles: «Bajo peso», «Peso saludable/normal», «Sobrepeso» y «Obeso»). Finalmente, la celda debajo del Role la columna debe mostrar Ninguna.

Nota: Sugerimos cambiar la celda debajo del Role columna de Ninguna para Ninguna, pero no es necesario que realice este cambio. Le sugerimos que lo haga porque hay ciertos análisis en SPSS Statistics donde el Ninguna la configuración da como resultado que sus variables se transfieran automáticamente a ciertos campos de los cuadros de diálogo que está utilizando. Dado que es posible que no desee transferir estas variables, le sugerimos que cambie el Ninguna ajuste a Ninguna para que esto no suceda automáticamente.

Ahora ha ingresado con éxito toda la información que SPSS Statistics necesita saber sobre su variable independiente categórica en el Vista de variables ventana. En la siguiente sección, le mostramos cómo ingresar sus datos en el Vista de datos ventana.

La vista de datos en SPSS Statistics

Basado en la configuración del archivo para su variable independiente categórica en el Vista de variables ventana de arriba, la Vista de datos La ventana muestra el siguiente aspecto:

Nota: Puede acceder a la Vista de datos ventana en SPSS Statistics haciendo clic en el Vista de variables en la esquina inferior izquierda del software SPSS Statistics.

Configuración de vista de datos inicial en SPSS Statistics donde se ha configurado la variable independiente categórica, deporte favorito

Su variable independiente categórica se mostrará en la primera columna ya que este fue el orden en que ingresamos la variable en el Vista de variables ventana. En nuestro ejemplo, las respuestas de los 10 triatletas se presentan bajo el Deporte favorito columna. Ahora, simplemente debe ingresar sus datos en las celdas debajo de esta primera columna. Recuérdalo cada fila representa Un caso (por ejemplo, un caso podría ser un solo participante). Por lo tanto, en fila uno de nuestro ejemplo, el primer caso representaba a un triatleta cuyo deporte favorito era «nadando«. Dado que estas celdas inicialmente estarán vacías, debe hacer clic en las celdas para ingresar sus datos. Notará que cuando hace clic en las celdas debajo del Deporte favorito columna, SPSS Statistics le dará una opción desplegable con sus categorías ya pobladas.

Ahora que ha configurado sus datos en el Vista de variables y Vista de datos ventanas de SPSS Statistics, recomendamos leer la siguiente sección: Comprender las variables ficticias y la codificación ficticia, donde explicamos los principios básicos de las variables ficticias y la codificación ficticia. Sin embargo, si ya está familiarizado con los fundamentos de las variables ficticias y la codificación ficticia, puede omitir esta sección e ir directamente a la sección Procedimiento donde establecemos el Crear variables ficticias procedimiento en SPSS Statistics que se utiliza para crear variables ficticias.

Comprender las variables ficticias y la codificación ficticia

Como mencionamos en la Introducción, si está analizando sus datos utilizando una regresión múltiple y cualquiera de sus variables independientes se midió en un nominal o ordinal escala, necesitas saber cómo crear variables ficticias e interpretar sus resultados. Esto es porque variables independientes categóricas (es decir, variables independientes nominales y ordinales) no se pueden ingresar directamente en una regresión múltiple. En su lugar, deben convertirse en variables ficticias. La excepción son las variables independientes ordinales que se ingresan en una regresión múltiple como variables independientes continuas, que no no deben convertirse en variables ficticias. En las secciones a continuación, explicamos: (a) la cantidad de variables ficticias que necesita crear; y (b) cómo crear variables ficticias y codificación ficticia.

El número de variables ficticias que necesita crear

La cantidad de variables ficticias que necesita crear dependerá de cuántas categorías tenga su variable independiente categórica. Como regla general, creará una variable ficticia menos que el número de categorías en su variable independiente categórica. Por ejemplo, si tiene una variable independiente categórica con tres categorías (por ejemplo, favorito_deporte, con las siguientes tres categorías: «natación», «ciclismo» y «carrera»), creará dos variables ficticias y seleccione una categoría para actuar como un categoría de referencia (por ejemplo, «natación» y «ciclismo» se convierten en variables ficticias y «correr» se convierte en la categoría de referencia). Explicamos más sobre las categorías de referencia después de la siguiente tabla, que proporciona algunos ejemplos de variables independientes categóricas y la cantidad de variables ficticias que deben crearse:

Nombre de la variable independiente categórica Tipo de variable Número de categorías Número de variables ficticias 1 Género Nominal

Dos(Masculinos femeninos)

Uno=Hombres»Mujeres» es la categoría de referencia 2 Altura ordinal

Dos(Menos de 180 cm y 180 cm y más)

Uno=Menos de 180 cm «180 cm y más» es la categoría de referencia 3 Etnicidad Nominal

Tres(afroamericano, caucásico e hispano)

Dos=Afroamericano y caucásico»Hispano» es la categoría de referencia 4 Nivel de actividad física Ordinal

Tres(Bajo, Moderado y Alto)

Dos=Bajo y Moderado»Alto» es la categoría de referencia 5 Profesión Nominal

cuatro(Cirujano, Médico, Enfermero y Terapeuta)

Tres=Cirujano, Médico y Enfermera»Terapeuta» es la categoría de referencia 6 Nivel de acuerdo Ordinal

cuatro(Muy de acuerdo De acuerdo En desacuerdo Muy en desacuerdo)

Tres=Muy de acuerdo, de acuerdo y en desacuerdo»Muy en desacuerdo» es la categoría de referencia 7 Área temática Nominal

Cinco(Estudios Empresariales, Psicología, Ciencias Biológicas, Ingeniería y Derecho)

cuatro=Estudios Empresariales, Psicología, Ciencias Biológicas e Ingeniería»Derecho» es la categoría de referencia 8 Edad Ordinal

Cinco(Sub 18, 19-30, 31-40, 41-50, 51-60)

cuatro=Sub 18, 19-30, 31-40 & 41-50″51-60″ es la categoría de referencia

Mesa: Ejemplos de variables independientes categóricas y sus respectivas variables ficticias

Como se muestra en la tabla anterior, solo necesita crear una variable ficticia menos que el número de categorías en su variable independiente categórica. Esto se debe a que solo necesita (y debe) transferir esta cantidad de variables ficticias a una regresión múltiple cuando tiene una variable independiente categórica. Sin embargo, hay buenas razones para crear una variable ficticia para cada categoría de la variable independiente categórica: (a) es más flexible y (b) permite realizar comparaciones múltiples (ver la nota a continuación). En otras palabras, si su variable independiente categórica tiene tres categorías crearías tres muñecos Variablesno solo dos.

Afortunadamente, el Crear variables ficticias procedimiento en SPSS Statistics versiones 22 a 28 (y el versión de suscripción de SPSS Statistics) crea automáticamente una variable ficticia para cada categoría de su variable independiente categórica. Sin embargo, este no es el caso de la Recodificar en diferentes variables procedimiento en SPSS Statistics versión 21 o versiones mas antiguas de SPSS Estadísticas. Por lo tanto, en circunstancias normales, habrá creado la siguiente configuración en SPSS Statistics, dependiendo de si tiene versión 21 o anterior o versión 22 y superior:

Configuración de Data View después de crear variables ficticias en SPSS Statistics versión 21 o anterior en comparación con la versión 22 y superior

Nota: Como se mencionó anteriormente, la creación de una variable ficticia para cada categoría de la variable independiente categórica es beneficiosa por dos razones: (a) es más flexible y (b) permite realizar comparaciones múltiples. A continuación, mencionamos brevemente estos beneficios:

Es más flexible:Cuando haya creado una variable ficticia para cada categoría de su variable independiente categórica, puede considerar cualquier categoría como categoría de referencia. En nuestro ejemplo, consideramos la categoría «correr» como la categoría de referencia, lo que significa que habríamos transferido «natación» y «ciclismo» a la ecuación de regresión múltiple. Sin embargo, si más tarde cambiamos de opinión sobre nuestra elección de categoría de referencia, tendríamos que volver a ejecutar el procedimiento de variable ficticia (a menos que tenga SPSS Statistics versión 22 o superior). Por ejemplo, supongamos que ahora queremos considerar la categoría «ciclismo» como la categoría de referencia. Ahora podríamos transferir las variables ficticias «nadar» y «correr» a la ecuación de regresión múltiple porque también tenemos la variable ficticia «correr».

Permite realizar múltiples comparaciones:El coeficiente de una variable ficticia representa la diferencia entre la categoría que representa la variable ficticia y la categoría de referencia. Por ejemplo, con «correr» como categoría de referencia, el coeficiente de la variable ficticia «natación» representa la diferencia en la variable dependiente entre las categorías «natación» y «carrera». Con este método, no todas las combinaciones de categorías serán posibles. Este problema se puede resolver utilizando diferentes categorías de referencia. Esto es posible si todas las categorías de la variable categórica tienen una variable ficticia.

Cómo crear variables ficticias y codificación ficticia

Hay dos pasos para configurar con éxito variables ficticias en una regresión múltiple: (1) crear variables ficticias que representan las categorías de tu variable independiente categórica; y 2) introducir valores en estas variables ficticias, conocidas como codificación ficticia – para representar las categorías de la variable independiente categórica. Explicamos este proceso a continuación utilizando el ejemplo que expusimos anteriormente.

Explicación: Las variables ficticias son simplemente variables nuevas que actúan como «marcadores de posición» para un esquema de codificación particular. No contienen ningún dato en sí. En cambio, los datos/valores deben ser agregado a estas variables ficticias para que puedan cumplir su propósito de representar las categorías de su variable independiente categórica. Hay muchos tipos diferentes de esquemas de codificación que dictarán los valores que se ingresan en las variables ficticias, pero usamos un esquema de codificación muy común llamado codificación ficticia o alternativamente, codificación de indicadores (NB, no se confunda porque las variables ficticias y la codificación ficticia son no la misma cosa). La codificación ficticia funciona mediante el uso de cada variable ficticia para identificar una categoría específica de una variable independiente categórica con la excepcion de una categoría de referencia, que explicamos a continuación.

Comencemos por considerar nuestra variable independiente categórica de ejemplo, favorito_deporte, que tiene tres categorías: «natación», «ciclismo» y «carrera». Puesto que hay tres categoríastiene que haber dos variables ficticias representando dos de las categoriasy un categoría de referencia representando a la tercera categoría.

Nota: Recuerde de la discusión anterior que una regresión múltiple requiere que transfiera una variable ficticia menos que el número de categorías en su variable independiente categórica (es decir, dos en nuestro ejemplo). Sin embargo, puede crear una variable ficticia para cada categoría de la variable independiente categórica con el fin de lograr una mayor flexibilidad y la capacidad de realizar comparaciones múltiples. No obstante, en la discusión a continuación solo destacamos lo que se requiere para una regresión múltiple; es decir, la creación de una variable ficticia menos que el número de categorías en su variable independiente categórica con la categoría que no está directamente representada convirtiéndose en «categoría de referencia«.

Por ejemplo, deje que la variable ficticia #1 represente la categoría «natación» y la variable ficticia #2 represente la categoría «ciclismo». Esto no deja ninguna variable ficticia para la categoría «en ejecución». Esta categoría «desaparecida» es la categoría de referencia y no es necesario. Además, es enteramente su decisión qué categoría desea utilizar como categoría de referencia. Podríamos haber elegido fácilmente la categoría «natación» como categoría de referencia en lugar de la categoría «correr». La única razón por la que no lo hicimos es que por defecto SPSS Statistics utiliza el última categoría has codificado en el Vista de variables para su variable independiente categórica como la categoría de referencia (vea la nota a continuación).

Nota: Como se explicó anteriormente en la sección Configuración de datos y como se muestra a continuación en la Etiquetas de valor cuadro de diálogo, la tercera y última categoría de nuestra variable independiente categórica fue «en ejecución» (es decir, 3=»corriendo»).

Destaca cómo la categoría 3=correr es la categoría de referencia

No había ninguna razón teórica o estadística para que hiciéramos que la categoría «en ejecución» fuera la tercera y última categoría, lo que la convirtió en la categoría de referencia en SPSS Statistics de forma predeterminada. Simplemente lo hicimos así porque cuando los triatletas participan en un triatlón, primero nadan, luego realizan un ciclo y finalmente corren hasta la meta. Por lo tanto, parecía lógico codificar nuestra variable independiente categórica de esta manera. Sin embargo, podríamos haberlo codificado como 1=ciclismo, 2=correr y 3=nadar; no habría hecho ninguna diferencia excepto por el hecho de que, como tercera y última categoría, «natación» se habría convertido en nuestra categoría de referencia por defecto en SPSS Statistics.

Cuando crea variables ficticias, debe darles un nombre significativo. Dado que cada una de nuestras variables ficticias representa una categoría de nuestra variable independiente categórica, es habitual referirse a cada variable ficticia por el nombre de la categoría que representa. Por lo tanto, hemos llamado a la variable ficticia #1 «natación» ya que representa la categoría de natación. De manera similar, hemos llamado a la variable ficticia #2 «ciclismo» ya que representa la categoría de ciclismo. Al crear estas dos variables ficticias, tendremos dos nuevas columnas en nuestro conjunto de datos en SPSS Statistics, como se muestra a continuación:

Vista de datos que muestra los encabezados de columna para las dos variables ficticias, natación y ciclismo

Ahora que hemos creado dos variables ficticias y les hemos dado nombres apropiados, necesitamos introducir valores en estas variables para que cada variable ficticia realmente represente su categoría de la variable independiente categórica. Con la codificación ficticia esto es muy simple. Introduces un «1» para representar cualquier caso (por ejemplo, un participante en su conjunto de datos) que posee la categoría e ingrese un «0(cero) si lo hacen no tener la categoría. En primer lugar, considere el «nadando» variable ficticia, como se muestra a continuación:

Vista de datos que muestra la codificación ficticia ingresada para la variable ficticia, natación

Publicado con permiso por escrito de SPSS Estadísticas, IBM Corporation.

Si uno de los triatletas afirmara que «nadando» era su deporte «favorito», entraríamos en un «1» en la celda debajo de la columna variable ficticia de natación (Columna de natación) de aquel triatleta que afirmaba que la natación era su deporte «preferido». Alternativamente, si uno de los triatletas afirma que «ciclismo» o «corriendo» era su deporte «favorito», entraríamos en un «0» en la celda debajo de la columna variable ficticia de natación (Columna de natación) para aquel triatleta que afirmó que nadando «no» era su deporte favorito (es decir, esto significa que «ciclismo» o «carrera» eran el deporte favorito de ese triatleta). Esto se destaca a continuación para los 10 triatletas:

Vista de datos que muestra 1 debajo de la columna de natación cuando la natación era el deporte favorito de un triatleta y 0 cuando no lo era

Repetimos este proceso para la otra variable ficticia, «ciclismo«, Como se muestra abajo:

Vista de datos que muestra la codificación ficticia ingresada para la variable ficticia, ciclismo

Si uno de los triatletas afirmara que «ciclismo» era su deporte «favorito», entraríamos en un «1» en la celda debajo de la columna de la variable ficticia de ciclo (Ciclismo) por aquel triatleta que afirmaba que el ciclismo era su deporte «preferido». Alternativamente, si uno de los triatletas afirma que «nadando» o «corriendo» era su deporte «favorito», entraríamos en un «0» en la celda debajo de la columna de la variable ficticia de ciclo (Ciclismo) para aquel triatleta que afirmó que ciclismo «no» era su deporte favorito (es decir, esto significa que «nadar» o «correr» era el deporte favorito de ese triatleta). Esto se destaca a continuación para los 10 triatletas:

Vista de datos que muestra 1 debajo de la columna de ciclismo cuando el ciclismo era el deporte favorito de un triatleta y 0 cuando no lo era

Por entrar «1«arena «0«s en sus variables ficticias de esta manera, habrá creado un conjunto de variables ficticias que puede ingresar en un análisis de regresión múltiple. En la siguiente sección Procedimiento, le mostramos cómo crear estas variables ficticias usando el Crear variables ficticias procedimiento.

Procedimiento en SPSS Statistics para crear variables ficticias

Hay dos procedimientos en SPSS Statistics para crear variables ficticias: el Crear variables ficticias procedimiento y el Recodificar en diferentes variables procedimiento. En esta guía, le mostramos cómo usar el Crear variables ficticias procedimiento, que es un procedimiento simple de 3 pasos. Sin embargo, solo está disponible si tiene SPSS Statistics. versión 22 o posteriorcon versión 28 y el versión de suscripción de SPSS Statistics siendo el Últimas Versiones de SPSS Estadísticas. Si no está seguro de qué versión de SPSS Statistics está utilizando, consulte nuestra guía: Identificación de su versión de SPSS Statistics. Si tiene SPSS Estadísticas versión 21 o anterior o están interesados ​​en hacer comparaciones múltiples al realizar su análisis de regresión múltiple, consulte el Nota abajo:

Nota: si tiene SPSS Statistics versión 21 o anteriorusted no poder utilizar el Crear variables ficticias procedimiento. Por lo tanto, la Recodificar en diferentes variables El procedimiento al menos le permite crear variables ficticias en SPSS Statistics. Si bien también puede utilizar el Recodificar en diferentes variables procedimiento para crear variables ficticias si tiene SPSS Statistics versión 22 o posteriorplanteamos el Crear variables ficticias procedimiento en esta guía porque está dedicado a la creación de variables ficticias y es mucho más fácil y rápido de usar. Por ejemplo, solo requiere 3 pasos para crear variables ficticias para el ejemplo utilizado en esta guía en comparación con 28 pasos para el mismo ejemplo usando el Recodificar en diferentes variables procedimiento.

Por lo tanto, si tiene SPSS Statistics versión 21 o anteriornuestra guía mejorada sobre Creación de variables ficticias en la sección de miembros de Laerd Statistics incluye una página dedicada a mostrar cómo llevar a cabo este proceso de 28 pasos Recodificar en diferentes variables procedimiento. Puede acceder a esta guía mejorada suscribiéndose a Laerd Statistics. Alternativamente, puede simplemente usar el Crear variables ficticias procedimiento a continuación.

Para crear variables ficticias cuando tiene SPSS Statistics versión 22 o posteriorsigue los 3 pasos Crear variables ficticias procedimiento a continuación:

  • Hacer clic Transformar > Crear variables ficticias en el menú principal, como se muestra a continuación:
    Opciones de menú de SPSS Statistics para crear variables ficticias

    Se le presentará el Crear variables ficticias cuadro de diálogo, como se muestra a continuación:

    Muestra la variable independiente categórica, deporte favorito, en el cuadro Variables del lado izquierdo

  • Transfiera la variable independiente categórica, favorito_deporte, al cuadro Crear variables ficticias para: seleccionándola (haciendo clic en ella) y luego haciendo clic en el Flecha correcta botón. Además, ingrese un «raíz» nombre que puede representar todas las nuevas variables ficticias en el cuadro Nombres raíz (uno por variable seleccionada): en el área –Variables ficticias de efecto principal–. Ingresamos el nombre raíz «fs» como abreviatura de nuestra variable independiente categórica, «Ffavorito_spuerto», como se muestra a continuación:
    Muestra el cuadro de diálogo Crear variables ficticias donde se transfirió el deporte favorito y se seleccionaron las opciones relevantes

    Nota: SPSS Statistics agregar un numero secuencial (es decir, 1, 2, 3, 4, etc.) en el fin de El nombre raíz elige representar su variable independiente categórica. Se creará un número secuencial para cada de las variables ficticias que desea crear (por ejemplo, si tiene dos variables ficticias, una 1 y 2 se agregará al final del nombre raíz, pero si tuviera seis variables ficticias, una 1, 2, 3, 4, 5 y 6 se añadiría al final del nombre raíz). Esto se muestra para nuestro ejemplo en el Vista de variables ventana de abajo:

    Ventana de vista de variables donde se han agregado los nombres raíz y la numeración secuencial

    Dado que nuestra variable independiente categórica, deporte_favorito, tenía Tres categorías (es decir, natación, ciclismo y carrera), la Crear variables ficticias procedimiento crea Tres variables ficticias (es decir, una para nadar, otra para andar en bicicleta y otra para correr). Estas tres variables ficticias se destacan en la Nombre columna de arriba: «fs_1» (para nadar), «fs_2» (para ciclismo) y «fs_3» (para ejecutar). Puede cambiar el nombre de estos más tarde para que tengan más sentido. Solo estamos resaltando esto para que sepa cómo funciona el cuadro Nombres raíz (uno por variable seleccionada): arriba.

    También el nombre raíz ingresa en el cuadro Nombres raíz (uno por variable seleccionada): no poder ser igual que el nombre de tu variable independiente categóricacomo se muestra a continuación (es decir, donde hemos ingresado el nombre raíz, «deporte favorito«, para ilustrar lo que podríamos no llamar a nuestro nombre raíz):

    Muestra el nombre de la variable independiente categórica, deporte favorito, siendo incorrectamente duplicado en el cuadro de nombres raíz

    Si el nombre raíz que ingresa es el mismo como el nombre de su variable independiente categórica, como se muestra arriba, cuando hace clic en el DE ACUERDO botón, obtendrá la siguiente advertencia:

    aparece un cuadro de advertencia de SPSS Statistics que indica que este nombre de variable duplica un nombre de variable existente

  • Clickea en el botón Aceptar botón.
  • Después de realizar los 3 pasos Crear variable ficticia procedimiento anterior habrá creado variables ficticias para su variable independiente categórica. En la siguiente sección, resalte la salida que se crea en el Vista de variables y Vista de datos de SPSS Statistics después de ejecutar este Crear variables ficticias procedimiento.

    Configuración de salida y datos en SPSS Statistics después de crear variables ficticias

    Después de crear sus variables ficticias, SPSS Statistics produce lo siguiente Creación de variables mesa su Visor de estadísticas de IBM SPSS:

    Creando tabla

    Él Creación de variables table confirma que ha creado con éxito variables ficticias. Debe haber tantas filas como nuevas variables ficticias. Desde que creamos Tres variables ficticias, hay tres filas en la mesa, «fs_1«, «fs_2» y «fs_3«, que reflejan el nombre raíz y la numeración secuencial ingresados ​​en el Paso 2 del Crear variables ficticias procedimiento del apartado anterior. Para cada una de estas variables ficticias, se proporciona una etiqueta en la tabla para aclarar qué categoría de variable independiente categórica representa cada variable ficticia. Por ejemplo, la etiqueta, «favorito_deporte=natación«, está previsto para»fs_1«, Indicando que «fs_1» es la variable ficticia para el «nadando» categoría de la variable independiente categórica, favorito_deporte.

    A continuación, vaya a la Vista de variables ventana de SPSS Statistics haciendo clic en el Vista de variables pestaña. Se habrán agregado las tres variables ficticias, como se muestra a continuación (es decir, las variables ficticias, «fs_1«, «fs_2» y «fs_3«, en el Nombre columna):

    Ventana de vista de variables donde se han agregado los nombres raíz y la numeración secuencial

    Nota: Puede cambiar los nombres de las variables ficticias en el Nombre columna para que quede más claro cuáles son. Por ejemplo, hemos cambiado «fs_1» para «nadando«, «fs_2» para «ciclismo» y «fs_3» para «corriendo«, Como se muestra abajo:

    Vista de Variables donde los nombres raíz han sido cambiados a los nombres de las categorías de la variable independiente categórica

    Finalmente, vaya a la Vista de datos ventana de SPSS Statistics haciendo clic en el Vista de datos pestaña. Él codificación ficticia se muestra debajo de cada uno de los variables ficticias que han sido creados. Por ejemplo, en las filas debajo de «fs_1» columna, la categoría, «nadando«, se codifica como «1.00«, mientras que las categorías, «ciclismo» y «corriendo«, se codifican como «.00«, como se muestra a continuación. Si no está seguro por qué estas variables ficticias están codificadas como ficticias de esta manera, consulte la sección: Comprender las variables ficticias y la codificación ficticia.

    Ventana de visualización de datos que muestra los nombres raíz y la numeración secuencial de las nuevas variables ficticias

    Nota 1: debido a la configuración predeterminada de SPSS Statistics, sus variables ficticias se codificarán «1.00» o «.00» en vez de «1» o «0«, respectivamente. Son idénticos. Sin embargo, a menudo verá una codificación ficticia escrita en términos de 1‘arena 0‘s en lugar de incluir decimales.

    Nota 2: Si cambió los nombres de las variables ficticias en el Nombre columna de la Vista de variables ventana de arriba, estos también habrán sido cambiados en las columnas de la Vista de datos ventana, como se muestra a continuación (por ejemplo, el fs guión bajo 1 el encabezado de la columna ahora se titula Nadando):

    Vista de datos donde se han cambiado los nombres de raíz a los nombres de las categorías de la variable independiente categórica