Un tutorial anterior introdujo algunas estadísticas de resumen apropiadas para variables tanto categóricas como métricas. Ahora es el momento de pasar a algunas medidas que se aplican exclusivamente a las variables métricas. Los más importantes son la media (o promedio), la varianza y la desviación estándar.
Significado
La mayoría de nosotros probablemente estamos familiarizados con la media (o promedio), pero la revisaremos brevemente en aras de la exhaustividad. La media es la suma de todos los valores dividida por el número de valores que se agregaron.
Podemos representar esta definición mediante la siguiente fórmula:
Ejemplo de cálculo medio
Ahora digamos que tenemos una variable X1 que contiene los valores 8, 9, 10, 11 y 12. Si los completamos en nuestra fórmula, veremos que la media de estos valores es 10:
- Te puede interesar: Curso de SPSS para aprender a dominar este software estadístico.
Varianza
La varianza es la desviación cuadrática promedio de la media. Podemos representar esta definición por la fórmula:
La varianza es una medida de dispersión; indica qué tan lejos están los valores de los datos.
Ejemplo de variación de cálculo
Reconsideremos la variable X1 con los valores 8, 9, 10, 11 y 12. Si aplicamos la fórmula, encontraremos que la varianza es:
Ahora tenemos una segunda variable, X2, que contiene los valores 6, 8, 10, 12 y 14. ¿Cómo describiría con palabras la diferencia entre las variables X1 y X2?
Ambos tienen un valor medio de 10. Bueno, la diferencia es que los valores de X2 están más separados; es decir, X2 tiene una varianza mayor que X1.
Varianza e histograma
La varianza de una variable se refleja en la forma de su histograma. Todo lo demás igual, a medida que aumenta la varianza, el histograma se vuelve más ancho y más bajo. La siguiente figura ilustra esto para datos reales. Cada variable tiene 1000 observaciones y una media de exactamente 100. Tenga en cuenta que los tres histogramas utilizan las mismas escalas para sus ejes horizontal y vertical.
Observe cómo los histogramas se vuelven más bajos y más anchos a medida que aumenta la varianza.
Desviación Estándar
La desviación estándar es la raíz cuadrada de la varianza. Por tanto, su fórmula es casi idéntica a la de la varianza:
Al igual que la varianza, la la desviación estándar es una medida de dispersión; indica la distancia entre una serie de valores.
Por tanto, la desviación estándar y la varianza expresan básicamente lo mismo, aunque en diferentes escalas. Entonces, ¿por qué no usamos una sola medida para expresar la dispersión de varios valores? La razón es que para algunos escenarios la desviación estándar es matemáticamente más conveniente e inversamente para la varianza.