Estadística descriptiva: una variable métrica

Un tutorial anterior introdujo algunas estadísticas de resumen apropiadas para variables tanto categóricas como métricas. Ahora es el momento de pasar a algunas medidas que se aplican exclusivamente a las variables métricas. Los más importantes son la media (o promedio), la varianza y la desviación estándar.

Significado

La mayoría de nosotros probablemente estamos familiarizados con la media (o promedio), pero la revisaremos brevemente en aras de la exhaustividad. La media es la suma de todos los valores dividida por el número de valores que se agregaron.

Podemos representar esta definición mediante la siguiente fórmula:

variable-metrica

Ejemplo de cálculo medio

Ahora digamos que tenemos una variable X1 que contiene los valores 8, 9, 10, 11 y 12. Si los completamos en nuestra fórmula, veremos que la media de estos valores es 10:

ejemplo
  • Te puede interesar: Curso de SPSS para aprender a dominar este software estadístico.

Varianza

La varianza es la desviación cuadrática promedio de la media. Podemos representar esta definición por la fórmula:

ejemplo-varianza

La varianza es una medida de dispersión; indica qué tan lejos están los valores de los datos.

 

Ejemplo de variación de cálculo

Reconsideremos la variable X1 con los valores 8, 9, 10, 11 y 12. Si aplicamos la fórmula, encontraremos que la varianza es:

ejemplo-variacion-calculo

Ahora tenemos una segunda variable, X2, que contiene los valores 6, 8, 10, 12 y 14. ¿Cómo describiría con palabras la diferencia entre las variables X1 y X2?

Ambos tienen un valor medio de 10. Bueno, la diferencia es que los valores de X2 están más separados; es decir, X2 tiene una varianza mayor que X1.

 

Varianza e histograma

La varianza de una variable se refleja en la forma de su histograma. Todo lo demás igual, a medida que aumenta la varianza, el histograma se vuelve más ancho y más bajo. La siguiente figura ilustra esto para datos reales. Cada variable tiene 1000 observaciones y una media de exactamente 100. Tenga en cuenta que los tres histogramas utilizan las mismas escalas para sus ejes horizontal y vertical.


Mismos medios, diferentes variaciones
Observe cómo los histogramas se vuelven más bajos y más anchos a medida que aumenta la varianza.

 

Desviación Estándar

La desviación estándar es la raíz cuadrada de la varianza. Por tanto, su fórmula es casi idéntica a la de la varianza:

ejemplo-desviacion-estandar

Al igual que la varianza, la la desviación estándar es una medida de dispersión; indica la distancia entre una serie de valores.

Por tanto, la desviación estándar y la varianza expresan básicamente lo mismo, aunque en diferentes escalas. Entonces, ¿por qué no usamos una sola medida para expresar la dispersión de varios valores? La razón es que para algunos escenarios la desviación estándar es matemáticamente más conveniente e inversamente para la varianza.