La varianza es una medida que permite comprender un conjunto, desde un punto de vista simple analiza la dispersión que hay entre los datos y su promedio, sin embargo se puede utilizar para profundizar y hacer estudios de diferentes fenómenos estadísticos.

Los campos en los que se puede utilizar la varianza son muy amplios y van desde el análisis de datos, las finanzas e incluso el marketing digital por lo que muchos expertos la tienen en cuenta a la hora de tomar decisiones.

¿Qué es la varianza?

En estadística descriptiva, la varianza se define como el promedio del cuadrado de la desviación de la variable respecto a su media, aunque suena un poco complicado es más simple de lo que parece y aquí te vamos a explicar cómo calcularla.

Varianza de datos

¿Cómo se calcula la varianza?

Para calcular la varianza, primero se debe calcular la media del conjunto de datos. Luego, se resta cada valor del conjunto a la media y se eleva al cuadrado. Estos cuadrados se suman y se dividen entre el número total de datos en el conjunto.

La fórmula para calcular la varianza es la siguiente:

Donde Σ es la suma de los términos, xi es cada valor en el conjunto de datos, x es la media del conjunto y n es el número total de datos en el conjunto.

Ejemplo del cálculo de la varianza

Se quiere implementar una campaña de marketing a través de redes sociales, para ello los analistas piden calcular la varianza de la edad de un público objetivo, se tienen los siguientes datos:

NombreEdad
Ana24
Juana28
Angie25
Mauricio27

Solución:

Lo primero que se debe realizar es el cálculo de la media o promedio de los datos, se utiliza la ecuación:

Promedio

Para resolver esta ecuación lo que debemos hacer es sumar todos los datos de las edades y dividir el resultado entre el número de personas que para el caso son 4, quedando:

El promedio de la edad es 26

De acuerdo con la ecuación de la varianza

Ahora se debe hacer una resta de cada edad menos el promedio, elevar al cuadrado la diferencia, sumar las diferencias y finalmente dividir entre el número total de datos. Parece dificil pero vamos a hacerlo paso a paso:

Dato menos el promedio al cuadrado:

Dato menos el promedio, todo al cuadrado

Σ(xi-x)^2 representa la suma de las diferencias

Sumatoria de diferencias al cuadrado

Dividiendo entre el número de datos tendríamos:

Ejemplo cálculo de varianza

La varianza entre los valores de las edades es de solo 2,5 significa que el público objetivo se encuentra bien seleccionado en los rangos de edad, en dado caso que la varianza fuera muy alta significaría que las personas que conforman el grupo seleccionado no se encuentran en el mismo rango de edad.

¿Por qué se usa la varianza?

Primero vamos a analizar por qué se utiliza la varianza y no simplemente una medición de las desviaciones, para ello supongamos que tenemos tres datos:

  • 4
  • 5
  • 6

Ahora queremos calcular las desviaciones que hay entre los datos y su promedio, para ello vamos inicialmente a calcular el promedio, recordemos que la fórmula es:

Promedio

Reemplazando los valores tenemos que:

Promedio de los datos

Ahora vamos a ver la diferencia de cada dato con el promedio:

  • 4 – 5= -1
  • 5 – 5 = 0
  • 6 – 5 = 1

Ahora al sumar las diferencias tenemos entonces -1 + 0 + 1 lo que nos da cero, lo que nos lleva a la siguiente conclusión: la media de las desviaciones es cero. Da igual los valores que tomemos, el resultado siempre es el mismo, siempre es cero.

¿Por qué se eleva al cuadrado la diferencia?

Elevar al cuadrado las desviaciones antes de tomar la media es la forma matemática para evitar que la suma de diferencias sea siempre cero.

Por ejemplo para el caso anterior:

  • 4 – 5= -1, elevando al cuadrado (-1)^2 =1
  • 5 – 5 = 0, elevando al cuadrado (0)^2 =0
  • 6 – 5 = 1, elevando al cuadrado (1)^2 =1

Ahora al sumar las diferencias elevadas al cuadrado tenemos entonces: 1+0+1 =2, por lo que podemos asegurar que la varianza es de 2.

Recuerda que ya sea que la desviación sea positiva, negativa o cero, el cuadrado nunca es negativo. En otras palabras la varianza siempre es mayor o igual a cero.

Pero al elevar al cuadrado, también tenemos las unidades en que medimos la varianza. Por ejemplo, si la media está en metros, la varianza se mide en metros al cuadrado. Para evitar este problema, podemos sacar la raíz cuadrada de la varianza, llamada desviación estándar, que se usa en muchas situaciones.

Diferencias entre la varianza y la desviación estándar

Es importante destacar que la varianza y la desviación estándar están estrechamente relacionadas. La desviación estándar es la raíz cuadrada de la varianza y se utiliza a menudo en su lugar porque es más fácil de interpretar. Mientras que la varianza está en unidades cuadradas, la desviación estándar está en unidades de la variable original.

Ventajas y desventajas

La varianza tiene varias ventajas, entre ellas, es fácil de calcular y es una medida objetiva y precisa de la variabilidad de los datos. Sin embargo, también tiene algunas desventajas. Por ejemplo, puede ser influenciada por valores extremos o atípicos, lo que puede distorsionar los resultados. Además, al estar elevando al cuadrado las diferencias, la varianza puede ser difícil de interpretar y comparar con otras medidas de dispersión, como la desviación estándar.

Para entender mejor esto, veamos algunos ejemplos. Supongamos que tenemos dos conjuntos de datos:

Conjunto A: 3, 5, 7, 9, 11

Conjunto B: 1, 2, 3, 4, 100

La media de ambos conjuntos es 7, pero la varianza es muy diferente. La del conjunto A es 8, mientras que la del conjunto B es 1286. Esto se debe a que el valor atípico 100 en el conjunto B distorsiona la medida de dispersión.

Calculadora de Varianza

Calculadora de Varianza

Ingrese los datos separados por comas o espacios:

Varianza:

No responses yet

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *