Las medidas de dispersión son indicadores estadísticos que nos dicen cómo se agrupan los datos alrededor de las medidas de tendencia central.
En estadística, es importante saber si los datos están cerca o lejos de la media aritmética. Es decir, si están cerca, se considera que los datos son homogéneos y, en consecuencia, se puede confiar en su validez. Por el contrario, si están alejados, es necesario analizar con más detenimiento para determinar cómo influyen en toda la distribución. Como sea, son las medidas de dispersión las que permiten analizar este tipo de situaciones.
La efectividad de estas medidas, sobresale en dos tipos de situaciones.
- Primero, cuando se usan para complementar la información dada por las medidas de tendencia central. Por ejemplo, para saber cuál de 2 estudiantes con igual promedio, tiene mejor rendimiento.
- Segundo, cuando se comparan dos grupos de datos similares, pero en contextos diferentes. Por ejemplo, para comparar el desempeño de 2 grupos de estudiantes frente a un mismo examen.
Ronald Aylmer Fisher fue un estadista y biólogo que contribuyó al desarrollo de este tipo de medidas.
Principales medidas de dispersión
Entre las medidas de dispersión están: rango, desviación media, varianza, desviación típica y coeficiente de variación.
Rango
Se denomina rango, amplitud o intervalo de variación, a la diferencia entre el valor máximo y el valor mínimo de un grupo de datos. El rango es la medida de dispersión más sencilla, sin embargo, es la menos exacta porque se ve muy afectada por valores atípicos. La fórmula para calcular el rango (R) es:
R = valormáx – valormin
Ejemplo 1:
Hallar la amplitud de la siguiente muestra de datos: 6, 4, 1, 1, 2, 2, 3, 4, 5, 20, 16.
El mayor de los datos es 20 y el menor de los datos es 1. Por tanto, la amplitud o rango es:
R = 20 – 1 = 19.
En consecuencia, el rango o amplitud de la muestra es 19.
Desviación media
Mide la distancia absoluta promedio, entre cada uno de los datos y la media aritmética. Su valor es la sumatoria de las diferencias entre los valores de los datos (x) y el promedio () de la muestra, dividida entre el número de datos (n). (siempre los resultados se toman como positivos). La fórmula de la desviación media (Dm) es:
Cómo se calcula la desviación media
Para calcular la desviación se siguen estos pasos:
- Primero, se calcula la media aritmética.
- Segundo, se calcula, para cada dato, la diferencia dato menos promedio.
- Tercero, se halla el promedio de dichas diferencias.
Ejemplo 2:
Halar la desviación media de los siguientes datos: 32, 32, 34, 31, 36, 33, 35, 37, 34, 38, 32 (son 11 datos).
Solución:
Para empezar, se halla la media, sumando todos los datos y dividiendo, el resultado, entre el número de datos.
32+32+34+31+36+33+35+37+34+38+32 = 374
A continuación, a cada dato se le resta la media que, es 34 y se suman los valores absolutos de los resultados. Es decir, como si todos fueran positivos (ver figura 1).
Para terminar, se divide la sumatoria de los resultados de las restas que es 20, entre 11. Como resultado, el valor de la desviación media es 1.81.
Cómo interpretar el valor de la desviación media
Si la desviación media es pequeña, indica que el conjunto de datos es muy uniforme, lo que facilita su análisis e interpretación. Además, indica que la media aritmética es un buen representante del grupo de datos. Por otro lado, favorece la identificación de los factores comunes que más influyen en la muestra. Un valor pequeño de la desviación media, puede ser relevante en los siguientes ejemplos. En control de calidad, indica que los productos son consistentes y que cumplen con los estándares requeridos. En estudios de opinión, revela un consenso general entre los encuestados. Igualmente, en ciencias naturales, una desviación media, pequeña, para un grupo de mediciones, indica que los datos obtenidos son confiables.
Varianza
Es una de las medidas más importantes en estadística, por cuanto incluye, por lo menos, el 75% de los datos ubicados alrededor de la media. Igual que ocurre con la desviación media, entre más pequeño sea su valor, más confiables son las medidas de tendencia central obtenidas. Se representa con s2. Se halla de manera similar a la desviación media, con la diferencia que, el resultado de cada resta, debe elevarse al cuadrado. Su fórmula es:
Ejemplo 3:
Hallar la varianza de los datos del ejercicio anterior.
Solución:
Como ya se anotó, para calcular la varianza se siguen los pasos explicados para hallar la desviación media. Sin embargo, las diferencias dato menos promedio, se elevan al cuadrado (ver figura 2).
Otras medidas de dispersión
Desviación típica
También conocida como desviación estándar, se define como la raíz cuadrada de la varianza y se representa con s. Es importante porque permite determinar el margen de error cometido en la toma de datos. La desviación estándar ideal es de 1. Por lo tanto, un valor alejado por encima o por debajo de 1, indica datos mal tomados, cuya técnica de recolección debe ser replanteada.
Coeficiente de variación media
Es una medida que relaciona la varianza con la media de una muestra. Se usa para comparar el grado de dispersión entre dos o más variables. Su fórmula es:
Los valores del coeficiente de variación se dan en porcentaje. Un valor bajo indica que los datos son confiables.
Taller de lectura
- ¿Qué son las medidas de dispersión?
- Escriba la definición de rango y, además, copie la fórmula y el ejemplo 1.
- Defina la desviación media y, también, escriba la fórmula.
- ¿Cómo se calcula la desviación media?
- Escriba el ejemplo 2.
- ¿Cómo se interpretan los valores de la desviación media?
- Escriba la definición de varianza y, además, copie la fórmula y el ejemplo 3.
- ¿Qué es la desviación típica y por qué es importante?
- ¿Qué es la variación media y cuál es su fórmula?
Deja una respuesta