Rango y desviación: medidas de dispersión estadística
📏 Rango y Desviación: Midiendo la variabilidad de los datos
¿Alguna vez dos grupos han tenido la misma media pero uno era mucho más consistente que otro? O ¿has visto datos donde todos los valores están cerca del promedio frente a otros muy dispersos? Las medidas de dispersión como el rango, la desviación media y la desviación típica te permiten cuantificar esa variabilidad. Mientras las medidas de centralización te dicen «dónde está el centro», las medidas de dispersión te dicen «cuánto se alejan los datos de ese centro».
🎯 En este post aprenderás: Cómo calcular e interpretar el rango, la desviación media, la varianza y la desviación típica. Cuándo usar cada medida, sus ventajas y limitaciones, y cómo complementan a la media, mediana y moda.
🔍 ¿Por qué necesitamos medidas de dispersión?
🎯 Dos grupos con misma media pero diferente dispersión
Imagina dos clases con las mismas notas medias pero distribuciones muy diferentes:
- Clase A (homogénea): 6, 6, 7, 7, 7, 7, 8, 8 → Media = 7.0
- Clase B (heterogénea): 2, 4, 6, 7, 7, 8, 10, 12 → Media = 7.0
¡Ambas tienen la misma media (7.0)! Pero en la Clase A todos están cerca de 7, mientras que en la Clase B hay desde suspensos (2) hasta sobresalientes (12). Las medidas de dispersión capturan esta diferencia fundamental que la media por sí sola oculta.
💡 Regla de oro: Nunca reportes solo la media. Siempre acompaña una medida de centralización (media, mediana) con una medida de dispersión (desviación típica, rango intercuartílico). Por ejemplo: «La nota media fue 7.2 con una desviación típica de 1.5 puntos.»
📊 El Rango (o Amplitud)
📏 DEFINICIÓN
- Concepto: Diferencia entre valor máximo y mínimo
- Fórmula: R = Máx – Mín
- Interpretación: «Espacio total» que cubren los datos
- Ventaja: Sencillo de calcular y entender
- Desventaja: Solo usa 2 valores, sensible a outliers
- Símbolo: R
🎯 CUÁNDO USAR
- Análisis preliminar rápido
- Cuando outliers no son problema
- Para datos con pocos valores extremos
- Cuando solo interesa el «span» total
- En control de calidad simple
- Como primera aproximación
❌ CUÁNDO NO USAR
- Datos con valores extremos (outliers)
- Cuando la mayoría está concentrada
- Para comparar dispersión entre grupos
- Análisis estadístico serio
- Cuando outliers distorsionan
- Para inferencias estadísticas
Cálculo y ejemplo del rango
📝 Ejemplo: Temperaturas diarias en una ciudad
Temperaturas máximas (°C) durante una semana: 18, 20, 22, 19, 25, 21, 17
- Identificar valor máximo: 25°C (viernes)
- Identificar valor mínimo: 17°C (domingo)
- Calcular diferencia: R = 25 – 17 = 8°C
- Interpretación: La temperatura varió 8°C durante la semana.
⚠️ Problema del rango con outliers
Grupo A: 5, 6, 7, 8, 9 → Rango = 9 – 5 = 4
Grupo B: 5, 6, 7, 8, 20 → Rango = 20 – 5 = 15
¡El Grupo B parece mucho más disperso (R=15 vs R=4)! Pero en realidad, 4 de 5 valores son iguales en ambos grupos (5,6,7,8). Solo un outlier (20) infla el rango del Grupo B. Esta es la gran limitación del rango.
📊 Rango Intercuartílico (IQR)
📏 DEFINICIÓN MEJORADA
- Concepto: Diferencia entre tercer y primer cuartil
- Fórmula: IQR = Q₃ – Q₁
- Interpretación: Rango del 50% central de datos
- Ventaja: Robusto contra outliers
- Desventaja: Ignora el 50% de datos (25% inferior + 25% superior)
- Símbolo: IQR
📝 CÁLCULO
- Ordenar datos de menor a mayor
- Calcular Q₁ (percentil 25)
- Calcular Q₃ (percentil 75)
- IQR = Q₃ – Q₁
- Para outliers: Q₁ – 1.5×IQR y Q₃ + 1.5×IQR
📝 Ejemplo: Calcular IQR
Datos: 2, 4, 5, 6, 7, 8, 10, 12, 15, 20 (n=10)
- Ya están ordenados
- Calcular Q₁ (posición 25%): 0.25 × 10 = 2.5 → promedio posiciones 2 y 3: (4+5)÷2 = 4.5
- Calcular Q₃ (posición 75%): 0.75 × 10 = 7.5 → promedio posiciones 7 y 8: (10+12)÷2 = 11
- Calcular IQR: 11 – 4.5 = 6.5
- Interpretación: El 50% central de los datos se encuentra en un rango de 6.5 unidades.
📊 Desviación Media
📐 DEFINICIÓN
- Concepto: Promedio de desviaciones absolutas respecto a la media
- Fórmula: DM = Σ|xᵢ – x̄| ÷ n
- Interpretación: «En promedio, cuánto se alejan los datos de la media»
- Ventaja: Fácil de interpretar, usa todos los datos
- Desventaja: Matemáticamente menos útil (valor absoluto)
- Símbolo: DM
🎯 CUÁNDO USAR
- Para enseñanza (concepto intuitivo)
- Cuando se busca interpretación simple
- En contextos no matemáticos avanzados
- Como paso previo a desviación típica
- Para comparar dispersión en misma unidad
- Cuando outliers son moderados
Cálculo paso a paso de la desviación media
📝 Ejemplo: Notas de 5 estudiantes
Datos: 7, 8, 6, 9, 5 (media x̄ = 7)
| Nota (xᵢ) | xᵢ – x̄ | |xᵢ – x̄| |
|---|---|---|
| 7 | 7-7=0 | 0 |
| 8 | 8-7=1 | 1 |
| 6 | 6-7=-1 | 1 |
| 9 | 9-7=2 | 2 |
| 5 | 5-7=-2 | 2 |
| Total | – | 6 |
- Calcular media: x̄ = (7+8+6+9+5)÷5 = 35÷5 = 7
- Calcular desviaciones: xᵢ – x̄ (con signo)
- Tomar valor absoluto: |xᵢ – x̄| (sin signo, todas positivas)
- Sumar desviaciones absolutas: 0+1+1+2+2 = 6
- Dividir entre n: 6 ÷ 5 = 1.2
- Resultado: DM = 1.2
Interpretación: En promedio, las notas se alejan 1.2 puntos de la media (7).
📊 Varianza
📐 DEFINICIÓN
- Concepto: Promedio de desviaciones al cuadrado
- Fórmula muestral: s² = Σ(xᵢ – x̄)² ÷ (n-1)
- Fórmula poblacional: σ² = Σ(xᵢ – μ)² ÷ N
- Interpretación: «Dispersión en unidades cuadradas»
- Ventaja: Bases para análisis estadístico
- Desventaja: Unidades cuadradas, difícil interpretar
- Símbolo: s² (muestra), σ² (población)
🎯 CUÁNDO USAR
- Como paso para desviación típica
- En cálculos estadísticos avanzados
- Para análisis de varianza (ANOVA)
- En fórmulas de regresión
- Cuando se necesita propiedad aditiva
- En pruebas de hipótesis
¿Por qué n-1 en la varianza muestral?
🧠 Explicación intuitiva del «n-1»
Cuando calculamos la varianza de una muestra (s²), usamos n-1 en lugar de n para corregir un pequeño sesgo. Esto se llama corrección de Bessel.
- Problema: La media muestral (x̄) se calcula de los mismos datos, por lo que está «demasiado ajustada» a ellos
- Resultado: Las desviaciones (xᵢ – x̄) tienden a ser ligeramente menores que si usáramos la media poblacional real (μ)
- Solución: Dividir entre n-1 en lugar de n compensa esta subestimación
- Intuición: Con n-1 «grados de libertad», después de calcular x̄, solo n-1 datos pueden variar libremente
Regla práctica: Para población (σ²) dividir entre N. Para muestra (s²) dividir entre n-1.
Cálculo paso a paso de la varianza
📝 Ejemplo: Varianza muestral
Datos: 2, 4, 6, 8, 10 (n=5, muestra)
| xᵢ | xᵢ – x̄ | (xᵢ – x̄)² |
|---|---|---|
| 2 | 2-6=-4 | 16 |
| 4 | 4-6=-2 | 4 |
| 6 | 6-6=0 | 0 |
| 8 | 8-6=2 | 4 |
| 10 | 10-6=4 | 16 |
| Total | – | 40 |
- Calcular media: x̄ = (2+4+6+8+10)÷5 = 30÷5 = 6
- Calcular desviaciones: xᵢ – x̄
- Elevar al cuadrado: (xᵢ – x̄)²
- Sumar cuadrados: 16+4+0+4+16 = 40
- Dividir entre n-1: 40 ÷ (5-1) = 40 ÷ 4 = 10
- Resultado: Varianza muestral s² = 10
Interpretación: La varianza es 10 «unidades cuadradas». ¡Difícil de entender! Por eso sacamos raíz cuadrada para obtener desviación típica.
📊 Desviación Típica (o Estándar)
📏 DEFINICIÓN
- Concepto: Raíz cuadrada de la varianza
- Fórmula muestral: s = √[Σ(xᵢ – x̄)² ÷ (n-1)]
- Fórmula poblacional: σ = √[Σ(xᵢ – μ)² ÷ N]
- Interpretación: «Dispersión en unidades originales»
- Ventaja: Misma unidad que datos, muy útil
- Desventaja: Sensible a outliers (aunque menos que rango)
- Símbolo: s (muestra), σ (población)
🎯 CUÁNDO USAR
- En la mayoría de situaciones
- Para reportar con media
- Comparar dispersión entre grupos
- En regla empírica (68-95-99.7)
- Para cálculos de intervalo de confianza
- En análisis estadístico general
Cálculo paso a paso de la desviación típica
📝 Continuación del ejemplo anterior
Ya calculamos: s² = 10
- Tomar raíz cuadrada de varianza: √10 ≈ 3.16
- Resultado: Desviación típica muestral s ≈ 3.16
Interpretación: Los datos se desvían en promedio unos 3.16 unidades de la media (6).
📚 Ejemplo completo: Notas de dos clases
Clase A: 6, 6, 7, 7, 7, 7, 8, 8
• Media: 7.0, Desviación típica: ≈0.76
Clase B: 2, 4, 6, 7, 7, 8, 10, 12
• Media: 7.0, Desviación típica: ≈3.24
¡Ambas tienen media 7.0! Pero la Clase A tiene desviación pequeña (0.76) → notas muy consistentes. Clase B tiene desviación grande (3.24) → notas muy dispersas. Sin desviación típica, no veríamos esta diferencia crucial.
📊 Regla Empírica (68-95-99.7)
🎯 Para distribuciones aproximadamente normales
Si los datos siguen una distribución normal (en forma de campana de Gauss), entonces:
- 68% de los datos están dentro de 1 desviación típica de la media (x̄ ± 1s)
- 95% de los datos están dentro de 2 desviaciones típicas de la media (x̄ ± 2s)
- 99.7% de los datos están dentro de 3 desviaciones típicas de la media (x̄ ± 3s)
📏 Ejemplo aplicado: Alturas de estudiantes
Supongamos que las alturas de estudiantes tienen distribución normal con:
• Media: 170 cm
• Desviación típica: 10 cm
Aplicando regla empírica:
• 68% miden entre 160-180 cm (170 ± 10)
• 95% miden entre 150-190 cm (170 ± 20)
• 99.7% miden entre 140-200 cm (170 ± 30)
Si un estudiante mide 195 cm, está a 2.5 desviaciones de la media (195-170=25, 25÷10=2.5). Esto es bastante inusual (solo ~1% estarían más lejos).
📊 Coeficiente de Variación (CV)
📈 DEFINICIÓN
- Concepto: Desviación típica relativa a la media
- Fórmula: CV = (s ÷ x̄) × 100%
- Interpretación: «Dispersión relativa» en porcentaje
- Ventaja: Compara dispersión entre grupos con diferentes unidades o escalas
- Desventaja: Solo para datos con escala de razón (con cero absoluto)
- Símbolo: CV
🏭 Ejemplo: Comparando variabilidad en fábricas
Fábrica A (tornillos): Longitud media=5.0cm, s=0.5cm → CV=(0.5÷5.0)×100%=10%
Fábrica B (tuercas): Peso medio=50g, s=8g → CV=(8÷50)×100%=16%
¡Aunque la desviación absoluta es mayor en la fábrica B (8g vs 0.5cm), la variabilidad relativa es mayor en B (16% vs 10%). La fábrica B es menos consistente relativamente.
📊 Comparación completa de todas las medidas de dispersión
| Medida | Fórmula | Ventajas | Desventajas | ¿Cuándo usar? |
|---|---|---|---|---|
| Rango | Máx – Mín | Sencillo, rápido | Solo 2 valores, sensible a outliers | Análisis preliminar |
| Rango Intercuartílico | Q₃ – Q₁ | Robusto contra outliers | Ignora 50% de datos | Datos con outliers, diagramas caja |
| Desviación Media | Σ|xᵢ-x̄|÷n | Fácil interpretación | Valor absoluto, menos útil matemáticamente | Enseñanza, interpretación simple |
| Varianza | Σ(xᵢ-x̄)²÷(n-1) | Bases estadísticas, propiedades algebraicas | Unidades cuadradas, difícil interpretar | Cálculos estadísticos |
| Desviación Típica | √Varianza | Misma unidad, muy útil, regla empírica | Sensible a outliers (aunque menos) | En la mayoría de situaciones |
| Coef. Variación | (s÷x̄)×100% | Compara dispersión entre escalas diferentes | Solo para escalas de razón | Comparar variabilidad relativa |
⚠️ Errores comunes con medidas de dispersión
| Error | Ejemplo incorrecto | Corrección | Consecuencia |
|---|---|---|---|
| Confundir varianza con desviación | Decir «desviación=25» cuando es varianza | Desviación=√25=5 | Interpretación exagerada (5 veces mayor) |
| Usar rango con outliers | 1,2,3,4,5,100 → Rango=99 (engañoso) | Usar IQR o mencionar outlier | Impresión de gran dispersión cuando 5/6 datos están entre 1-5 |
| Comparar desviaciones de medias muy diferentes | s=5 con x̄=10 vs s=5 con x̄=100 | Usar coeficiente de variación | Primer grupo tiene 50% dispersión relativa, segundo solo 5% |
| Olvidar n-1 en varianza muestral | Usar n en lugar de n-1 para muestra | Dividir entre n-1 para muestra | Subestimación de varianza poblacional |
| Aplicar regla empírica a distribuciones no normales | Usar 68-95-99.7 en datos muy sesgados | Verificar normalidad primero | Porcentajes incorrectos, conclusiones erróneas |
| Reportar media sin dispersión | «La media es 7» sin desviación | «Media=7, s=1.5» o «Media=7, rango=4-10» | Información incompleta, puede llevar a malas decisiones |
| Interpretar desviación como rango | «Los datos van de x̄-s a x̄+s» (68% no todos) | x̄±s contiene ~68% de datos (si normales) | Expectativas incorrectas sobre datos individuales |
🧮 Cálculos con datos agrupados
Varianza y desviación para datos agrupados
📝 Ejemplo: Horas de estudio semanales
| Horas | Estudiantes (f) | Marca (x) | f×x | f×x² |
|---|---|---|---|---|
| 0-5 | 10 | 2.5 | 25.0 | 62.5 |
| 5-10 | 15 | 7.5 | 112.5 | 843.75 |
| 10-15 | 20 | 12.5 | 250.0 | 3,125.0 |
| 15-20 | 5 | 17.5 | 87.5 | 1,531.25 |
| Total | 50 | – | 475.0 | 5,562.5 |
- Media aproximada: x̄ = Σ(f×x) ÷ n = 475 ÷ 50 = 9.5 horas
- Varianza aproximada: s² = [Σ(f×x²) – (Σf×x)²/n] ÷ (n-1)
= [5,562.5 – (475)²/50] ÷ 49
= [5,562.5 – 225,625/50] ÷ 49
= [5,562.5 – 4,512.5] ÷ 49
= 1,050 ÷ 49 ≈ 21.43 - Desviación típica: s = √21.43 ≈ 4.63 horas
Interpretación: Los estudiantes estudian en promedio 9.5 horas/semana, con una desviación típica de 4.63 horas.
🌍 Aplicaciones reales en diferentes campos
🏭 Control de calidad
- Tolerancias: Desviación típica para especificar límites aceptables
- Proceso estable: Desviación pequeña indica consistencia
- Six Sigma: Meta: desviación tan pequeña que 6σ quepa dentro de especificaciones
- Gráficos control: Líneas en x̄±3σ para detectar variación anormal
📈 Finanzas e inversiones
- Riesgo: Desviación típica de rendimientos = volatilidad
- Diversificación: Reducir desviación de cartera combinando activos
- Value at Risk (VaR): Basado en desviación para estimar pérdidas potenciales
- Ratio Sharpe: (Rendimiento – libre riesgo) ÷ desviación = rendimiento por riesgo
🔬 Investigación científica
- Error experimental: Desviación de mediciones repetidas
- Significancia estadística: Comparar medias considerando desviaciones
- Intervalos confianza: x̄ ± t×(s/√n) para estimar parámetro poblacional
- Reproducibilidad: Desviación baja entre experimentos similares
🧠 Ejercicios prácticos
Ejercicio 1: Cálculo de todas las medidas
Calcula rango, desviación media, varianza y desviación típica para:
- Edades: 14, 15, 16, 17, 18 (años)
- Notas: 5, 7, 6, 8, 9 (sobre 10)
- Precios: 10, 20, 15, 25, 30 (euros)
- Tiempos: 4.5, 5.2, 4.8, 5.0, 5.5 (minutos)
Para cada conjunto: 1) Calcula todas las medidas, 2) Interpreta la desviación típica, 3) Compara rango con desviación típica.
✅ Ver solución
-
Edades: 14,15,16,17,18
- Media: (14+15+16+17+18)÷5 = 80÷5 = 16 años
- Rango: 18-14 = 4 años
- Desviación media: |14-16|+|15-16|+|16-16|+|17-16|+|18-16| = 2+1+0+1+2 = 6 → 6÷5 = 1.2 años
- Varianza: (4+1+0+1+4)÷4 = 10÷4 = 2.5 años²
- Desviación típica: √2.5 ≈ 1.58 años
- Interpretación: Las edades se desvían en promedio 1.58 años de la media (16). Rango (4) es más del doble que desviación (1.58).
-
Notas: 5,7,6,8,9
- Media: (5+7+6+8+9)÷5 = 35÷5 = 7
- Rango: 9-5 = 4 puntos
- Desviación media: |5-7|+|7-7|+|6-7|+|8-7|+|9-7| = 2+0+1+1+2 = 6 → 6÷5 = 1.2 puntos
- Varianza: (4+0+1+1+4)÷4 = 10÷4 = 2.5 puntos²
- Desviación típica: √2.5 ≈ 1.58 puntos
- Interpretación: Similar al anterior, desviación 1.58 puntos.
-
Precios: 10,20,15,25,30
- Media: (10+20+15+25+30)÷5 = 100÷5 = 20€
- Rango: 30-10 = 20€
- Desviación media: |10-20|+|20-20|+|15-20|+|25-20|+|30-20| = 10+0+5+5+10 = 30 → 30÷5 = 6€
- Varianza: (100+0+25+25+100)÷4 = 250÷4 = 62.5€²
- Desviación típica: √62.5 ≈ 7.91€
- Interpretación: Mayor dispersión: desviación 7.91€, rango 20€.
-
Tiempos: 4.5,5.2,4.8,5.0,5.5
- Media: (4.5+5.2+4.8+5.0+5.5)÷5 = 25÷5 = 5.0 min
- Rango: 5.5-4.5 = 1.0 min
- Desviación media: |4.5-5.0|+|5.2-5.0|+|4.8-5.0|+|5.0-5.0|+|5.5-5.0| = 0.5+0.2+0.2+0+0.5 = 1.4 → 1.4÷5 = 0.28 min
- Varianza: (0.25+0.04+0.04+0+0.25)÷4 = 0.58÷4 = 0.145 min²
- Desviación típica: √0.145 ≈ 0.38 min
- Interpretación: Tiempos muy consistentes: desviación solo 0.38 min.
Ejercicio 2: Comparación de grupos
Dos métodos de enseñanza fueron evaluados. Las notas finales (sobre 20) fueron:
- Método A: 12, 14, 15, 16, 18
- Método B: 8, 14, 15, 16, 22
- Calcula media y desviación típica para cada método
- ¿Qué método tiene mejor rendimiento medio?
- ¿Qué método es más consistente (menos dispersión)?
- Si fueras director, ¿qué método preferirías? Justifica considerando ambas medidas
- ¿Cómo afecta el outlier (22 en Método B) a las medidas?
✅ Ver solución
-
Cálculos:
- Método A: Media = (12+14+15+16+18)÷5 = 75÷5 = 15. Varianza: (9+1+0+1+9)÷4 = 20÷4 = 5. s = √5 ≈ 2.24
- Método B: Media = (8+14+15+16+22)÷5 = 75÷5 = 15. Varianza: (49+1+0+1+49)÷4 = 100÷4 = 25. s = √25 = 5.00
- Rendimiento medio: Ambos tienen misma media (15).
- Consistencia: Método A es más consistente (s=2.24 vs s=5.00). Menos dispersión.
-
Preferencia como director: Depende de objetivos:
- Si quiero consistencia (todos aprenden similar): Método A (menor desviación)
- Si quiero excelencia (algunos sobresalgan aunque otros fallen): Método B (tiene máximo 22)
- Generalmente se prefiere menor dispersión (Método A): más predecible, menos estudiantes en riesgo
-
Efecto del outlier (22):
- Media: Ambas son 15 (el outlier 22 compensa el 8)
- Desviación: Aumenta mucho en Método B (5.00 vs 2.24)
- Rango: Método B: 22-8=14, Método A: 18-12=6 (outlier infla rango)
- Sin outlier (quitando 22): Media B sería (8+14+15+16)÷4 = 53÷4 = 13.25 (menor)
Ejercicio 3: Aplicación de regla empírica
El peso de paquetes en una empresa de mensajería sigue distribución normal con:
- Media: 2.5 kg
- Desviación típica: 0.5 kg
- ¿Entre qué pesos está el 68% de los paquetes?
- ¿Entre qué pesos está el 95% de los paquetes?
- ¿Qué porcentaje pesa más de 3.0 kg?
- ¿Qué porcentaje pesa entre 2.0 y 3.0 kg?
- Si un paquete pesa 3.5 kg, ¿a cuántas desviaciones está de la media?
- ¿Es inusual un paquete de 1.8 kg? Justifica
✅ Ver solución
- 68% de paquetes: 2.5 ± 0.5 = entre 2.0 y 3.0 kg
- 95% de paquetes: 2.5 ± (2×0.5) = 2.5 ± 1.0 = entre 1.5 y 3.5 kg
- Más de 3.0 kg: 3.0 kg está a +1σ (3.0-2.5=0.5, 0.5÷0.5=1). Por regla empírica, fuera de ±1σ hay 32% (100%-68%), la mitad en cada cola → 16% pesa más de 3.0 kg.
- Entre 2.0 y 3.0 kg: Es exactamente ±1σ → 68% (por regla empírica).
- 3.5 kg: (3.5-2.5)÷0.5 = 1.0÷0.5 = 2 desviaciones estándar.
- 1.8 kg: (2.5-1.8)÷0.5 = 0.7÷0.5 = 1.4σ. No es muy inusual (dentro de 2σ que contiene 95%). Más específicamente: entre -1.4σ y media hay ~42% (tabla Z), más 50% sobre media = 92% pesan más que 1.8kg, solo ~8% pesan menos.
Ejercicio 4: Análisis de datos agrupados
Esta tabla muestra ingresos mensuales de 100 familias:
| Ingreso (€) | Familias |
|---|---|
| 500-1000 | 10 |
| 1000-1500 | 20 |
| 1500-2000 | 35 |
| 2000-2500 | 25 |
| 2500-3000 | 10 |
- Calcula la media aproximada de ingresos
- Calcula la varianza y desviación típica aproximadas
- ¿En qué intervalo está la moda?
- Calcula el coeficiente de variación
- Interpreta los resultados en contexto
✅ Ver solución
-
Media aproximada:
Media: 177,500 ÷ 100 = 1,775 €Intervalo Marca (x) Fam (f) f×x f×x² 500-1000 750 10 7,500 5,625,000 1000-1500 1250 20 25,000 31,250,000 1500-2000 1750 35 61,250 107,187,500 2000-2500 2250 25 56,250 126,562,500 2500-3000 2750 10 27,500 75,625,000 Total – 100 177,500 346,250,000 -
Varianza y desviación:
Varianza: s² = [Σ(f×x²) – (Σf×x)²/n] ÷ (n-1)
= [346,250,000 – (177,500)²/100] ÷ 99
= [346,250,000 – 315,062,500] ÷ 99
= 31,187,500 ÷ 99 ≈ 315,025.25 €²
Desviación: s = √315,025.25 ≈ 561.27 € - Intervalo modal: 1500-2000 € (mayor frecuencia: 35 familias).
- Coeficiente variación: CV = (561.27 ÷ 1,775) × 100% ≈ 31.6%
-
Interpretación:
- Ingreso medio: 1,775 €/mes
- Desviación: 561 € (los ingresos se desvían en promedio 561€ de la media)
- CV 31.6%: Variabilidad relativa moderada-alta
- Distribución: Mayor concentración en 1500-2000€ (moda), pero hay dispersión considerable
Ejercicio 5: Proyecto de investigación
Imagina que estudias el tiempo diario que estudiantes dedican a redes sociales:
- Recolectas datos de 15 compañeros (o inventa datos realistas)
- Los tiempos en horas: 1, 2, 3, 4, 2, 5, 1, 3, 4, 2, 6, 1, 3, 2, 4
- Calcula media, mediana y moda
- Calcula rango, desviación media, varianza y desviación típica
- Crea una tabla de frecuencias simple
- Aplica regla empírica (si es aproximadamente normal)
- Compara con estudio nacional que dice: media=2.8h, s=1.2h
- Escribe un breve informe con conclusiones
✅ Ver solución
-
Medidas centralización:
- Datos: 1,1,1,2,2,2,2,3,3,3,4,4,4,5,6 (ordenados)
- Media: (1×3 + 2×4 + 3×3 + 4×3 + 5 + 6) ÷ 15 = (3+8+9+12+5+6)÷15 = 43÷15 ≈ 2.87 horas
- Mediana: 15 datos → posición 8 → 3 horas
- Moda: 2 horas (aparece 4 veces)
-
Medidas dispersión:
- Rango: 6-1 = 5 horas
- Desviación media: calcular |xᵢ-2.87|, sumar, dividir 15 ≈ 1.28 horas
- Varianza: calcular (xᵢ-2.87)², sumar=38.93, dividir 14 ≈ 2.78 horas²
- Desviación típica: √2.78 ≈ 1.67 horas
-
Tabla frecuencias:
Horas Estudiantes 1 3 2 4 3 3 4 3 5 1 6 1 Total 15 -
Regla empírica (aproximada):
- Media±s: 2.87±1.67 = 1.20 a 4.54 horas → debería contener ~68% datos
- Datos en ese intervalo: 1,2,2,2,2,3,3,3,4,4,4 (11 de 15 = 73%) → cercano a 68%
- Media±2s: 2.87±3.34 = -0.47 a 6.21 → todos los datos (100%) dentro (esperado 95%)
-
Comparación nacional:
- Nuestro grupo: media=2.87h, s=1.67h
- Nacional: media=2.8h, s=1.2h
- Nuestra media similar (2.87 vs 2.8)
- Nuestra desviación mayor (1.67 vs 1.2) → más variabilidad en nuestro grupo
-
Informe breve:
«Estudio sobre uso redes sociales – Muestra: 15 estudiantes
• Media: 2.87 horas/día (similar a nacional: 2.8h)
• Mediana: 3 horas (mitad usa menos, mitad más)
• Moda: 2 horas (lo más común)
• Desviación típica: 1.67 horas (mayor que nacional 1.2h → más variabilidad)
• Rango: 1-6 horas (amplia diferencia entre estudiantes)
• Conclusión: Uso similar al promedio nacional pero con mayor dispersión, indicando hábitos muy diferentes entre estudiantes.»
📖 Glosario de términos de dispersión
| Término | Definición | Símbolo/Fórmula |
|---|---|---|
| Rango | Diferencia entre máximo y mínimo | R = xₘₐₓ – xₘᵢₙ |
| Rango Intercuartílico | Diferencia entre tercer y primer cuartil | IQR = Q₃ – Q₁ |
| Desviación Media | Promedio de desviaciones absolutas | DM = Σ|xᵢ-x̄| ÷ n |
| Varianza | Promedio de desviaciones al cuadrado | s² = Σ(xᵢ-x̄)² ÷ (n-1) (muestra) |
| Desviación Típica | Raíz cuadrada de la varianza | s = √[Σ(xᵢ-x̄)² ÷ (n-1)] |
| Coeficiente Variación | Desviación relativa a la media | CV = (s ÷ x̄) × 100% |
| Outlier | Valor extremadamente diferente | Generalmente fuera de Q₁-1.5×IQR o Q₃+1.5×IQR |
| Regla Empírica | 68-95-99.7 para distribuciones normales | x̄±1s:68%, x̄±2s:95%, x̄±3s:99.7% |
| Dispersión | Variabilidad o esparcimiento de datos | Opuesto a concentración |
| Homogeneidad | Grado en que datos son similares | Baja desviación = alta homogeneidad |
| Heterogeneidad | Grado en que datos son diferentes | Alta desviación = alta heterogeneidad |
📚 Serie completa: Estadística Descriptiva
Continúa aprendiendo sobre estadística descriptiva con nuestros posts especializados:
- Población, muestra e individuos – Conceptos básicos
- Tipos de gráficos estadísticos – Cuándo usar cada gráfico
- Media, moda y mediana – Medidas de centralización
- Rango y desviación – ¡Estás aquí! Medidas de dispersión
- Cómo diseñar e interpretar una encuesta – Guía paso a paso
- Estadística descriptiva completa – Resumen integrador
🔍 Actividad práctica: El periodista de datos
- Elige un tema de actualidad (ej: precios vivienda, salarios, notas acceso universidad).
- Busca datos reales (pueden ser inventados pero realistas).
- Calcula medidas de centralización y dispersión.
- Analiza: ¿Qué es más interesante: la media o la dispersión? ¿Hay outliers?
- Escribe un titular: «Los salarios varían más de lo que crees: desviación de X€»
- Crea una visualización que muestre tanto centro como dispersión.
¡Conviértete en un experto detectando no solo promedios, sino también variabilidad!



Publicar comentario