Calculadora de Desviación Estándar
La desviación estándar mide cuánto varían los valores de datos de la media (promedio). Es una de las medidas estadísticas más importantes para comprender la dispersión o variabilidad en un conjunto de datos.
¿Qué es la desviación estándar?
La desviación estándar (σ para población, s para muestra) te dice qué tan dispersos están los valores en relación con la media. Una desviación estándar pequeña significa que los valores están agrupados cerca de la media, mientras que una grande significa que están más dispersos.
Fórmulas
Desviación estándar de población (σ)
Cuando tienes datos para una población entera:
Donde:
- σ = desviación estándar de población
- xᵢ = cada valor en el conjunto de datos
- μ = media de población
- N = tamaño de población
Desviación estándar de muestra (s)
Cuando tienes datos de una muestra de una población más grande:
Donde:
- s = desviación estándar de muestra
- xᵢ = cada valor en el conjunto de datos
- x̄ = media de muestra
- n = tamaño de muestra
- n-1 = grados de libertad (corrección de Bessel)
Varianza
La varianza es el cuadrado de la desviación estándar:
Varianza de población:
Varianza de muestra:
La desviación estándar es simplemente la raíz cuadrada de la varianza.
Ejemplo paso a paso
Conjunto de datos: {4, 8, 6, 5, 3}
Paso 1: Calcular la media
Paso 2: Encontrar desviaciones de la media
- 4 - 5.2 = -1.2
- 8 - 5.2 = 2.8
- 6 - 5.2 = 0.8
- 5 - 5.2 = -0.2
- 3 - 5.2 = -2.2
Paso 3: Elevar al cuadrado cada desviación
- (-1.2)² = 1.44
- (2.8)² = 7.84
- (0.8)² = 0.64
- (-0.2)² = 0.04
- (-2.2)² = 4.84
Paso 4: Sumar cuadrados
Paso 5: Dividir y tomar raíz cuadrada
Desviación estándar de población:
Desviación estándar de muestra:
Población vs. Muestra
Usa desviación estándar de población (σ) cuando:
- Tienes datos para toda la población
- Ejemplo: Alturas de TODOS los estudiantes en tu clase
- Denominador: N (tamaño de población)
Usa desviación estándar de muestra (s) cuando:
- Tienes datos de una muestra
- Ejemplo: Alturas de 30 estudiantes de 500 estudiantes totales
- Denominador: n-1 (corrección de Bessel para estimación sin sesgo)
La mayoría de los estudios usan datos de muestra, por lo que la desviación estándar de muestra (s) es más común.
Interpretación de desviación estándar
Regla empírica (para datos normales)
En una distribución aproximadamente normal:
- 68% de datos dentro de 1σ de la media
- 95% de datos dentro de 2σ de la media
- 99.7% de datos dentro de 3σ de la media
Ejemplo: Si la media es 100 y σ = 15:
- 68% de valores están entre 85-115
- 95% de valores están entre 70-130
- 99.7% de valores están entre 55-145
Valores pequeños vs. grandes
Desviación estándar pequeña (valores agrupados):
- Conjunto de datos: {98, 99, 100, 101, 102}
- Media = 100, σ ≈ 1.41
- Valores muy consistentes
Desviación estándar grande (valores dispersos):
- Conjunto de datos: {50, 75, 100, 125, 150}
- Media = 100, σ ≈ 35.36
- Alta variabilidad
Aplicaciones del mundo real
Control de calidad
Fabricación de tornillos de 10mm:
- Lote A: media = 10mm, σ = 0.1mm (consistente)
- Lote B: media = 10mm, σ = 2mm (inconsistente) Lote A es mucho mejor a pesar de la misma media.
Finanzas
Compare dos inversiones con rendimiento anual del 8%:
- Inversión A: σ = 2% (rendimientos estables)
- Inversión B: σ = 15% (rendimientos volátiles) Inversión A es menos arriesgada.
Educaci ón
Puntuaciones de exámenes de clase:
- Media = 75, σ = 5 (estudiantes al mismo nivel)
- Media = 75, σ = 20 (habilidades muy variadas)
Medicina
Pruebas de laboratorio:
- Valores normales típicamente definidos como media ± 2σ
- Los valores fuera de este rango se señalan
Relación con otras estadísticas
Media
La desviación estándar siempre se calcula en relación con la media. Mide dispersión alrededor de ese punto central.
Rango
El rango (máximo - mínimo) también mide dispersión pero es sensible a valores atípicos. La desviación estándar es más robusta.
Coeficiente de variación (CV)
Desviación estándar relativa expresada como porcentaje:
Útil para comparar variabilidad de conjuntos de datos con diferentes medias.
Propiedades de la desviación estándar
- Siempre no negativa: σ ≥ 0
- Cero solo si todos los valores son idénticos: Si σ = 0, todos xᵢ = μ
- Mismas unidades que los datos: Si mides altura en cm, σ está en cm
- Afectada por valores atípicos: Los valores extremos aumentan σ
- No afectada por sumar/restar constante: Sumar 10 a todos los valores no cambia σ
- Escalas con multiplicación: Duplicar todos los valores duplica σ
Calculando manualmente
Para conjunto pequeño, puedes calcular manualmente:
Método rápido:
- Encuentra la media
- Resta la media de cada valor
- Eleva al cuadrado cada diferencia
- Promedia los cuadrados (dividir por n o n-1)
- Toma la raíz cuadrada
Método alternativo (usando suma de cuadrados):
Este método puede ser más fácil con calculadora.
Errores comunes
- Confundir población y muestra: Usar fórmula incorrecta
- Olvidar elevar al cuadrado: Las desviaciones deben elevarse al cuadrado
- Olvidar raíz cuadrada: La varianza no es lo mismo que la desviación estándar
- Error aritmético: Verificar cálculos cuidadosamente
- Interpretar mal: σ grande no es "malo"—solo diferente
Comparando conjuntos de datos
La desviación estándar te permite comparar la variabilidad:
Clase A: {70, 75, 75, 80, 85}
- Media: 77, σ: 5.48
Clase B: {50, 70, 77, 90, 98}
- Media: 77, σ: 18.08
Ambas clases tienen el mismo promedio, pero la Clase B tiene mucho más variación en rendimiento.
Cuándo usar desviación estándar
Útil para:
- Datos aproximadamente normales
- Comprend er variabilidad
- Pruebas de hipótesis
- Calcular intervalos de confianza
- Control de calidad
Menos útil para:
- Datos altamente sesgados
- Datos con valores atípicos extremos
- Datos categóricos
- Distribuciones no normales
Para datos sesgados o con valores atípicos, considera usar el rango intercuartílico (IQR) en su lugar.
Herramientas avanzadas
Error estándar de la media
Cuando estimas la media poblacional desde una muestra:
Intervalos de confianza
Rango donde es probable que caiga el parámetro poblacional:
Puntuaciones Z
Cuántas desviaciones estándar está un valor de la media:
Resumen
La desviación estándar es una medida fundamental de variabilidad que te dice cuán dispersos están tus puntos de datos alrededor de la media. A diferencia del rango, utiliza todos los puntos de datos y es menos sensible a valores extremos individuales. Comprender la desviación estándar te ayuda a:
- Evaluar la consistencia de los datos
- Identificar valores inusuales
- Comparar la variabilidad entre conjuntos de datos
- Tomar decisiones informadas basadas en incertidumbre
Ya sea analizando rendimiento de estudiantes, rendimientos de inversiones o mediciones de manufactura, la desviación estándar proporciona información crítica sobre la distribución de datos que el promedio por sí solo no puede revelar.