La desviación estándar mide cuánto varían los valores de datos de la media (promedio). Es una de las medidas estadísticas más importantes para comprender la dispersión o variabilidad en un conjunto de datos.

¿Qué es la desviación estándar?

La desviación estándar (σ para población, s para muestra) te dice qué tan dispersos están los valores en relación con la media. Una desviación estándar pequeña significa que los valores están agrupados cerca de la media, mientras que una grande significa que están más dispersos.

Fórmulas

Desviación estándar de población (σ)

Cuando tienes datos para una población entera:

σ = \frac{\sum ( x _{i} - μ ) ^{2}}{N}

Donde:

σ = desviación estándar de población
xᵢ = cada valor en el conjunto de datos
μ = media de población
N = tamaño de población

Desviación estándar de muestra (s)

Cuando tienes datos de una muestra de una población más grande:

s = \frac{\sum ( x _{i} - x ˉ ) ^{2}}{n - 1}

Donde:

s = desviación estándar de muestra
xᵢ = cada valor en el conjunto de datos
x̄ = media de muestra
n = tamaño de muestra
n-1 = grados de libertad (corrección de Bessel)

Varianza

La varianza es el cuadrado de la desviación estándar:

Varianza de población:

σ^{2} = \frac{\sum ( x _{i} - μ ) ^{2}}{N}

Varianza de muestra:

s^{2} = \frac{\sum ( x _{i} - x ˉ ) ^{2}}{n - 1}

La desviación estándar es simplemente la raíz cuadrada de la varianza.

Ejemplo paso a paso

Conjunto de datos: {4, 8, 6, 5, 3}

Paso 1: Calcular la media

\overset{x}{ˉ} = \frac{4 + 8 + 6 + 5 + 3}{5} = \frac{26}{5} = 5.2

Paso 2: Encontrar desviaciones de la media

4 - 5.2 = -1.2
8 - 5.2 = 2.8
6 - 5.2 = 0.8
5 - 5.2 = -0.2
3 - 5.2 = -2.2

Paso 3: Elevar al cuadrado cada desviación

(-1.2)² = 1.44
(2.8)² = 7.84
(0.8)² = 0.64
(-0.2)² = 0.04
(-2.2)² = 4.84

Paso 4: Sumar cuadrados

\sum (x_{i} - \overset{x}{ˉ})^{2} = 1.44 + 7.84 + 0.64 + 0.04 + 4.84 = 14.8

Paso 5: Dividir y tomar raíz cuadrada

Desviación estándar de población:

σ = \frac{14.8}{5} = 2.96 \approx 1.72

Desviación estándar de muestra:

s = \frac{14.8}{4} = 3.7 \approx 1.92

Población vs. Muestra

Usa desviación estándar de población (σ) cuando:

Tienes datos para toda la población
Ejemplo: Alturas de TODOS los estudiantes en tu clase
Denominador: N (tamaño de población)

Usa desviación estándar de muestra (s) cuando:

Tienes datos de una muestra
Ejemplo: Alturas de 30 estudiantes de 500 estudiantes totales
Denominador: n-1 (corrección de Bessel para estimación sin sesgo)

La mayoría de los estudios usan datos de muestra, por lo que la desviación estándar de muestra (s) es más común.

Interpretación de desviación estándar

Regla empírica (para datos normales)

En una distribución aproximadamente normal:

68% de datos dentro de 1σ de la media
95% de datos dentro de 2σ de la media
99.7% de datos dentro de 3σ de la media

Ejemplo: Si la media es 100 y σ = 15:

68% de valores están entre 85-115
95% de valores están entre 70-130
99.7% de valores están entre 55-145

Valores pequeños vs. grandes

Desviación estándar pequeña (valores agrupados):

Conjunto de datos: {98, 99, 100, 101, 102}
Media = 100, σ ≈ 1.41
Valores muy consistentes

Desviación estándar grande (valores dispersos):

Conjunto de datos: {50, 75, 100, 125, 150}
Media = 100, σ ≈ 35.36
Alta variabilidad

Aplicaciones del mundo real

Control de calidad

Fabricación de tornillos de 10mm:

Lote A: media = 10mm, σ = 0.1mm (consistente)
Lote B: media = 10mm, σ = 2mm (inconsistente) Lote A es mucho mejor a pesar de la misma media.

Finanzas

Compare dos inversiones con rendimiento anual del 8%:

Inversión A: σ = 2% (rendimientos estables)
Inversión B: σ = 15% (rendimientos volátiles) Inversión A es menos arriesgada.

Educaci ón

Puntuaciones de exámenes de clase:

Media = 75, σ = 5 (estudiantes al mismo nivel)
Media = 75, σ = 20 (habilidades muy variadas)

Medicina

Pruebas de laboratorio:

Valores normales típicamente definidos como media ± 2σ
Los valores fuera de este rango se señalan

Relación con otras estadísticas

Media

La desviación estándar siempre se calcula en relación con la media. Mide dispersión alrededor de ese punto central.

Rango

El rango (máximo - mínimo) también mide dispersión pero es sensible a valores atípicos. La desviación estándar es más robusta.

Coeficiente de variación (CV)

Desviación estándar relativa expresada como porcentaje:

C V = \frac{σ}{μ} \times 100%

Útil para comparar variabilidad de conjuntos de datos con diferentes medias.

Propiedades de la desviación estándar

Siempre no negativa: σ ≥ 0
Cero solo si todos los valores son idénticos: Si σ = 0, todos xᵢ = μ
Mismas unidades que los datos: Si mides altura en cm, σ está en cm
Afectada por valores atípicos: Los valores extremos aumentan σ
No afectada por sumar/restar constante: Sumar 10 a todos los valores no cambia σ
Escalas con multiplicación: Duplicar todos los valores duplica σ

Calculando manualmente

Para conjunto pequeño, puedes calcular manualmente:

Método rápido:

Encuentra la media
Resta la media de cada valor
Eleva al cuadrado cada diferencia
Promedia los cuadrados (dividir por n o n-1)
Toma la raíz cuadrada

Método alternativo (usando suma de cuadrados):

s = \frac{n \sum x _{i}^{2} - ( \sum x _{i} ) ^{2}}{n ( n - 1 )}

Este método puede ser más fácil con calculadora.

Errores comunes

Confundir población y muestra: Usar fórmula incorrecta
Olvidar elevar al cuadrado: Las desviaciones deben elevarse al cuadrado
Olvidar raíz cuadrada: La varianza no es lo mismo que la desviación estándar
Error aritmético: Verificar cálculos cuidadosamente
Interpretar mal: σ grande no es "malo"—solo diferente

Comparando conjuntos de datos

La desviación estándar te permite comparar la variabilidad:

Clase A: {70, 75, 75, 80, 85}

Media: 77, σ: 5.48

Clase B: {50, 70, 77, 90, 98}

Media: 77, σ: 18.08

Ambas clases tienen el mismo promedio, pero la Clase B tiene mucho más variación en rendimiento.

Cuándo usar desviación estándar

Útil para:

Datos aproximadamente normales
Comprend er variabilidad
Pruebas de hipótesis
Calcular intervalos de confianza
Control de calidad

Menos útil para:

Datos altamente sesgados
Datos con valores atípicos extremos
Datos categóricos
Distribuciones no normales

Para datos sesgados o con valores atípicos, considera usar el rango intercuartílico (IQR) en su lugar.

Herramientas avanzadas

Error estándar de la media

Cuando estimas la media poblacional desde una muestra:

SE = \frac{s}{n}

Intervalos de confianza

Rango donde es probable que caiga el parámetro poblacional:

I C_{95%} = \overset{x}{ˉ} \pm 1.96 \times SE

Puntuaciones Z

Cuántas desviaciones estándar está un valor de la media:

z = \frac{x - μ}{σ}

Resumen

La desviación estándar es una medida fundamental de variabilidad que te dice cuán dispersos están tus puntos de datos alrededor de la media. A diferencia del rango, utiliza todos los puntos de datos y es menos sensible a valores extremos individuales. Comprender la desviación estándar te ayuda a:

Evaluar la consistencia de los datos
Identificar valores inusuales
Comparar la variabilidad entre conjuntos de datos
Tomar decisiones informadas basadas en incertidumbre

Ya sea analizando rendimiento de estudiantes, rendimientos de inversiones o mediciones de manufactura, la desviación estándar proporciona información crítica sobre la distribución de datos que el promedio por sí solo no puede revelar.

Calculadora de desviación estándar

Resultados Detallados