Geometría PCA

Calculadora de componentes principales 2D

Analiza una matriz de covarianza de dos variables con varianza PCA, varianza explicada, ángulo principal, correlación y distancia de Mahalanobis.

Datos de covarianza

Introduce las dos varianzas, su covarianza y, si quieres, un punto respecto a la media. La calculadora transforma la matriz de covarianza en ejes principales.

Varianza principal

10,41 units²

El autovalor mayor de la matriz de covarianza 2x2.

Varianza explicada

80,04 %

Porcentaje de la varianza total capturado por el primer componente principal.

Ángulo principal

25,1 °

Ángulo del eje de máxima variación medido desde el eje X.

Resumen PCA

La varianza explicada y el ángulo indican si la variación se concentra en una dirección clara. La distancia de Mahalanobis muestra lo inusual que es el punto en ese sistema inclinado.

Varianza secundaria

2,595 units²

Correlación

0,5

Distancia de Mahalanobis

0,694

Relación de ejes

2,002

Determinante de covarianza

27

Visión general

Una calculadora de componentes principales 2D transforma una matriz de covarianza de dos variables en un resumen geométrico fácil de interpretar. El análisis de componentes principales, o PCA, pregunta en qué dirección se concentra la mayor variación. Con dos variables, la respuesta puede expresarse mediante una varianza principal, una varianza secundaria, un ángulo y un porcentaje de varianza explicada. Esto resulta útil en estadística, visualización de datos, incertidumbre de medición, control de calidad, tolerancias de ingeniería y cualquier proceso donde dos magnitudes se muevan juntas.

La calculadora también informa correlación, determinante de covarianza, relación de ejes de la elipse y distancia de Mahalanobis para un punto seleccionado. En conjunto, estos valores explican no solo lo ancho que es el conjunto de datos, sino también cómo está inclinado. Cuando la covarianza es positiva, valores altos de X tienden a aparecer con valores altos de Y y el eje principal se inclina hacia arriba. Cuando es negativa, el eje se inclina hacia abajo. Si la covarianza está cerca de cero, los ejes principales se parecen más a los originales.

Cómo usarla

Introduce la varianza de X, la varianza de Y y la covarianza entre ambas. Usa unidades coherentes, porque las varianzas y la covarianza están en unidades al cuadrado. Añade el tamaño muestral como contexto de la estimación. Si quieres evaluar un punto, introduce sus coordenadas X e Y y la media de cada variable. La parte del punto es opcional para entender los ejes, pero hace que la distancia de Mahalanobis sea significativa.

Fórmula y método

La matriz de covarianza es [[varX, covXY], [covXY, varY]]. La calculadora resuelve sus dos autovalores. El mayor es la varianza principal y el menor es la secundaria. La varianza explicada es el autovalor mayor dividido por la traza de la matriz. El ángulo principal procede de la dirección del autovector. La correlación es la covarianza dividida por el producto de las desviaciones estándar. La distancia de Mahalanobis utiliza la matriz inversa para medir distancia en el sistema inclinado.

Interpretación de resultados

Un porcentaje alto de varianza explicada indica que la mayor parte de la variación se concentra en una dirección casi lineal. Una relación de ejes cercana a uno indica una nube más circular; una relación alta indica una nube alargada. El ángulo principal muestra la orientación de esa elongación. La distancia de Mahalanobis suele ser más útil que la distancia ordinaria porque tiene en cuenta que la variación puede ser naturalmente mayor en una dirección que en otra.

Ejemplo práctico

Supón que la varianza de X es 9, la de Y es 4 y la covarianza es 3. El primer componente principal captura gran parte de la variación combinada porque las variables se mueven juntas. Un punto en X = 2 e Y = 1 quizá no sea inusual si cae sobre la dirección inclinada de mayor variación. La misma distancia ordinaria perpendicular a esa dirección produciría una distancia de Mahalanobis más alta, porque la nube es más estrecha allí.

Limitaciones

La calculadora asume que los valores forman una matriz de covarianza simétrica válida. Si la covarianza es demasiado grande respecto a las varianzas, el determinante puede volverse negativo y la interpretación estadística deja de ser válida. El PCA también es sensible a la escala: variables medidas en unidades mayores pueden dominar si no se estandarizan. Usa esta herramienta para análisis 2D transparente, enseñanza y comprobaciones rápidas; para conjuntos más grandes conviene usar software estadístico completo.