Varianza principal
10,41 units²
El autovalor mayor de la matriz de covarianza 2x2.
Analiza una matriz de covarianza de dos variables con varianza PCA, varianza explicada, ángulo principal, correlación y distancia de Mahalanobis.
Introduce las dos varianzas, su covarianza y, si quieres, un punto respecto a la media. La calculadora transforma la matriz de covarianza en ejes principales.
Varianza principal
10,41 units²
El autovalor mayor de la matriz de covarianza 2x2.
Varianza explicada
80,04 %
Porcentaje de la varianza total capturado por el primer componente principal.
Ángulo principal
25,1 °
Ángulo del eje de máxima variación medido desde el eje X.
La varianza explicada y el ángulo indican si la variación se concentra en una dirección clara. La distancia de Mahalanobis muestra lo inusual que es el punto en ese sistema inclinado.
Varianza secundaria
2,595 units²
Correlación
0,5
Distancia de Mahalanobis
0,694
Relación de ejes
2,002
Determinante de covarianza
27
Una calculadora de componentes principales 2D transforma una matriz de covarianza de dos variables en un resumen geométrico fácil de interpretar. El análisis de componentes principales, o PCA, pregunta en qué dirección se concentra la mayor variación. Con dos variables, la respuesta puede expresarse mediante una varianza principal, una varianza secundaria, un ángulo y un porcentaje de varianza explicada. Esto resulta útil en estadística, visualización de datos, incertidumbre de medición, control de calidad, tolerancias de ingeniería y cualquier proceso donde dos magnitudes se muevan juntas.
La calculadora también informa correlación, determinante de covarianza, relación de ejes de la elipse y distancia de Mahalanobis para un punto seleccionado. En conjunto, estos valores explican no solo lo ancho que es el conjunto de datos, sino también cómo está inclinado. Cuando la covarianza es positiva, valores altos de X tienden a aparecer con valores altos de Y y el eje principal se inclina hacia arriba. Cuando es negativa, el eje se inclina hacia abajo. Si la covarianza está cerca de cero, los ejes principales se parecen más a los originales.
Introduce la varianza de X, la varianza de Y y la covarianza entre ambas. Usa unidades coherentes, porque las varianzas y la covarianza están en unidades al cuadrado. Añade el tamaño muestral como contexto de la estimación. Si quieres evaluar un punto, introduce sus coordenadas X e Y y la media de cada variable. La parte del punto es opcional para entender los ejes, pero hace que la distancia de Mahalanobis sea significativa.
La matriz de covarianza es [[varX, covXY], [covXY, varY]]. La calculadora resuelve sus dos autovalores. El mayor es la varianza principal y el menor es la secundaria. La varianza explicada es el autovalor mayor dividido por la traza de la matriz. El ángulo principal procede de la dirección del autovector. La correlación es la covarianza dividida por el producto de las desviaciones estándar. La distancia de Mahalanobis utiliza la matriz inversa para medir distancia en el sistema inclinado.
Un porcentaje alto de varianza explicada indica que la mayor parte de la variación se concentra en una dirección casi lineal. Una relación de ejes cercana a uno indica una nube más circular; una relación alta indica una nube alargada. El ángulo principal muestra la orientación de esa elongación. La distancia de Mahalanobis suele ser más útil que la distancia ordinaria porque tiene en cuenta que la variación puede ser naturalmente mayor en una dirección que en otra.
Supón que la varianza de X es 9, la de Y es 4 y la covarianza es 3. El primer componente principal captura gran parte de la variación combinada porque las variables se mueven juntas. Un punto en X = 2 e Y = 1 quizá no sea inusual si cae sobre la dirección inclinada de mayor variación. La misma distancia ordinaria perpendicular a esa dirección produciría una distancia de Mahalanobis más alta, porque la nube es más estrecha allí.
La calculadora asume que los valores forman una matriz de covarianza simétrica válida. Si la covarianza es demasiado grande respecto a las varianzas, el determinante puede volverse negativo y la interpretación estadística deja de ser válida. El PCA también es sensible a la escala: variables medidas en unidades mayores pueden dominar si no se estandarizan. Usa esta herramienta para análisis 2D transparente, enseñanza y comprobaciones rápidas; para conjuntos más grandes conviene usar software estadístico completo.