Hauptvarianz
10,41 units²
Der größere Eigenwert der 2x2-Kovarianzmatrix.
Analysiere eine zweidimensionale Kovarianzmatrix mit PCA-Varianz, erklärter Varianz, Hauptwinkel, Korrelation und Mahalanobis-Abstand.
Gib die beiden Varianzen, ihre Kovarianz und optional einen Punkt relativ zum Mittelwert ein. Der Rechner wandelt die Kovarianzmatrix in Hauptachsen um.
Hauptvarianz
10,41 units²
Der größere Eigenwert der 2x2-Kovarianzmatrix.
Erklärte Varianz
80,04 %
Anteil der Gesamtvarianz, den die erste Hauptkomponente erfasst.
Hauptwinkel
25,1 °
Winkel der Hauptstreuungsachse zur X-Achse.
Erklärte Varianz und Winkel zeigen, ob die Streuung in einer klaren Richtung liegt. Der Mahalanobis-Abstand zeigt, wie ungewöhnlich der Punkt in diesem gedrehten Koordinatensystem ist.
Nebenvarianz
2,595 units²
Korrelation
0,5
Mahalanobis-Abstand
0,694
Ellipsen-Achsenverhältnis
2,002
Kovarianzdeterminante
27
Ein 2D-Hauptkomponenten-Rechner verwandelt eine Kovarianzmatrix mit zwei Variablen in eine verständliche geometrische Zusammenfassung. Die Hauptkomponentenanalyse, kurz PCA, fragt, in welcher Richtung die Daten am stärksten streuen. Bei zwei Variablen lässt sich die Antwort als Hauptvarianz, Nebenvarianz, Winkel und Anteil erklärter Varianz darstellen. Das ist nützlich in Statistik, Datenvisualisierung, Messunsicherheit, Qualitätskontrolle, technischen Toleranzen und überall dort, wo zwei Größen gemeinsam variieren.
Der Rechner gibt zusätzlich Korrelation, Kovarianzdeterminante, Ellipsen-Achsenverhältnis und Mahalanobis-Abstand für einen ausgewählten Punkt aus. Zusammen zeigen diese Werte nicht nur, wie breit die Punktwolke ist, sondern auch, wie sie gedreht ist. Positive Kovarianz bedeutet, dass hohe X-Werte häufig mit hohen Y-Werten auftreten und die Hauptachse nach oben kippt. Negative Kovarianz kippt sie nach unten. Liegt die Kovarianz nahe null, bleiben die Hauptachsen näher an den ursprünglichen Koordinatenachsen.
Gib Varianz von X, Varianz von Y und die Kovarianz zwischen beiden ein. Achte auf einheitliche Einheiten, weil Varianzen und Kovarianz quadrierte Einheiten haben. Ergänze die Stichprobengröße als Kontext der Schätzung. Wenn du einen Punkt bewerten möchtest, gib seine X- und Y-Koordinaten sowie die Mittelwerte beider Variablen ein. Der Punkt ist für die Hauptachsen nicht zwingend nötig, macht aber den Mahalanobis-Abstand aussagekräftig.
Die Kovarianzmatrix lautet [[varX, covXY], [covXY, varY]]. Der Rechner löst ihre zwei Eigenwerte. Der größere Eigenwert ist die Hauptvarianz, der kleinere die Nebenvarianz. Die erklärte Varianz ist der größere Eigenwert geteilt durch die Spur der Matrix. Der Hauptwinkel stammt aus der Richtung des Eigenvektors. Korrelation ist Kovarianz geteilt durch das Produkt der Standardabweichungen. Der Mahalanobis-Abstand nutzt die inverse Kovarianzmatrix und misst Abstand im gedrehten System.
Ein hoher Anteil erklärter Varianz bedeutet, dass die Variation stark in einer linienartigen Richtung liegt. Ein Achsenverhältnis nahe eins bedeutet eine eher runde Streuung; ein großes Verhältnis zeigt eine gestreckte Ellipse. Der Winkel zeigt, wohin diese Ellipse zeigt. Mahalanobis-Abstand ist oft sinnvoller als gewöhnlicher Abstand, weil er berücksichtigt, dass natürliche Streuung in einer Richtung größer sein kann als in einer anderen.
Angenommen, Varianz X ist 9, Varianz Y ist 4 und die Kovarianz ist 3. Die erste Hauptkomponente erfasst den Großteil der gemeinsamen Streuung, weil die Variablen zusammenlaufen. Ein Punkt bei X = 2 und Y = 1 muss nicht ungewöhnlich sein, wenn er entlang der geneigten Hauptstreuungsrichtung liegt. Derselbe gewöhnliche Abstand quer zu dieser Richtung ergäbe einen größeren Mahalanobis-Abstand, weil die Punktwolke dort schmaler ist.
Der Rechner setzt voraus, dass die Werte eine gültige symmetrische Kovarianzmatrix bilden. Ist die Kovarianz zu groß im Verhältnis zu den Varianzen, kann die Determinante negativ werden und die statistische Interpretation bricht. PCA ist außerdem skalenempfindlich: Variablen mit größeren Einheiten können dominieren, wenn sie nicht standardisiert werden. Nutze das Tool für transparente 2D-Analysen, Unterricht und schnelle Prüfungen; für größere Datensätze ist Statistiksoftware besser geeignet.