Päävarianssi
10,41 units²
2x2-kovarianssimatriisin suurempi ominaisarvo.
Analysoi kahden muuttujan kovarianssimatriisia: PCA-varianssi, selitysosuus, pääsuunnan kulma, korrelaatio ja Mahalanobis-etäisyys.
Syötä kaksi varianssia, niiden kovarianssi ja halutessasi piste suhteessa keskiarvoon. Laskuri muuntaa kovarianssimatriisin pääakseleiksi.
Päävarianssi
10,41 units²
2x2-kovarianssimatriisin suurempi ominaisarvo.
Selitetty varianssi
80,04 %
Osuus kokonaisvaihtelusta, jonka ensimmäinen pääkomponentti selittää.
Pääsuunnan kulma
25,1 °
Päävaihtelusuunnan kulma X-akselista mitattuna.
Selitysosuus ja kulma kertovat, kulkeeko suurin vaihtelu selkeään suuntaan. Mahalanobis-etäisyys näyttää, kuinka poikkeava valittu piste on kallistetussa koordinaatistossa.
Toissijainen varianssi
2,595 units²
Korrelaatio
0,5
Mahalanobis-etäisyys
0,694
Ellipsin akselisuhde
2,002
Kovarianssideterminantti
27
2D-pääkomponenttilaskuri muuntaa kahden muuttujan kovarianssimatriisin helposti tulkittavaksi geometriseksi yhteenvedoksi. Pääkomponenttianalyysi eli PCA kysyy, missä suunnassa aineistossa on eniten vaihtelua. Kahden muuttujan tapauksessa vastaus voidaan esittää päävarianssina, toissijaisena varianssina, kulmana ja selitetyn varianssin osuutena. Tämä on hyödyllistä tilastotieteessä, datan visualisoinnissa, mittausepävarmuudessa, laadunvalvonnassa, teknisissä toleransseissa ja kaikissa tilanteissa, joissa kaksi suuretta liikkuu yhdessä.
Laskuri antaa myös korrelaation, kovarianssideterminantin, ellipsin akselisuhteen ja valitun pisteen Mahalanobis-etäisyyden. Yhdessä nämä luvut kertovat, kuinka leveä havaintopilvi on ja mihin suuntaan se kallistuu. Positiivinen kovarianssi tarkoittaa, että suuret X-arvot esiintyvät usein suurten Y-arvojen kanssa, jolloin pääakseli kallistuu ylöspäin. Negatiivinen kovarianssi kallistaa akselin alaspäin. Lähellä nollaa oleva kovarianssi pitää pääsuunnat lähempänä alkuperäisiä akseleita.
Syötä X:n varianssi, Y:n varianssi ja muuttujien välinen kovarianssi. Käytä johdonmukaisia yksiköitä, koska varianssit ja kovarianssi ovat neliöidyissä yksiköissä. Lisää havaintojen määrä taustatiedoksi. Jos haluat tarkastella yksittäistä pistettä, syötä sen X- ja Y-koordinaatit sekä muuttujien keskiarvot. Piste ei ole välttämätön pääakselien ymmärtämiseksi, mutta se tekee Mahalanobis-etäisyydestä hyödyllisen.
Kovarianssimatriisi on [[varX, covXY], [covXY, varY]]. Laskuri ratkaisee matriisin kaksi ominaisarvoa. Suurempi ominaisarvo on päävarianssi ja pienempi toissijainen varianssi. Selitetty varianssi saadaan jakamalla suurempi ominaisarvo matriisin jäljellä eli varianssien summalla. Pääsuunnan kulma johdetaan ominaisvektorista. Korrelaatio on kovarianssi jaettuna X:n ja Y:n keskihajontojen tulolla. Mahalanobis-etäisyys käyttää kovarianssimatriisin käänteistä muotoa.
Korkea selitetyn varianssin osuus tarkoittaa, että suurin osa vaihtelusta kulkee yhtä selkeää linjaa pitkin. Akselisuhde lähellä yhtä tarkoittaa pyöreämpää hajontaa, kun taas suuri akselisuhde kertoo venyneestä ellipsistä. Kulma näyttää, mihin suuntaan venymä osoittaa. Mahalanobis-etäisyys on usein tavallista etäisyyttä parempi, koska se huomioi, että vaihtelu voi olla luonnostaan suurempaa yhdessä suunnassa kuin toisessa.
Oletetaan, että X:n varianssi on 9, Y:n varianssi 4 ja kovarianssi 3. Ensimmäinen pääkomponentti selittää suuren osan kokonaisvaihtelusta, koska muuttujat liikkuvat yhdessä. Piste X = 2, Y = 1 ei välttämättä ole poikkeava, jos se sijaitsee kallistuneen suuren vaihtelun suunnassa. Sama tavallinen etäisyys kohtisuoraan pääsuuntaa vastaan tuottaisi suuremman Mahalanobis-etäisyyden, koska havaintopilvi on siinä suunnassa kapeampi.
Laskuri olettaa, että annetut arvot muodostavat järkevän symmetrisen kovarianssimatriisin. Jos kovarianssi on liian suuri suhteessa variansseihin, determinantti voi muuttua negatiiviseksi ja tilastollinen tulkinta hajoaa. PCA on myös herkkä skaalalle: suuremmissa yksiköissä mitatut muuttujat voivat hallita tulosta, ellei niitä standardoida. Käytä työkalua läpinäkyvään 2D-analyysiin, opetukseen ja tarkistuksiin; suuremmille aineistoille kannattaa käyttää varsinaista tilasto-ohjelmistoa.
Kannattaako muuttujat standardoida ennen PCA-tulkintaa? Kyllä, jos X ja Y ovat eri yksiköissä tai eri mittakaavassa. Standardointi muuttaa analyysin korrelaatiopohjaiseksi ja estää suurinumeroista muuttujaa hallitsemasta pääsuuntaa. Jos taas molemmat muuttujat ovat samassa luonnollisessa yksikössä, alkuperäinen kovarianssimatriisi voi olla juuri oikea valinta.