A ferdeség megértése a statisztikákban és az adatelemzésben
A ferdeség annak mértéke, amennyivel egy adathalmaz eltér a szimmetrikus eloszlástól. Ez az adatpontok átlagos távolsága az eloszlás középpontjától. Más szóval a ferdeség azt méri, hogy mennyire "ferde" vagy "ferde" egy eloszlás. A nagy ferdeségű eloszlás azt jelenti, hogy az adatpontok jobban eloszlanak a középpont egyik oldalán, mint a másikon, míg az alacsony ferdeségű eloszlás azt jelenti, hogy az adatpontok egyenletesebben oszlanak el a középpont körül. A ferdeséget a következő képlet segítségével számítjuk ki. :
Askewness = (az átlagtól való összes eltérés összege) / (az eloszlás szórása)
ahol az átlagtól való összes eltérés összegét úgy számítjuk ki, hogy minden adatpontból kivonjuk az átlagot, majd összeadjuk ezeket a különbségeket, és a standardot az eloszlás eltérése az eloszlás varianciájának négyzetgyöke.
A ferdeség többféleképpen használható a statisztikákban és az adatelemzésben, például:
1. Annak meghatározása, hogy egy adatkészlet szimmetrikus-e vagy sem. Ha a ferdeség közel nulla, akkor az adatkészlet nagyjából szimmetrikus. Ha a ferdeség nagy, akkor az adatkészlet erősen ferde.
2. Különböző adatkészletek alakjának összehasonlítása. A különböző típusú adatok gyakran eltérő ferdeségi szinttel rendelkeznek. Például a pénzügyi adatok ferdebbek lehetnek, mint a tudományos adatok.
3. Kiugró értékek azonosítása egy adatkészletben. Az eloszlás középpontjától távol eső adatpontok valószínűleg nagy befolyást gyakorolnak a ferdeség mértékére.
4. Statisztikai tesztek feltevésének ellenőrzésére. Számos statisztikai teszt feltételezi, hogy az adatok nagyjából szimmetrikusak és normális eloszlásúak. Ha az adatok ferdesége magas, akkor előfordulhat, hogy ezek a feltételezések nem érvényesek.



