Înțelegerea askewness în statistică și analiza datelor
Askewness este o măsură a cantității cu care un set de date se abate de la o distribuție simetrică. Este definită ca distanța medie a punctelor de date față de centrul distribuției.
Cu alte cuvinte, askewness măsoară cât de „deformată” sau „deformată” este o distribuție. O distribuție cu asimetrie mare înseamnă că punctele de date sunt mai răspândite pe o parte a centrului decât pe cealaltă, în timp ce o distribuție cu asimetrie scăzută înseamnă că punctele de date sunt distribuite mai uniform în jurul centrului.
Astorsiunea este calculată folosind următoarea formulă :
Askewness = (suma tuturor abaterilor de la medie) / (abaterea standard a distribuției)
unde suma tuturor abaterilor de la medie este calculată prin scăderea mediei din fiecare punct de date și apoi adunând toate aceste diferențe și standardul abaterea distribuției este rădăcina pătrată a varianței distribuției.
Askewness poate fi utilizat într-o varietate de moduri în statistici și analize de date, cum ar fi:
1. Pentru a determina dacă un set de date este simetric sau nu. Dacă askewness este aproape de zero, atunci setul de date este aproximativ simetric. Dacă asimetria este mare, atunci setul de date este foarte denaturat.
2. Pentru a compara forma diferitelor seturi de date. Diferite tipuri de date au adesea niveluri diferite de aske. De exemplu, datele financiare pot fi mai distorsionate decât datele științifice.
3. Pentru a identifica valori aberante într-un set de date. Este posibil ca punctele de date care sunt departe de centrul distribuției să aibă o influență mare asupra măsurării askewness.
4. Pentru a verifica ipotezele testelor statistice. Multe teste statistice presupun că datele sunt aproximativ simetrice și distribuite normal. Dacă asimetria datelor este mare, atunci este posibil ca aceste ipoteze să nu fie valide.



