


İstatistik ve Veri Analizinde Çarpıklığı Anlamak
Çarpıklık, bir veri kümesinin simetrik bir dağılımdan sapma miktarının bir ölçüsüdür. Veri noktalarının dağılımın merkezine ortalama uzaklığı olarak tanımlanır.
Başka bir deyişle çarpıklık, bir dağılımın ne kadar "çarpık" veya "orantısız" olduğunu ölçer. Çarpıklığın yüksek olduğu bir dağılım, veri noktalarının merkezin bir tarafında diğerine göre daha fazla yayıldığı anlamına gelirken, çarpıklığın düşük olduğu bir dağılım, veri noktalarının merkez çevresinde daha eşit şekilde dağıldığı anlamına gelir.
Sarkıklık aşağıdaki formül kullanılarak hesaplanır :
Eğrilik = (ortalamadan tüm sapmaların toplamı) / (dağılımın standart sapması)
burada ortalamadan tüm sapmaların toplamı, her veri noktasından ortalamanın çıkarılması ve ardından tüm bu farkların toplanmasıyla hesaplanır ve standart dağılımın sapması, dağılımın varyansının kareköküdür.
Eğrilik istatistik ve veri analizinde çeşitli şekillerde kullanılabilir, örneğin:
1. Bir veri kümesinin simetrik olup olmadığını belirlemek. Çarpıklık sıfıra yakınsa veri seti kabaca simetriktir. Çarpıklık büyükse, veri kümesi yüksek oranda çarpıktır.
2. Farklı veri kümelerinin şeklini karşılaştırmak. Farklı veri türleri genellikle farklı düzeylerde çarpıklığa sahiptir. Örneğin finansal veriler bilimsel verilere göre daha çarpık olabilir.
3. Bir veri kümesindeki aykırı değerleri belirlemek için. Dağıtımın merkezinden uzakta olan veri noktalarının çarpıklık ölçüsü üzerinde büyük bir etkiye sahip olması muhtemeldir.
4. İstatistiksel testlerin varsayımlarını kontrol etmek. Birçok istatistiksel test, verilerin kabaca simetrik ve normal dağıldığını varsayar. Verilerin çarpıklığı yüksekse bu varsayımlar geçerli olmayabilir.



