Κατανόηση της Ασκητικότητας στη Στατιστική και την Ανάλυση Δεδομένων
Η δυσλειτουργία είναι ένα μέτρο του ποσού κατά το οποίο ένα σύνολο δεδομένων αποκλίνει από μια συμμετρική κατανομή. Ορίζεται ως η μέση απόσταση των σημείων δεδομένων από το κέντρο της κατανομής.
Με άλλα λόγια, η ασυδοσία μετρά πόσο «λοξή» ή «λοξή» είναι μια κατανομή. Μια κατανομή με υψηλή στρέβλωση σημαίνει ότι τα σημεία δεδομένων είναι πιο απλωμένα στη μία πλευρά του κέντρου από την άλλη, ενώ μια κατανομή με χαμηλή στρέβλωση σημαίνει ότι τα σημεία δεδομένων είναι πιο ομοιόμορφα κατανεμημένα γύρω από το κέντρο.
Η δυσλειτουργία υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο :
Askewness = (άθροισμα όλων των αποκλίσεων από τον μέσο όρο) / (τυπική απόκλιση της κατανομής)
όπου το άθροισμα όλων των αποκλίσεων από τον μέσο όρο υπολογίζεται αφαιρώντας τον μέσο όρο από κάθε σημείο δεδομένων και στη συνέχεια αθροίζοντας όλες αυτές τις διαφορές και το πρότυπο Η απόκλιση της κατανομής είναι η τετραγωνική ρίζα της διακύμανσης της κατανομής.
Η ασάφεια μπορεί να χρησιμοποιηθεί με διάφορους τρόπους στη στατιστική και την ανάλυση δεδομένων, όπως:
1. Για να προσδιορίσετε εάν ένα σύνολο δεδομένων είναι συμμετρικό ή όχι. Εάν η ασυδοσία είναι κοντά στο μηδέν, τότε το σύνολο δεδομένων είναι κατά προσέγγιση συμμετρικό. Εάν η στρέβλωση είναι μεγάλη, τότε το σύνολο δεδομένων είναι πολύ λοξό.
2. Για να συγκρίνετε το σχήμα διαφορετικών συνόλων δεδομένων. Διαφορετικοί τύποι δεδομένων έχουν συχνά διαφορετικά επίπεδα αστάθειας. Για παράδειγμα, τα οικονομικά δεδομένα μπορεί να είναι πιο λοξά από τα επιστημονικά δεδομένα.
3. Για τον προσδιορισμό ακραίων τιμών σε ένα σύνολο δεδομένων. Σημεία δεδομένων που βρίσκονται πολύ μακριά από το κέντρο της κατανομής είναι πιθανό να έχουν μεγάλη επιρροή στο μέτρο ασωτίας.
4. Για να ελέγξετε τις παραδοχές των στατιστικών δοκιμών. Πολλές στατιστικές δοκιμές υποθέτουν ότι τα δεδομένα είναι κατά προσέγγιση συμμετρικά και κανονικά κατανεμημένα. Εάν η δυσλειτουργία των δεδομένων είναι υψηλή, τότε αυτές οι υποθέσεις μπορεί να μην είναι έγκυρες.



