Poikkeavuuden ymmärtäminen tilastoissa ja data-analyysissä
Poikkeavuus viittaa siihen, missä määrin muuttuja tai muuttujien joukko poikkeaa odotetuista tai tyypillisistä arvoista. Toisin sanoen se mittaa, kuinka paljon tietty datapiste tai tietopisteiden joukko poikkeaa keskiarvosta tai keskiarvosta.
Esimerkiksi jos meillä on tietojoukko, jonka keskiarvo on 10 ja keskihajonnan 2, niin mikä tahansa datapiste joka on yhden keskihajonnan sisällä (eli 8 ja 12 välillä), katsotaan olevan normaalin poikkeavuusalueen sisällä. Tämän alueen ulkopuolelle jääviä tietopisteitä pidetään poikkeavina tai poikkeavina.
Poikkeavuus on tärkeä käsite tilastoissa ja data-analyysissä, koska se auttaa ymmärtämään, kuinka paljon vaihtelua tietojoukossa on ja ovatko tietyt datapisteet epätavallisia vai eivät. Sitä voidaan käyttää myös tietojen mallien ja trendien tunnistamiseen sekä tulevan käyttäytymisen ennustamiseen.



