Ymmärtää segmentoinnin data-analyysissä
Säilöntä on tekniikka, jota käytetään data-analyysissä samanlaisten tietopisteiden ryhmittelyyn ja yhteenvedon tekemiseen. Se sisältää tietojen jakamisen pienempiin alaryhmiin tai "ämpäriin" tiettyjen ominaisuuksien, kuten arvoalueen tai esiintymistiheyden, perusteella.
Esimerkiksi jos sinulla on kokeen tulosten tietojoukko, voit ryhmitellä pisteet seuraavasti:
* Ryhmä 1: pisteet alle 50
* Ryhmä 2: pisteet 50–60
* Ryhmä 3: pisteet 60–70
* Ryhmä 4: pisteet yli 70
Ryhmittelemällä tiedot tällä tavalla, näet nopeasti, kuinka monta pistettä kullekin alueelle kuuluu ja tunnistaa ilmenevät kuviot tai trendit. Tästä voi olla hyötyä poikkeamien tunnistamisessa, poikkeavuuksien havaitsemisessa ja suurten tietojoukkojen yhteenvedossa.
On olemassa erilaisia tapoja määrittää ryhmät, kuten käyttämällä kiinteitä alueita tai dynaamisia alueita tietojen perusteella. Ryhmän määritelmän valinta riippuu analyysin erityistavoitteista ja tietojen luonteesta.



