top of page

Dispersioon

Dispersioon

Dispersioon (ingl. Variance) näitab andmete hajuvust või jaotumist, s.t. kui palju tulemused keskmisest erinevad (varieeruvad). Dispersioon on seda suurem, mida rohkem on tunnusel aritmeetilisest keskmisest tugevasti hälbivaid väärtusi ja mida suuremad need hälbed on (Joonis 1). Näiteks, finantsanalüüsis kasutatakse dispersiooni ja standardhälvet riski hindamisel. Dispersiooni kasutamise mõte riski mõõduna tugineb eeldusel, et mida hajuvamad on tulud, seda suurem on nende ebakindlus tulevikus (Sauga, 2006).

Dispersioon on kõrvalekallete ruutude keskmine. See tähendab, et kõigepealt arvutatakse keskmine väärtus, seejärel võetakse iga algse ja keskmise väärtuse vahe, see vahe tõstetakse ruutu, liidetakse ja jagatakse seejärel selle populatsiooni väärtuste arvuga millest üks on väiksem (miinus üks).

Näiteks, on antud järgmised väärtused: 1, 2, 3, 7, 7, nende erinevus keskväärtusest on – 3, -2, -1, +3, +3 , seega vastav hälve ruudus on 9, 4, 1, 9, 9 (Niglas). Saadud ruuthälvete aritmeetilist keskmist nimetatakse dispersiooniks, mis antud näide põhjal võrdub (9+4+1+9+9)/ (5 -1) = 8 (32 / 4).

Kui juhuslik muutuja kirjeldab teatud mõõtmega füüsilisi objekte (meetrid, sekundid, kilogrammid jne), siis väljendatakse dispersiooni ruutühikutes (meetrid ruudus, sekundid ruudus jne).

dispersiooni_omadused.PNG

Joonis 1. Dispersiooni omadus

Standardhälve

Standardhälve

Standardhälve (ingl. „Standard deviation) on ruutjuur dispersioonist, seega näitab standardhälve tüüpilist erinevust üldisest keskmisest. Mida suurem on hajuvus, seda suurem on standardhälve ja vastajate vastused on sel juhul enamasti üldisest keskmisest kaugel (Rootalu, 2014). Näiteks,  standardhälvet saab kasutada detailide töötlemise kvaliteedi täpsuse mõõtmisel.

Standardhälbe mõõtühikud on samad mis aritmeetilisel keskmisel ja üksikutel väärtustel, näiteks kui mõõt on meetrites, siis on ka mõõdu standardhälve meetrites (Sauga, 2015).

Näiteks, on antud järgmised väärtused: 1, 2, 3, 7, 7, nende erinevus keskväärtusest on – 3, -2, -1, +3, +3 , seega vastav hälve ruudus on 9, 4, 1, 9, 9. Saadud ruuthälvete aritmeetilist keskmist nimetatakse dispersiooniks, ning standardhälve leidmisel on vaja arvutada ruutjuur dispersioonist, mis antud näide põhjal võrdub ≈ 2,5 (ruutjuur arvust 6,4) (Niglas).

Ulatus

Ulatus

Kui soovime teada, millistes piirides mingi tunnuse väärtused varieeruvad, siis leiame ulatuse (ingl. Range), mis on erinevus/vahe andmekogumi suurimate (xmax) ja väikseimate (xmin) väärtuste vahel ning see annab statistikutele parema ülevaate, kui mitmekesine on andmekogum (Sauga, 2015).

Ulatus võib olla üsna informatiivne, näiteks korteri maksimaalne ja minimaalne hind linnas N, maksimaalne ja minimaalne palk kutseala järgi piirkonnas jms.

Näiteks, arvude  12, 14, 16, 20, 21, 26 ulatus on 14.

SPSS Statistics kasutamine

Kirjeldavate arvnäitajate kuvamine

Kirjeldavate arvnäitajate arvutused tehakse sagedustabelite kaudu. Sagedustabeli loomiseks valitatakse „Analyze” -> „Descriptive Statistics” -> „Frequencies” . Kui sagedustabelit ei ole vaja kuvada, siis "Frequency" aknas võetake linnuke "Display frequency tables" ära.

Vahelehel „Statistics” vaadeldakse jaotuse näitajad standardhälve (ingl. Std. deviation), dispersioon (ingl. Variance) ja ulatus (ingl. Range„Dispersion” all (Joonis 2) .

std_ulatus.png

Joonis 2. Jaotuse näitajad "Dispersion" all

Näide

Näide

Failist „kirjeldav_statistika.sav” autor näitas tunnuse „tunnid” variatsiooni, standardhälvet ja ulatust. Autor võttis linnuke "Display frequency tables" maha, et moodustada tabel ainult valitud jaotuse näitajatega (Joonis 3).

std_ulatus_naide.png

Joonis 3. Dispersioon, standardhälve, ulatus

Moodustatud tabelist pealkirjaga „Statistics“ saame teada, et antud küsimusele vastas 29 vastajat. Küsimusele ei vastanud 26 inimest. Dispersioon tunnusel tunnid on suur - 680.209, mis tähendab, et väärtused aritmeetilisest keskmisest tugevasti hälbivaid. Standardhälve on liigikaudu 26. Ulatus 115 näitab, et andmekogum on mitmekesine.

Ülesanne

Ülesanne:

1. Failist „vilistlasuuring.sav” valige tunnus „vanus” ja tehke tabel valides järgmised statistikud: standardhälve, dispersioon, ulatus, ning miinimum ja maksimum näitajad.

• Mis on vanuse standardhälve ja mida selline näitaja tähendab?

• Kuidas oli arvutatud ulatuse näitaja?

Kasutatud allikad: 

Sauga, A. (2017). Statistika. Loetud: https://taltech.ee/organisatsioonid/ttukirjastus/raamatud-4/korgkooliopikud/statistika-opik/

Sauga, A. (2006). Statistika ja tõenäosusteooria. Loetud: https://www.sauga.pri.ee/audentes/download/stait.pdf

Niglas, K. (puudub). Andmeanalüüsi loengumaterjale: Andmete esmane töötlemine, analüüsimine ja esitamine. Loetud: http://www.cs.tlu.ee/~katrin/wp/wp-content/uploads/2013/11/Kirjeldav_statistika.pdf

 

Rootalu, K. (2014). Kirjeldav statistika. Loetud: http://samm.ut.ee/kirjeldav-statistika

bottom of page