top of page

Pearsoni kordaja

Pearsoni kordaja

Pearsoni korrelatsioonikordaja mõõdab kahe intervalltunnuse vahelise lineaarse seose tugevust ja suunda. Pearsoni korrelatsioon on statistikas kõige laialdasemalt kasutatav korrelatsioon lineaarselt seotud normaaljaotusega tunnustega vahelise suhte määra mõõtmiseks (Rootalu, 2014; Kaart). Kui seos on kõver, siis Pearsoni korrelatsioon ei tööta. Seetõttu nimetatakse seda ka Pearsoni lineaarseks korrelatsioonikordajaks. 

Pearsoni korrelatsioonikordaja on tundlik erandite suhtes: paar üksikut erandit väikeses valimis võivad korrelatsioonikordaja väärtust tugevalt mõjutada (Sauga, 2015; Rootalu, 2014).

Spearmani kordaja

Spearmani kordaja

Spearmani korrelatsioonikordaja mõõdab kahe intervalltunnuse või kahe järjestustunnuse või ühe intervall- ja ühe järjestustunnuse vahelise seose tugevust ja suunda (Osula, 2014). Spearmani kordaja ei ole tundlik erandite suhtes ega eelda tunnuste normaalset jaotumist (Osula, 2010). 

Kui tunnused ei ole normaaljaotusega, leidub üksikuid erandlikke väärtusi või hajuvusdiagrammilt ilmneb küll kasvav või kahanev, aga mittelineaarne seos, on mõttekas kasutada seose kirjeldamiseks lineaarse korrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja asemel (või kõrval) Spearmani ehk astakkorrelatsioonikordajat (Kaart).
Kui soovitakse analüüsida, kui hästi erinevate vastajarühmade hinnangud kokku langevad, tuleb võrrelda eri rühmade järjestatud tegurite järjenumbreid ehk astakuid (Sauga, 2015). Iga väärtusega seostatakse nende järjekorranumber (astak) kasvavas või kahanevas järjekorras. Madalaima väärtusega elemendile omistatakse astak 1, järgmisele elemendile kasvavas järjekorras astak 2 jne. Astakkorrelatsiooni kasutatakse ka intervallskaala vahelise seose kirjeldamisel, kui seos on mittelineaarne või on tarvis vähendada erandite mõju (Sauga, 2015).

Kendalli kordaja

Kendalli kordaja

Kendalli kordaja on mõnes mõttes nagu Spearmani astakkorrelatsioonikordaja, ehk seose tugevuse hindamiseks kasutatakse vastavaid astakuid. Selle abil mõõdetakse kahe järjestustunnuse vahelise seose tugevust ja suunda väikese valimi puhul (Osula, 2014). Nagu Spearmani kordaja, ei ole ka Kendalli kordaja tundlik erandite suhtes ega eelda tunnuste pidevust ja normaalset jaotumist (Kaart). Kendalli astakkorrelatsioon on parim alternatiiv Spearmani korrelatsioonile, kui valimi suurus on väike ja sellel on palju seotud astakuid, ehk palju sarnaseid vääruseid (Osula, 2014).

SPSS Statistics kasutamine

Seose arvutamine

Kahe tunnuse vahelise seose arvutamiseks valitakse : “Analyze” -> “Correlate” -> “Bivariate” (Joonis 1).  Avatud aknas valitakse kaks tunnust ja märgistatakse sobiv(-ad) korrelatsioonikordaja(-d).

bivariate.png

Joonis 1. Pearsoni kordaja valimine „Bivariate Correlations” aknas

Näide

Näide

Autor uurib seost kirjeldava statistika kursuse mahu ja statistika kursuse kontakttundide vahel, kasutades tunnuseid „eap” ja „tunnid” failist „kirljeldav_statistika.sav” (Joonis 2). „Bivariate Correlations” aknas valib autor näitena Pearsoni kordaja.

seoseskordaja_naide.PNG

Joonis 2. Pearsoni korrelatsioon

Järeldus: Tunnuste vahelist seost iseloomustab korrelatsioonikordaja väärtus (0,506) järgmiselt:

• Kuna kordaja on positiivne (pluss märgiga), siis on tegemist positiivse seosega. Mida suurem maht kirjeldava statistika kursusel seda rohkem kontakttunde, ning vastupidi, mida väiksem maht kirjeldava statistika kursusel seda vähem kursuse kontakttunde.

• Korrelatsioonikordaja väärtus näitab seose tugevust. Antud näites on tegemist keskmise seosega.

Ülesanded

Ülesanded:

1. Näidake korrelatsiooni tugevust ja suunda Pearsoni kordaja abil võttes intervalltunnused „vanus”  ja „netopalk” failist „vilistlasuuring.sav”. Kas seos on positiivne? Kui tugev seos on? Mõelge, kas hajuvusdiagrammil olevad punktid on erandlikud väärtused ja kas Pearsoni kordajat saab kasutada?

2. Võtke samad tunnused "netopalk" ja "vanus" mis olid esimeses harjutuses ning esitage Spearmani korrelatsiooni tabel. Kas Spearmani kordaja eristub Pearsoni kordajast? Mis on korrelatsiooni tugevus ja suund? Kumb kordajast on parem?

3. Korrelarsioonanalüüsi peatükis oli esitatud näide, kus hajuvusdiagrammi illustreerimiseks olid võetud tunnused "eap" ja "tunnid" failist "kirjeldav_statistika.sav". Võtke samad tunnused ning esitage Pearsoni ja Spearmani korrelatsiooni tabelid. Kumb kordjast on parem? Tehke järeldusi.

Kasutatud allikad: 

Kaart, T. (puudub). Andmeanalüüs MS Excelis. Loetud: http://ph.emu.ee/~ktanel/andmeanalyys_excelis/pt63.php

Kaart, T. (puudub). Matemaatiline statistika ja modelleerimine. Loetud: http://ph.emu.ee/~ktanel/DK_0007/DK_loeng31.pdf

Osula, K. (2010). Korrelatsioonianalüüs. Loetud: http://www.tlu.ee/~kairio/6081/Seose%20slaidid%2010mai.pdf

Osula, K. (2014). Regressioonanalüüs. Loetud: http://www.tlu.ee/~kairio/mm/9%20regressioon/Regressioonanal%C3%BC%C3%BCs.pdf

Rootalu, K. (2014). Korrelatsioonikordajad. Loetud: http://samm.ut.ee/korrelatsioonikordajad

Sauga, A. (2017). Statistika. Loetud: https://taltech.ee/organisatsioonid/ttukirjastus/raamatud-4/korgkooliopikud/statistika-opik/

Tanel, K. (puudub). Andmeanalüüs MS Excelis. Loetud: http://ph.emu.ee/~ktanel/andmeanalyys_excelis/pt63.php

bottom of page