Korrelasjon

Frå testwiki
Hopp til navigering Hopp til søk

Korrelasjon eller samvariasjon er i statistikk og sannsynsrekning eit mål på styrken og retninga på den lineære samvariasjonen mellom to variablar. Empirisk observert samvariasjon er ein naudsynt, men ikkje tilstrekkeleg, føresetnad for å avdekkje om det er kausalitet, det vil seie at ein variabel er årsak til ein annan.

Fire datasett som alle har korrelasjonen 0,81. (Dømet er henta frå Francis Anscombe)

Pearsons produkt-moment-korrelasjon

Pearsons korrelasjonskoeffisient for produkt-moment (ofte referert til som korrelasjonskoeffisienten eller berre korrelasjonen) er eit mål på den linære korrelasjonen mellom to stokastiske variablar. Korrelasjonen mellom X og Y har ofte notasjonen ρXY. For to stokastiske variablar X og Y er korrelasjonen definert som

Corr[X,Y]=Cov[X,Y]Var[X]Var[Y]

der Cov[] er kovarians og Var[] er varians.

Denne korrelasjonskoeffisienten har alltid verdi mellom og ein og minus ein per definisjon. Dersom korrelasjonen mellom X og Y er lik 1, så er det ein perfekt, lineær korrelasjon mellom dei to. Med andre ord finst det to konstantar a og b slik at:

Corr[X,Y]=1Y=aX+b

Sjå òg