Variansanalyse

Variansanalyse (ANOVA, frå det engelske «analysis of variance») er eit fellesomgrep for ei rekkje statistiske metodar for å teste likskap mellom to eller fleire utval, der éin eller fleire faktorar gjer seg gjeldande. Variansanalyse er i dei enkle tilfella eit alternativ til Z/t-testane for å samanlikne gjennomsnitt i populasjonar.

Dei to grunnleggjande formene for variansanalyse skildrast gjerne som 'einvegs' og 'tovegs' variansanalyse. I einvegs tilfellet undersøkingar ein berre éin eigenskap som varierer mellom gruppene, i tovegstilfellet undersøkjer ein òg variasjonar innover i gruppene.

Variansanalyse med éin faktor

Det enklaste tilfellet for variansanalyse er tilfellet der ein har $I$ grupper med like storleikar $J$ , og ønskjer å samanlikne gjennomsnitta til gruppene. Han nyttar gjerne der ein ønskjer å samanlikne skilnader i respons på forskjellige handsamingar (treatments) i forskjellige grupper.

Hypotesen ein testar er for ei mengd populasjonar^[1] $I$

$H_{0} : μ_{1} = μ_{2} = \dots = μ_{I}$
$H_{A} :$ minst to av gruppene er forskjellige.

Føresetnadene for testen er at alle observasjonane er uavhengige normalfordelte tilfeldige variable med lik varians.

Kvadratavvik og varians

Dei fundamentale storleikane i variansanalysen er kvadratavvik totalt (SST), mellom individ og gruppe (SSE) og mellom gruppe og totalt gjennomsnitt (SSTr). Desse er definert ved^[2]
$S S T = \sum_{i} \sum_{j} (x_{i j} - \underset{..}{\overline{x}})^{2} = \sum_{i} \sum_{j} x_{i j}^{2} - \frac{x_{..}^{2}}{I J}$
$S S T r = \sum_{i} \sum_{j} (\underset{i .}{\overline{x}} - \underset{..}{\overline{x}})^{2} = \frac{\sum_{i} X_{i .}^{2}}{J} - \frac{x_{..}^{2}}{I J}$
$S S E = \sum_{i} \sum_{j} (x_{i j} - \underset{i .}{\overline{x}})^{2}$

Samanhengen mellom desse gjev opphav til den fundamentale ANOVA-identiteten SST = SSTr + SSE.^[3] Videre har vi at^[4]
$M S T r = \frac{S S T r}{I - 1}$
$M S E = \frac{S S E}{I (J - 1)}$

Dette gjev opphavet til det ein kallar ein ANOVA-tabell:^[5]

Variasjonskjelde	Fridomsgrader	Kvadratavvik	Varians	f-verdi
Grupper	I - 1	SSTr	MSTr = SSTr/(I - 1)	MSTr/MSE
Feil	I(J - 1)	SSE	MSE = SSE/[I(J - 1)]
Total	IJ - 1	SST

Test av nullhypotesen

For å teste nullhypotesen, brukar ein ofte ein f-test. Testobservatoren er gjeven ved^[4]
$f = \frac{M S T r}{M S E}$

som ein reknar har ein $F_{I - 1, I (J - 1)}$ -fordeling. Forkastingsområdet for $H_{0}$ er $f \geq F_{α, I - 1, I (J - 1)}$ for ønskt signifikansnivå $α$

Tukeys prosedyre

F-testen er eit godt utgangspunkt for å samanlikne gjennomsnitta i fleire populasjonar, men han gjev ikkje svar på kva av populasjonane som er signifikant ulike kvarandre. Tukeys prosedyre nyttar ei Q-fordeling til å rekne ut kva intervall gjennomsnitta i populasjonen kan ligge i for å vere signifikant like kvarandre. For eit signifikansnivå $α$ definerer vi $w$ som

$w = Q_{α, I, I (J - 1)} \sqrt{M S E / J}$

Dei gjennomsnitta som har større differanse enn $w$ vert rekna å vere signifikant ulike, med signifikansnivå $α$ ^[6]

Relasjon til t-testen

For tilfellet med to populasjonar, vil variansanalyse og ein alminneleg t-test gje same resultat for hypotesen $H_{0} : μ_{1} = μ_{2}$ mot $H_{A} : μ_{1} \neq μ_{2}$ . T-testen er meir fleksibel, då ein og kan teste om eit gjennomsnitt er større enn, eller mindre enn eit anna.

For $I > 2$ kan ein i prinsippet òg utføre t-testar for alle kombinasjonar av grupper, men dette vil gje større sannsyn for type 1-feil.^[7]

Kjelder

Mal:Fotnoteliste

Denne artikkelen bygger på «Variansanalyse» frå Mal:Wikipedia-utgåve, den 12. september 2011.
- Mal:Wikipedia-utgåve oppgav desse kjeldene:
Jay L. Devore and Kenneth N. Berk: Modern Mathematical Statistics with Applications. Thomson 2007.

Mal:Autoritetsdata

↑ Devore/Berk 2007, side 540.
↑ Devore/Berk 2007, side 544.
↑ Devore/Berk 2007, side 547.
↑ ^4,0 ^4,1 Devore/Berk 2007, side 545.
↑ Devore/Berk 2007, side 548.
↑ Devore/Berk 2007, side 552.
↑ Devore/Berk 2007, side 557, 563.

[1] Devore/Berk 2007, side 540.

[2] Devore/Berk 2007, side 544.

[3] Devore/Berk 2007, side 547.

[Devore-545-4] 4,0 ^4,1 Devore/Berk 2007, side 545.

[5] Devore/Berk 2007, side 548.

[6] Devore/Berk 2007, side 552.

[7] Devore/Berk 2007, side 557, 563.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

Variansanalyse

Innhaldsliste

Variansanalyse med éin faktor

Kvadratavvik og varians

Test av nullhypotesen

Tukeys prosedyre

Relasjon til t-testen

Kjelder

Navigasjonsmeny

Variansanalyse

Variansanalyse med éin faktor

Kvadratavvik og varians

Test av nullhypotesen

Tukeys prosedyre

Relasjon til t-testen

Kjelder

Navigasjonsmeny

Søk