Ekstremverdi i statistikk

Frå testwiki
Hopp til navigering Hopp til søk

Ein ekstremverdi, òg kjend som utliggar[1][2] (frå engelsk outlier), er eit omgrep innan statistikk og matematisk statistikk som viser til avvikande eller ytterleggåande observerte verdiar som skil seg særleg ut frå resten av dei observerte verdiane («løpsk» eller «vill» observasjon). Ein ekstremverdi vil ikkje ha same karakteristikk som resten av datapunkta, altså ein distinkt statistisk verdi.

Ekstremverdiar kan førekoma som tilfeldige variablar i kva for eit som helst forsøk, men indikerer ofte anten målefeil eller at populasjonen har ei skeiv fordeling. Ekstremverdiar vert stundom eliminerte frå måledata (dersom dei er feilaktige eller ikkje representative) før vidare analyse.

I eit datasett med fylgjande variablar 2,31,33,36,64 er 2 og 64 ekstremverdiar. I større datasett kan ein også finna ekstremverdiar ved å vurdera dataa i eit diagram, til dømes med eit boksplott. Ymse sentralitetsmål kan verta påverka av ekstremverdiar i større eller mindre grad. Til dømes kan gjennomsnittet jamnan endrast svært mykje på grunn av ein ekstremverdi, medan medianen som regel vert endra i mykje mindre grad.[3] Det same gjeld spreiingsmål, til dømes er standardavviket vanlegvis meir kjenslevart for ekstremverdiar samanlikna med kvartilavstanden.

Sjå òg

Kjelder

Mal:Fotnoteliste Mal:Refopning

Mal:Refslutt

Bakgrunnsstoff

Mal:Commonskat