En test er en procedure til at vurdere, om data er i overensstemmelse med en fremsat hypotese.

Faktaboks

Etymologi

eng., via oldfr. fra lat. testu(m) 'lerskål' pga. anvendelse af skåle ved undersøgelse af mineralers art og lødighed

Også kendt som

statistisk test

Hypotese

Udgangspunktet er en statistisk model for de observerede data: De antages at være observationer af stokastiske variable, hvis fordeling afhænger af en eller flere parametre \(\theta\). På grundlag heraf skal der tages stilling til, om \(\theta\) kan antages at have en bestemt værdi \(\theta_0\). Antagelsen om, at \(\theta\) har værdien \(\theta_0\), kaldes nulhypotesen, \(H_0\), og man siger, at nulhypotesen \(H_0: \theta = \theta_0\) skal testes. For at gøre dette må man vide, hvilke alternativer der foreligger til nulhypotesen. Disse sammenfattes i den alternative hypotese, \(H_1\). Hvis man er interesseret i at påvise afvigelser i retning af, at \(\theta\) er større end \(\theta_0\), bliver den alternative hypotese \(\theta > \theta_0\). Er man derimod interesseret i at påvise enhver form for afvigelse fra \(\theta_0\), bliver alternativet \(\theta \neq \theta_0\).

I visse tilfælde ønsker man at teste uden at opstille en egentlig statistisk model, se ikke-parametriske test.

Signifikans

En teststørrelse \(T\) er en funktion, der måler forskellen mellem data, og hvad der forventes under \(H_0\). Jo større den observerede værdi \(T_{obs}\) af \(T\) er, jo mindre understøttes \(H_0\) af data i forhold til \(H_1\), og jo mere tilbøjelig vil man være til at frafalde \(H_0\) til fordel for \(H_1\).

Som et mål for afstanden mellem data og \(H_0\) beregnes signifikanssandsynligheden \(p = P(T \geq T_{obs}|\theta_0)\). Signifikanssandsynligheden angiver sandsynligheden for at observere en værdi af teststørrelsen, der understøtter \(H_0\) i endnu mindre omfang end den faktisk observerede værdi \(T_{obs}\), under forudsætning af, at \(H_0\) er sand. Jo mindre \(p\) er, jo mindre understøttes \(H_0\) af data, og jo mere tilbøjelig vil man være til at afvise \(H_0\) til fordel for alternativet \(H_1\). Signifikanssandsynligheden kan opfattes som sandsynligheden for, at den observerede afvigelse fra nulhypotesen er fremkommet ved en tilfældighed.

Hvis man på grundlag af et statistisk test skal beslutte, om en nulhypotese skal accepteres eller afvises, kan man vælge at forkaste hypotesen, hvis signifikanssandsynligheden er mindre end en på forhånd valgt værdi \(\alpha\). I modsat fald accepteres hypotesen, og man siger, at der er udført et signifikanstest med signifikansniveau (eller niveau) \(\alpha\). Ofte vælges \(\alpha = 5\%\).

Hvor lille \(p\) i en konkret situation skal være, før \(H_0\) afvises, afhænger af, hvor stor forhåndstiltro man har til nulhypotesen, af konsekvenserne af at afvise \(H_0\), selvom den er sand, og af stikprøvens størrelse. Ofte afviser man \(H_0\), hvis signifikanssandsynligheden er mindre end \(0\text{,}05\). Når man først afviser \(H_0\) for små værdier af \(p\), hænger det sammen med, at nulhypotesen sædvanligvis vælges på en sådan måde, at den skal være i klar modstrid med data, før den opgives til fordel for den alternative hypotese.

Styrke

Et signifikanstest med niveau \(\alpha\) bygger på en opdeling af teststørrelsens variationsområde i to dele, acceptområdet og forkastelsesområdet (også kaldet det kritiske område). Hvis den observerede værdi af teststørrelsen tilhører det kritiske område, afvises nulhypotesen. Falder den derimod i acceptområdet, afvises nulhypotesen ikke. Det kritiske område består af de værdier af teststørrelsen, der overstiger en vis kritisk værdi, og vælges således, at det under nulhypotesen har sandsynligheden \(\alpha\).

Ved at fastlægge testets niveau kontrollerer man den fejl, der opstår i at afvise en sand nulhypotese. Denne fejl kaldes en type I-fejl, og sandsynligheden for at begå en type I-fejl er derfor \(\alpha\). Man begår imidlertid også en fejl, såfremt man undlader at afvise \(H_0\), hvis den faktisk er forkert. Denne fejl kaldes en type II-fejl. Styrkefunktionen for et signifikanstest med niveau \(\alpha\) for \(H_0: \theta = \theta_0\) angiver sandsynligheden for at observere en værdi af teststørrelsen i forkastelsesområdet som funktion af \(\theta\). Testets styrke er derfor 1 minus sandsynligheden for at begå en type II-fejl.

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig