Grafisk fremstilling. Tidsserien afbilder en observeret variabel (her ledigheden) som funktion af tiden. Den røde, rette linje er et resultat af en regressionsanalyse og viser den overordnede stigning i ledigheden. Den sæsonudjævnede tidsserie tager højde for sæsonvariation og viser med blåt den variation, der ikke kan tilskrives sæsonudsving, mens den røde kurve er selve ledigheden. I højt-lavt-diagrammet afbildes gennemsnit (her for hver måned) sammen med den højeste og den laveste observation. Associationsdiagrammer kan sammenligne variable, der ikke er talværdier, men kvalitative udsagn. I eksemplet har man vha. korrespondanceanalyse undersøgt en kontingenstabel, der beskriver sammenhængen mellem socialgruppeplacering og mødeaktivitet uden for arbejdstiden. Det fremgår, at de to højeste socialgrupper har samme aktivitetsmønster og ofte går til møder, mens den laveste socialgruppe stort set aldrig går til møder.

.

En grafisk fremstilling er en præsentation af talmateriale på grafisk form. I matematikken kan en funktion således fremstilles grafisk ved sin graf. Udtrykket bruges dog især om visualisering af statistiske data, dvs. empirisk målte talmaterialer. En grafisk fremstilling kan skabe overblik i en tilsyneladende uoverskuelig datamængde. Til dette formål findes der en lang række forskellige diagramformer. I den beskrivende statistik benyttes bl.a. kasse-, fraktil-, skive-, stamme- og bladdiagrammer. Hertil kommer en række diagrammer, der i højere grad skal afspejle en analyse af tallene. Et flertal af statistiske analyser beskæftiger sig med sammenhænge mellem statistiske variable. Den grundlæggende statistiske graf er derfor x-y-diagrammet, hvori sammenhørende værdier af to observerede variable afbildes. Når den ene variabel er tiden, tales om en tidsrække eller tidsserie. Tidsserier er ofte karakteriseret ved en betydelig sæsonvariation, fx er arbejdsløsheden generelt lavere om sommeren. Man har statistiske metoder, der kan tage højde for en sådan sæsonvariation. Resultatet er en sæsonudjævnet tidsserie, der viser de ændringer, der ikke kan tilskrives sæsonvariationer.

Hvis punkterne i et \(x\text{-}y\)-diagram er gennemsnit eller medianer, kan det være illustrerende at markere, hvor stor variation der er i \(y\)-værdierne for hver \(x\)-værdi. Det kan gøres i et højt-lavt-diagram, der også kan anvendes til at angive sikkerhedsgrænser. Her spænder den lodrette streg over det \(y\)-interval, man med en statistisk sikkerhed på fx 95% kan regne med, at den sande værdi vil befinde sig i (se konfidensinterval). Indtegning af øvre og nedre sikkerhedsgrænser kan sammen med en teoretisk kurve give et indtryk af, om teorien bekræftes af de observerede gennemsnit.

En række grafiske fremstillinger sigter mod at bedømme, om en bestemt statistisk fordeling kan beskrive de foreliggende observationer. Man kan afbilde et histogram i samme graf som den tæthedsfunktion, der svarer til den forventede statistiske fordeling. Histogrammets form giver sammenlignet med tæthedsfunktionen et indtryk af overensstemmelsen mellem observationerne og den teoretiske fordeling.

Residualdiagrammer viser afvigelser fra det forventede under en given statistisk model. Et residual er forskellen mellem en observation og den forventede observation ifølge modellen divideret med den statistiske fejl på denne forskel. Hvis datasættet ikke er alt for lille, og modellen er velvalgt, vil et sådant residual variere tilfældigt omkring \(0\). I et residualdiagram afsættes residualerne i et \(x\text{-}y\)-diagram med residualen som \(y\)-værdi, hvorved man får et overblik over modeltilpasningens brugbarhed.

I de allerseneste år har en ny type grafiske fremstillinger vundet indpas, de såkaldte associationsdiagrammer. I sådanne diagrammer kan man sammenligne kategoriserede variable, også selvom der ikke til kategorierne er knyttet talværdier, men kvalitative udsagn. De punkter, der afsættes i et associationsdiagram, kan fremkomme ved hjælp af en række statistiske metoder, fx cluster-, faktor- eller korrespondanceanalyse. Fælles for disse metoder er, at de resulterer i \((x,y)\)-talsæt, der er ens, hvis de tilsvarende kategorier i kontingenstabellen er statistisk ens.

Med moderne computerteknik er det muligt at lave diagrammer i tre dimensioner. De tredimensionale diagrammer har øget statistikeres mulighed for at få overblik over komplicerede datasæt.

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig