100 observationer af variable med korrelation 0.8
100 observationer af variable med korrelation 0.8
Af .
Licens: CC BY SA 3.0
100 observationer med korrelation - 0.8
100 observationer med korrelation - 0.8
Af .
Licens: CC BY SA 3.0

I sandsynlighedsregning og statistik er en korrelationskoefficient et teoretisk mål for graden af lineær samvariation mellem to størrelser, for en definition se nedenfor. For observationer af par af de to variable kan en empirisk korrelationskoefficient også beregnes. Ofte bruges ordet korrelation og korrelere i dagligdags tale mere bredt om sammenhænge, hvor positiv korrelation er direkte proportionalitet, mens negativ korrelation er en omvendt sammenhæng.

Faktaboks

Etymologi

Korrelation, (af kon- og latin relatio 'tilbageførelse', afledt af referre 'bringe tilbage, henføre')

Hvis fx manden i en kernefamilie ser fjernsyn mere end den gennemsnitlige mand, ser hans kone nok også mere TV end gennemsnittet, og tilsvarende hører lave TV-forbrug sammen, så de to menneskers TV-forbrug er postitivt korrelerede.

Et eksempel på negativ korrelation ses ved vækst af to planter i samme urtepotte: Vokser den ene meget, tager den plads op for den anden, således at den anden vokser dårligere. Deres vækst er altså negativt korrelerede.

En positiv værdi af korrelationen svarer til, at en værdi af \(X_1\) større end dens middelværdi \(\mu_1\) oftest observeres sammen med værdier af \(X_2\) større end dens middelværdi \(\mu_2\) (og tilsvarende, at værdier mindre end de respektive gennemsnit observeres sammen). På samme måde svarer en negativ værdi af korrelationen til, at værdier af \(X_1\) større end \(\mu_1\) hører sammen med værdier af \(X_2\) mindre end \(\mu_2\) og omvendt.

Udtrykt ved en formel er korrelationskoefficienten defineret ved \[\frac{E[(X_1-\mu_1)(X_2-\mu_2)]}{\sqrt{ var(X_1)var(X_2)}} \]

Den empiriske korrelationskoefficient for n observationspar \((X_{i1}, X_{i2}) i=1, .., n\) beregnes som

\[\frac{\sum (X_{i1}-\bar{X}_1 )(X_{i2}-\bar{X}_2)}{\sqrt{\sum (X_{i1}-\bar{X}_1)^2\sum{(X_{i2}-\bar{X}_2)^2 }}}\]

Da korrelationskoefficienten er normeret med produktet af standardafvigelserne for de to variable, altså med produktet af kvadratrødderne af de to varianser, vil korrelationskoeffcienten antage værdier mellem −1, svarende til omvendt proportionalitet, og 1, svarende til direkte proportionalitet. Værdien 0 svarer til, at der ikke er en lineær sammenhæng mellem de to variable, se også regressionsanalyse.

Ved flere end to variable kan deres indbyrdes sammenhænge beskrives ved at samle korrelationskoefficienterne i en matrix, således at der på plads \((i, j)\) for \(i \neq j\) står korrelationskoefficienten mellem variabel \(X_i\) og \(X_j\). I diagonalen står 1-taller. Denne matrix kan danne udgangspunkt for videre statistiske analyser, fx faktoranalyse.

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig