Statistik, videnskab, som i sin oprindelige betydning omfatter en metodisk, empirisk funderet beskrivelse af samfundsforhold vha. indsamling og systematisering af talmaterialer. Metoder fra denne statistik om samfundsforhold (tidl. også kaldet officiel statistik) anvendes på en række andre områder (fx naturforhold, organisationer og institutioner). Den teoretiske eller matematiske statistik omhandler sandsynlighedsteoretiske metoder til at udvinde information fra givne data og anvendes til at fortolke de indsamlede resultater.

Faktaboks

Etymologi
Ordet statistik kommer via ty. fra nylat. statisticus 'hvad der vedrører statssager', afledn. af lat. status 'tilstand', se stat.

Statistik om samfundsforhold

Den samfundsbeskrivende statistiks hovedområder er personstatistik (befolkning, arbejdsmarked, sociale forhold, uddannelse, indkomst mv.), erhvervsstatistik (strukturforhold, regnskaber, produkter mv.), økonomisk statistik (nationalregnskab, offentlige regnskaber, priser, penge- og kapitalforhold) samt statistik om miljø- og energiforhold.

Historie

Statistik har udgangspunkt i to beslægtede discipliner. Statsbeskrivelse var kendt i oldtiden og fra 1500-t. i Europa, men omfattede også ikke-talmæssige oplysninger. Den politiske aritmetik, der blev introduceret i England i 1600-t., lagde derimod stor vægt på numeriske opgørelser af samfundsforhold, og de politiske aritmetikere var tillige pionerer inden for den demografiske videnskab. Befolkningsforhold blev dermed tidligt et af statistikkens vigtigste emneområder. Officiel statistik i moderne forstand etableredes fra 1700-t., navnlig i form af folketællinger (den første i verden 1703 i Island, første i Danmark 1769, almindelig befolkningsstatistik i Sverige fra 1749). Folketællinger gav i begyndelsen ofte dårlige resultater pga. manglende organisation og teknik. Den officielle statistik blomstrede op i 1800-t. og blev institutionaliseret i en del lande (i Danmark 1850 i Det Statistiske Bureau, se Danmarks Statistik). Desuden etableredes internationalt samarbejde (statistiske kongresser fra 1853, International Statistical Institute, ISI, 1885, nordisk samarbejde fra 1889). Omkring 1900 fik den officielle statistik ny fremgang og gavn af tekniske fremskridt; bl.a. anvendtes hulkort ved folketællinger (1891 i USA, 1911 i Danmark). I mellemkrigstiden var udviklingen præget af økonomiske kriser og af samarbejde under Folkenes Forbund og ISI. Samarbejdet fortsatte efter 2. Verdenskrig, fra 1947 under ledelse af FN's Statistical Commission. Siden er der sket en stærk udvikling dels pga. anvendelsen af computere, dels under påvirkning af øgede nationale behov og voksende globalt og regionalt samarbejde. Dette har i EU betydeligt omfang, er af bindende karakter og fastlægger derfor i vidt omfang rammerne for medlemslandenes statistik. I 1970'erne og 1980'erne blev den officielle statistik i mange lande udsat for stærk kritik med udgangspunkt i en udbredt, mediestøttet bekymring for farer ved computerregistrering.

Dataindsamling og -bearbejdning

Detailoplysninger om statistiske enheder som boliger, personer og virksomheder kan evt. fremskaffes ved direkte observation, men indsamles normalt fra respondenter ved direkte henvendelse eller via postbefordrede spørgeskemaer, elektronisk formidling eller ved interview, herunder pr. telefon. Desuden anvendes (i Danmark som en hovedkilde) oplysninger fra edb-registre og andre administrative kilder.

Resultaterne består af aggregerede antal og summer samt af gennemsnit og spredninger i absolutte og relative tal, fordelt efter en række kriterier. De omfatter både tilstandsbeskrivelser og sammenligninger over tid. Resultaterne er anonyme i forhold til grundenhederne og præsenteres som regel i tabeller, grafer og data til modelberegninger.

Mellem grunddata og resultater ligger en række processer, der bl.a. omfatter indsamling, inddatering, opsøgning og korrektion af fejl (editering), kombination af oplysninger fra flere kilder samt optællinger og beregninger. I samfundsbeskrivende statistik kan forbindelsen mellem grunddata og resultater forekomme uigennemskuelig, hvilket er en mulig grund til, at statistikken fra tid til anden udsættes for mistanke om at tjene skjulte formål (fx registrering med henblik på kontrol). Risikoen for, at statistiske grundoplysninger kommer på afveje, undgås imidlertid ved konsekvente regler om statistisk fortrolighed, der gælder individuelt genkendelige detailoplysninger. Princippet er bl.a. fastlagt i EU-regler og nationale persondatalove og i Danmark gennem lang sædvane.

Formidling

Statistik om samfundsforhold formidles ad mange kanaler. Den enkelte borger tilgodeses normalt via medierne, af summariske publikationer og via Internettet, mens specialiserede brugere, fx organisationer, forvaltning, lovgivningsmagt og forskningsenheder, betjenes med udførlige publikationer, databanker med detaljerede oplysninger og formålsbestemte specialopgørelser og -analyser. Se statistiske databanker og statistiske publikationer.

Teoretisk statistik

I en statistisk analyse forsøges væsentlige fakta adskilt fra de tilfældigheder, der kan opstå i data. Idéen kan udtrykkes ved, at observerede data består af to komponenter, en strukturel og en tilfældig. Et konkret eksempel er et radiosignal, der som den strukturelle del skal adskilles fra den tilfældige støj, som også findes i æteren. Et andet eksempel er indsamling af stikprøver... Læs videre om teoretisk statistik.

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig