Big data er et begreb, som dækker over store datamængder. Det bruges også om datasystemer eller beregningsteknikker, der udnytter store mængder af data. Begrebet er ikke oversat til dansk.

Big data og big data-teknologier anvendes i stigende grad af organisationer til skabe nye indsigter om deres aktiviteter, herunder salg, kommunikation, organisering eller medarbejdere. Big data bruges også til træning af kunstig intelligens og robotter.

Definitioner på big data

Der er ikke fuld konsensus om definitionen på big data. Historisk stammer udtrykket fra omkring årtusindskiftet.

Den amerikanske datalog John Mashey brugte i 1998 begrebet for at benævne de stigende datamængder, som bliver produceret og opbevaret.

I dag beskrives big data ofte ud fra en definition, som på engelsk omtaler de tre v´er, der i 2001 blev introduceret af en anden amerikansk datalog, Doug Laney. Her er big data kendetegnet ved:

  • volumen (volume)
  • variation (variety)
  • hastighed (velocity)

Disse tre egenskaber hentyder til, at big data indbefatter store datasæt med stor kompleksitet i data, og at data bevæger sig med høj hastighed gennem dataopsamling, -analyse og -cirkulation.

Som et fjerde og afgørende punkt nævnes ofte et karakteristika, der sigter til, om data er valide og retvisende:

  • sandfærdighed (veracity)

Andre v´er er også blevet foreslået som karakteristika for big data, heriblandt

  • værdi (value)
  • visualisering (visualization)

Anvendte teknologier

I virksomheder eller offentlige institutioner bruges big data også i omtalen af de teknologier, der kan behandle big data og udlede indsigter, som er relevante for disse organisationers arbejde. Disse teknologier inkluderer blandt andet cloud storage, dashboard visualisering, statistiske analyseprogrammer og machine learning-programmer.

Debat om nytten af big data

Der er debat om, hvilke formål big data anvendes til. Meget ikke-akademisk litteratur har hævdet, at big data ikke indebærer beskrivende analyser af data, men alene refererer til dataanalyser, som fokuserer på at opdage nye kausale sammenhænge. Det kan producere handlingsforskrifter for, hvordan organisationer kan optimere deres arbejde.

Et eksempel er statistiske inferensanalyser, hvor man undersøger sammenhænge mellem nøglevariabler for organisationen. Her kunne anvendelsen af en større mængde kundedata fx producere forudsigelser af fremtidig kundeadfærd ved lanceringen af et nyt produkt.

Svær evaluering

På grund af den uklare definition og mange anvendelsesmuligheder har forskningen svært ved at evaluere, hvorvidt big data og tilhørende teknologier overordnet bidrager positivt til at forbedre organisationers arbejde.

Mens en stigende mængde forskning finder positive sammenhænge mellem organisatorisk effektivitet og anvendelsen af big data-teknologier, finder andre forskere, at anvendelsen af big data har mindre betydning for organisatorisk effektivitet. I stedet bidrager anvendelsen af big data her hovedsageligt symbolsk til at forbedre det generelle renommé og omdømme for de organisationer, som anvender big data.

Misbrug af big data

Anden samfundsforskning har lagt større vægt på, at big data muliggør, at store teknologiske virksomheder kan opsamle data om et meget betydeligt antal privatpersoner. Det kan i nogle lande være størstedelen af befolkningen.

Disse data kan, uden privatpersonernes viden, bearbejdes for at udvikle og videresælge indsigter omkring hvordan disse privatpersoners forbrugsmønstre eller politiske præferencer bedst kan påvirkes eller manipuleres.

Det har rejst etiske spørgsmål vedrørende sådanne teknologiske virksomheders forretningsmodeller og deres brug af big data.

Big data og kunstig intelligens

Mens big data tidligere har været meget fokuseret på mulighederne for statistiske analyser, som kan bidrage til nye indsigter for organisationer, har big data fået stigende opmærksomhed efter at specielt generativ kunstig intelligens er blevet lanceret som et tilgængeligt produkt.

Generativ kunstig intelligens som fx. GPT anvender store datasæt som træningsmateriale for at udvikle og forbedre chatfunktionen. Det har sat stigende fokus på, hvordan kvaliteten og nøjagtigheden af sæt af big data kan være afgørende for, hvordan kunstig intelligens udvikles, og hvorvidt den giver gode eller uhensigtsmæssige svar.

Læs mere i Den Store Danske

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig