Der er ikke fuld konsensus om definitionen på big data. Historisk stammer udtrykket fra omkring årtusindskiftet.
Den amerikanske datalog John Mashey brugte i 1998 begrebet for at benævne de stigende datamængder, som bliver produceret og opbevaret.
I dag beskrives big data ofte ud fra en definition, som på engelsk omtaler de tre v´er, der i 2001 blev introduceret af en anden amerikansk datalog, Doug Laney. Her er big data kendetegnet ved:
- volumen (volume)
- variation (variety)
- hastighed (velocity)
Disse tre egenskaber hentyder til, at big data indbefatter store datasæt med stor kompleksitet i data, og at data bevæger sig med høj hastighed gennem dataopsamling, -analyse og -cirkulation.
Som et fjerde og afgørende punkt nævnes ofte et karakteristika, der sigter til, om data er valide og retvisende:
Andre v´er er også blevet foreslået som karakteristika for big data, heriblandt
- værdi (value)
- visualisering (visualization)
Kommentarer
Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.
Du skal være logget ind for at kommentere.