Clusteranalyse er en fællesbetegnelse for en række statistiske metoder til at placere objekter i grupper eller klynger baseret på ligheder og forskelle mellem målinger af forskellige egenskaber ved objekterne. Clusteranalyse anvendes inden for områder som fx botanik, geologi og sociologi. Måler man fx længde og bredde af kronblade hos nogle blomster og afbilder disse værdier i et koordinatsystem, hvor hvert punkt svarer til en enkelt blomst, vil man ofte finde, at punkterne fordeler sig i adskilte klynger. Hver af klyngerne vil så (muligvis) kunne identificeres med en bestemt blomsterart. Selve opgaven med at inddele punkterne i de adskilte klynger kaldes en ikke-hierarkisk eller disjunkt clusteranalyse. Der er mange måder at opnå en sådan inddeling på. Man kan starte med at vælge en række tilfældige udgangsobjekter (klyngefrø), hvor væksten af nogle midlertidige klynger starter. Det enkelte objekt tilordnes den klynge, som det i en passende forstand ligger nærmest ved. Når alle objekter er fordelt, kan man fx erstatte de oprindelige klyngefrø med gennemsnitsværdien for klyngen og gentage processen. Alternativt kan man danne følger af klynger ved i første trin at opfatte hvert objekt som en klynge. Dernæst slår man de to klynger, der ligner hinanden mest, sammen. Dette gentages i en række trin, indtil der kun er en klynge tilbage. Herved fås en hierarkisk clusteranalyse (numerisk taksonomi).

Faktaboks

Etymologi

1. led af eng. cluster 'klynge'

Også kendt som

klyngeanalyse, klase

For såvel den hierarkiske som den ikke-hierarkiske clusteranalyse gælder, at der findes en lang række forskellige mål, såkaldte similaritetsmål, der bruges ved definition af, hvornår objekter ligner hinanden. Ligeledes findes en lang række metoder til at definere ligheder mellem klynger, fx lighedsmålet mellem de to objekter fra hver klynge, der ligner hinanden mest, eller lighedsmålet mellem de to, der ligner hinanden mindst.

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig