Parsing, inden for datalingvistik den proces at analysere en sætnings syntaktiske og evt. semantiske struktur i forhold til en formel grammatik, dvs. et sæt regler og en ordbog.

Faktaboks

Etymologi
Ordet parsing er engelsk, af verbet parse, af latin pars (orationis) 'del (af talen)'.

Hvis sætningen er i overensstemmelse med grammatikken, betegnes den som velformet, og forholdet mellem dens led udtrykkes typisk som en hierarkisk træstruktur, hvis form entydigt følger af grammatikkens regler. På ethvert trin i sætningsanalysen vil der normalt være mulighed for at vælge flere forskellige grammatikregler. Man taler i sådanne tilfælde om strukturel flertydighed. Nogle gange opløses flertydigheder i analysens løb, men ikke i alle tilfælde.

Antager man, at sætningsanalysen forløber fra venstre mod højre, vil det ved tredje ord i sætningerne Hvem har set Bo? og Hvem har Bo set? kunne afgøres, at hvem i de to sætninger fungerer som hhv. subjekt og objekt. Derimod vil tvetydigheden i sætningen Spis maden i køkkenet ikke blive opløst, og denne sætning vil derfor få tildelt to forskellige syntaktiske strukturer svarende til to forskellige betydninger: en, hvor maden skal spises i køkkenet, og en anden, hvor maden i køkkenet skal spises.

Principielt kan alle fænomener, der kan beskrives af en formel grammatik, gøres til genstand for parsing, ikke bare sproglige tekster, men også musikstykker, kildekoder til internetsider, kemiske formler og strikkemønstre.

Et program, der er i stand til at udføre parsing, kaldes en parser. Parsere anvendes inden for datalingvistik og sprogteknologi i oversættelses- og dialogsystemer, informationssøgningssystemer, indholdsscannere og tekstresumeringssystemer. Betegnelsen benyttes også bredere, inden for datalogien om tilsvarende programmer, der indgår fx ved konstruktion af programfortolkere og databasegrænseflader, og inden for lægevidenskab fx ved kromosomgenkendelse. Se også syntaks (datalogi).

Kommentarer

Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.

Du skal være logget ind for at kommentere.

eller registrer dig