sprogteknologi

Sprogteknologi, fællesbetegnelse for teknikker, der anvendes til at få computere til at bearbejde tekster eller udsagn på almindeligt menneskeligt sprog. Den enkleste form for sprogteknologi, allerede udbredt i 1960'erne, er brug af computere til at få overblik over ordforrådet i et sprog eller en bestemt teksttype ved elektronisk optælling af alle forekomster af forskellige ord og deres kontekst; se konkordans. Derved kan ordenes relative frekvenser beregnes mhp. en karakteristik af forskellige typer tekster og forfattere. Således var fx de hyppigste ord, bortset fra grammatiske småord, i de Gaulles radiotaler je, vous, français, république, état, peuple, moi, confiance og nation. Sådanne undersøgelser kan i tvivlstilfælde afgøre, hvem der er forfatteren til en bestemt tekst. Computerens evne til at sortere store mængder af ord benyttes tillige til informationssøgning, ofte i kombination med statistiske og grammatiske analyser.

Efterhånden som computernes hukommelse er øget, anvendes de i stigende grad til at lagre ordbøger og samlinger af fagudtryk, såkaldte termbanker. Almindelige tekstbehandlingsprogrammer kan sprogteknologisk bl.a. omfatte stavekontrol, automatisk orddeling, stilkorrektion og ordsøgning.

De mest krævende former for sprogteknologi er dem, der er i stand til at udforme eller analysere sproglige udsagn med respekt for deres indholdsmæssige opbygning. Her kan nævnes grammatisk stavekontrol, dialogsystemer til kommunikation i almindeligt sprog, maskinoversættelse, talesyntese, dvs. maskinel oplæsning af en skreven tekst, og talegenkendelse, dvs. maskinel overførsel af talt sprog til skrevet sprog. Se også datalingvistik, maskinoversættelse og taleteknologi.

Kommentarer

Din kommentar publiceres her. Redaktionen svarer, når den kan.

Du skal være logget ind for at kommentere.

eller registrer dig