Hva er Fuzzy Matching?

September 25  by Eliza

Fuzzy matching er en metode som brukes i enkelte dataprogrammer, spesielt de som er utformet for å automatisk oversette tekst mellom forskjellige språk. Det fungerer i situasjoner der database som brukes av programvaren ikke har en eksakt match for en del av teksten. I stedet ser databasen for nære treff med menneskelige revisjon vanligvis sjekker at denne kampen er akseptabelt nøyaktig.

Mest automatiserte oversettelsesprogrammer bare sammenligne tekst til en database med tidligere oversettelser. Denne databasen er vanligvis kjent som en oversettelse minne (TM). Hver ny og bekreftet oversettelsen er lagt til databasen, noe som betyr at fremtidige oversettelser er vanligvis mer nøyaktig og raskere.

Normalt fungerer TM-baserte oversettelse med hele setninger. For eksempel, hvis en bruker har tidligere godkjent en bestemt setning på fransk som en nøyaktig oversettelse av "Butikken er åpen mellom 9 am og 17:00 på hverdager, men stenger kl 14:00 på onsdag," så neste gang programmet blir bedt om å oversette den setningen, vil den automatisk bruke samme franske ordlyden som før.

Den fuzzy matching verktøyet fungerer med situasjoner der en bestemt setning ikke har kommet opp i dokumenter oversatt av systemet før. Verktøyet innebærer enten skaperen av programvaren eller sluttbrukeren å sette et akseptabelt fuzzy matching nivå i form av en prosentandel kamp. Hvis setningen er nær nok til en tidligere oversatt til å møte denne prosent kamp, ​​vil programvaren råde brukeren av kampen, gi den forrige oversettelsen, og be brukeren om å bekrefte eller endre den foreslåtte oversettelse.

For å følge opp den forrige eksempel, hvis den fuzzy matching terskelen ble satt til 90% og den nye engelske dokumentet inneholdt setningen, "Butikken åpner mellom 9 am og 17:00 på hverdager, men stenger kl 14:00 på onsdag," programvaren foreslår at den tidligere brukte oversettelse og brukeren vil sannsynligvis klikk for å godkjenne det. Hvis det nye dokumentet hadde setningen, "Butikken er åpen mellom 9 am og 17:00 på hverdager, men stenger kl 14:00 på torsdag," programvaren ville foreslå den tidligere brukte oversettelse og brukeren vil korrigere denne oversettelsen å konkludere med franske ordet for torsdag. Hvis det nye dokumentet hadde setningen, "Butikken er åpen fra 9 am til 17:00 på hverdager unntatt onsdag, når det stenger kl 14:00," programvaren ville ikke vurdere dette en uklar kamp, ​​til tross for betydningen er den samme, og dermed ikke ville tilby en automatisk oversettelse for dommen, slik at brukeren kan oversette det manuelt.