Hva er Audio Mining?

May 18  by Eliza

Audio gruvedrift er vanligvis brukes i talegjenkjenning programvare og musikk analyse. Denne teknologien gir brukeren muligheten til å søke gjennom tale eller musikk lyd som er blitt analysert for spesifikke egenskaper. Når den brukes i talegjenkjenning teknologi, identifiserer lyd gruvedrift talte ord i lyd og setter dem i en søkbar fil. Denne funksjonen kan være nyttig for studenter eller de i næringslivet som går mange møter, fordi det gjør at brukeren kan lettere bla aktuell informasjon fra tale presentasjoner. Denne typen analyser kan også brukes i musikk for å bestemme egenskaper som slag per minutt (BPM), toneart, og musikalsk struktur, informasjon som er ansatt for å klassifisere musikk.

I talegjenkjenning, hvor teknologien er oftest brukt, er lyd gruvedrift ansatt for å lage en akustisk modell. En akustisk modellprogrammer talegjenkjenning programvare for å gjenkjenne tale mønstre som ord. Denne teknologien er utviklet av lyd gruvedrift et opptak av en muntlig uttrykk, som sammenlignes med tekst som passer til muntlig uttrykk. Datamaskinen bruker informasjonen til å gjenkjenne ord når brukeren gjør lignende lyder til de i den akustiske modellen. En akustisk modellen brukes i kombinasjon med en fil som forteller talegjenkjenningsprogrammet hvilket språk å tolke og hvilke mønstre av ordene er sannsynlig å bli talt i visse setninger og situasjoner.

Musikere og musikkelskere kan begge dra nytte av lyd gruvedrift i musikk. Noen ganger, musikk programvare som kategoriserer musikken etter sjanger bruker lyd gruvedrift å organisere musikken. Prosess identifiserer og grupperer musikkfiler med lyd likheter som ofte oppstår i musikalske sjangere. Selv om denne teknologien kan gjøre å organisere musikk og finne ny musikk enklere, kan det gjøre feil klassifisere sanger som har lignende målte egenskaper, men forskjellig lyd totalt. Audio analyse programvare kan være nyttig for musikere, spesielt komponister, fordi det gjør at komponisten til å hoppe til bestemte deler av sangen struktur, inkludert musikalske viktige endringer og ord i tekstene.

Talegjenkjenning programvareprodusenten Dragon® selger et program som heter AudioMining® som transkriberer lydfiler og markerer filene slik at de kan søkes etter tekst. Dragon er en produsent av data lingvistikk programmer, den tekniske betegnelsen på feltet programvare laget for å tolke tale. Audio gruvedrift, når det brukes som to ord, er et generelt begrep som refererer til å analysere en lydfil for et bestemt sett av lydegenskaper. Andre produsenter av lyd gruvedrift programvare inkluderer Nuance® og Nexidia®.