Hva er forskjellen mellom Data Mining og datavarehus?

September 17  by Eliza

Begrepene data mining og datavarehus er ofte forvirret av både forretningsmessig og teknisk personale. Hele feltet av data management har opplevd en fenomenal vekst med gjennomføringen av datainnsamling programmer og redusert kostnadene for datamaskinens minne. Den primære hensikten bak begge disse funksjonene er å gi de verktøy og metoder for å utforske mønstre og mening i store mengder data.

De viktigste forskjellene mellom data mining og datavarehus er den systemdesign, metoden som er benyttet, og formålet. Data mining er bruk av mønstergjenkjenning logikk til identitets trender innenfor en prøve datasett og ekstrapolere denne informasjonen mot større data bassenget. Datavarehus er prosessen med å trekke ut og lagre data for å tillate enklere rapportering.

Data mining er et generelt begrep som brukes for å beskrive en rekke forretningsprosesser som henter mønstre fra data. Vanligvis er en statistisk analyse programvarepakke som brukes til å identifisere bestemte mønstre, basert på datasettet og spørringer som genereres av sluttbrukeren. En typisk bruk av data mining er å skape målrettede markedsføringsprogrammer, identifisere økonomisk svindel, og å flagge uvanlige mønstre i oppførsel som en del av en sikkerhetsgjennomgang.

Et utmerket eksempel på data mining er prosessen som brukes av telefonselskaper å markedsføre produkter til eksisterende kunder. Telefonselskapet bruker data mining programvare for å få tilgang til sin database med kundeinformasjon. En spørring er skrevet for å identifisere kunder som har abonnert på den grunnleggende telefonpakken og Internett-tjenesten over en bestemt tidsramme. Når dette datasettet er valgt, er en annen spørring skrevet for å finne ut hvor mange av disse kundene tok fordel av gratis ekstra telefonfunksjonene i en prøve forfremmelse. Resultatene av denne data mining øvelsen avdekke mønstre av atferd som kan kjøre eller å avgrense en markedsføringsplan for å øke bruken av ekstra telefontjenester.

Det er viktig å merke seg at det primære formålet med data mining er å oppdage mønstrene i dataene. De spesifikasjoner som brukes for å definere prøvesett har en stor innvirkning på relevansen av produksjonen og nøyaktigheten av analysen. Retur til eksempelet ovenfor, om datasettet er begrenset til kunder innenfor et bestemt geografisk område, vil resultatene og mønstre avvike fra et bredere datasettet. Selv om både data mining og datavarehus arbeid med store mengder informasjon, de prosessene som brukes er ganske annerledes.

Et datavarehus er en programvare som brukes til å lagre store mengder data og kjøre spesielt utformet spørringer og rapporter. Business Intelligence er et voksende fagområde som fokuserer på datavarehus og tilhørende funksjonalitet. Disse verktøyene er utformet for å trekke ut data og lagre den i en metode utviklet for å gi økt systemytelse. Mye av terminologien i data mining og datavarehus er de samme, som fører til mer forvirring.

  • Data mining er bruk av mønstergjenkjenning logikk til identitets trender innenfor en prøve datasett og ekstrapolere denne informasjonen mot større data bassenget, mens datavarehus er prosessen med å trekke ut og lagre data for å tillate enklere rapportering.