Hva er Spatial Data Mining?

May 8  by Eliza

Romlig data mining er prosessen med å prøve å finne mønstre i geografiske data. Mest brukt i detaljhandel, har det vokst ut av feltet av data mining, som i utgangspunktet fokusert på å finne mønstre i tekstlig og numerisk elektronisk informasjon. Romlige data mining er ansett som en mer komplisert utfordring enn tradisjonell gruvedrift på grunn av vanskelighetene forbundet med å analysere gjenstander med konkrete eksistenser i rom og tid.

Som med standard data mining, er romlig data mining primært brukt i verden av markedsføring og detaljhandel. Det er en teknikk for å fatte beslutninger om hvor du skal åpne hva slags butikk. Det kan bidra til å informere disse beslutningene ved å behandle eksisterende data om hvilke faktorer motivere forbrukerne til å gå til ett sted og ikke en annen.

Si at Ashley ønsker å åpne en nattklubb på en viss by blokk. Hvis hun hadde tilgang til de riktige data, kan hun bruke romlig data mining for å finne ut hva romlige faktorer gjør nattklubber vellykket. Hun kan stille spørsmål som: Vil flere folk kommer til klubben hvis kollektivtransport er i nærheten? Hva avstand fra andre utesteder maksimerer beskyttelse? Er nærhet til bensinstasjoner et pluss eller minus?

Ashley kan også være lurt å sørge for at folk som kommer til henne nattklubb kommer i en jevn fordeling i løpet av en enkelt natt. Hun kunne også bruke romlige data mining-kanskje mer presist, til gruvedrift-spatiotemporal data finne ut hvordan folk beveger seg gjennom byen til visse tider. Den samme prosessen kan brukes til patronage på forskjellige kvelder i uken.

Vanskelighetene med denne fremgangsmåte er på grunn av kompleksiteten til verden utenfor internett. Mens siste innsats på data mining vanligvis hatt databaser moden for analyse, inngangene tilgjengelige for romlig data mining er ikke nett av informasjon, men kart. Disse kartene har ulike typer objekter som veier, populasjoner, bedrifter og så videre.

Å avgjøre om noe er "nær" noe annet går fra å være en diskret til en kontinuerlig variabel. Dette øker massivt kompleksitet som kreves for analyse. Utrolig nok er dette en av de mer enkle typer relasjoner som er tilgjengelige for noen forsøker romlig data mining.

Romlig data mining ansikter også problemet med falske positiver. I prosessen med å søke data på jakt etter sammenhenger, vil mange tilsynelatende trendene fremstå som en konsekvens av statistiske falske positiver. Dette problemet eksisterer også for oppgaven med å utvinne en mer enkel database, men det er forsterket av størrelsen av data som er tilgjengelige for data miner. Til syvende og sist skal en trend identifisert ved datagraving bli bekreftet gjennom prosessen med forklaring og ytterligere forskning.