Hva er Data Integration?

July 23  by Eliza

Dataintegrasjon er en sammenslåing av flere datakilder i et enkelt datakilde. Denne praksis er ofte meget tidkrevende, og er involvert, som de forskjellige datakildene er sannsynlig uforenlige med hverandre. Ting så enkelt som forskjellige kolonne navn på et regneark er nok til å kreve dato reformatering. Denne prosessen er mest vanlig i de tilfeller der to grupper startet med noen forbindelse, men er plassert sammen etter at de har arbeidet uavhengig av hverandre. Dataintegrasjon har blitt et viktigere tema på grunn av utbredelsen av fri datakilder og online databaser.

Dataene del av data integrasjon kan være nesten alt, så lenge det er lagret i et datamaskinsystem. Det faktiske innholdet av dataene er sjelden så viktig som på hvilken måte dataene lagres. Mesteparten av tiden, blir dataene holdt i databaser, organisert systemer av informasjon. Disse systemene inneholder unike oppføringer og felt som tillater brukere å finne informasjon raskt.

Det største hinderet til data integrasjonsprosessen er selve dataene. I mange tilfeller, når dataene først ble satt opp, var det ingen intensjon om noensinne sammenslåing datasettet med en annen. Dette betyr at selv om to datasett kan vise til det samme, de er helt uforenlig.

Nesten hva som helst vil gjøre databaser inkompatible. Noe så enkelt som en forskjell i presentasjonen, som for eksempel felt orden eller kolonnebredde, kan være nok til å hindre en enkel fusjonen. Når dataene er vesentlig forskjellig, slik som en database som inneholder mer eller mindre informasjon, er sammenslåing mye vanskeligere.

De to situasjoner som krever data integrasjon mer enn noen annen er i bransjen og forskningsfeltene. I næringslivet, sammenslåing avdelinger eller selskaper krever å kombinere den tidligere egen informasjon inn i en enkel struktur. Denne formen for integrering er generelt veldig vanskelig med mindre de opprinnelige gruppene brukte lignende programvare og hadde lignende informasjons mål.

Når data integrasjon utføres for forskningsformål, vanligvis går det mye jevnere. Når en forsker gir tilgang til sin informasjon til en annen, er de to partiene generelt ser inn i den samme prosessen. Dette betyr at de vil bruke lignende metoder for å katalogisere og lagre sine data.

I det siste, dataintegrasjon var en relativt mindre område av datastudier, men dette har endret seg siden begynnelsen av det 21. århundre. Med gratis online databaser stadig mer populært og nøyaktig, er selskaper desperat å få sin informasjon i en felles format. Dette tillater dem å både gi ut sin informasjon på offentlige skjema, og å integrere private versjoner av velkjente offentlige grensesnitt inn i sine systemer.

  • Dataintegrasjon er en sammenslåing av flere datakilder i et enkelt datakilde.