Hvordan arbeide med Non-CSV Datafiler i R

August 29  by Eliza

Til tross for at CSV (kommaseparerte verdier) filer er svært mye brukt til å importere og eksportere data i R, de er ikke alltid den mest passende format. Noen dataformater tillate spesifikasjon av data som ikke er i tabellform i naturen. Andre dataformater tillate beskrivelsen av data ved hjelp av metadata (data som beskriver data).

Basen distribusjon av R inkluderer en pakke kalt fremmed som inneholder funksjoner for å importere datafiler fra en rekke kommersielle statistiske pakker, inkludert SPSS, Stata, SAS, Octave, og Minitab.

Å bruke disse funksjonene, må du først laste den utenlandske pakken:

> Bibliotek (utenlandske)
> Read.spss (file = "location / av / myfile")

System Funksjon som skal importeres til R
SPSS read.spss
SAS read.xport eller read.ssd
Stata read.dta
Minitab read.mtp

Les hjelpedokumentasjonen på disse funksjonene nøye. Fordi datarammer i R kan ha en helt annen struktur enn datasett i de statistiske pakker, må du være spesielt oppmerksom på hvordan verdi og variable etikettene blir behandlet av disse funksjonene. Sjekk også behandling av spesielle manglende verdier.

Disse funksjonene trenger en bestemt fil format. Funksjonen read.xport () fungerer bare med Xport formatet SAS. For read.mtp (), må filen være i den bærbare regneark (.mtp) format Minitab.

Merk at noen av disse funksjonene er ganske gamle. De nyeste versjonene av statistiske pakker som er nevnt her kan ha ulike spesifikasjoner for formatet, slik at funksjonene ikke alltid garantert å fungere.

Til slutt, merk at noen av disse funksjonene krever den statistiske pakken selv å bli installert på datamaskinen din. Den read.ssd () funksjon, for eksempel, kan bare fungere hvis du har SAS installert.

Poenget: Hvis du kan overføre data ved hjelp av CSV-filer, vil du spare deg selv en masse problemer.

Til slutt, hvis du har behov for å koble R til en database, så oddsen er at en pakke finnes som kan kobles til din database med valget. Se den nærliggende sidebar, "Arbeide med databaser i R," for noen tips.