Hvordan sortere og Bestill data i R

January 16  by Eliza

En svært vanlig oppgave i dataanalyse og rapportering er sortere informasjon, som du kan gjøre enkelt i R. Du kan svare på mange hverdagslige spørsmål med ligatabeller - sortert tabeller av data som forteller deg det beste eller verste av konkrete ting.

For eksempel, foreldre ønsker å vite hvilken skole i sitt område er det beste, og bedrifter trenger å vite de mest produktive fabrikker eller de mest lukrative salg områder. Når du har data, kan du svare på alle disse spørsmålene rett og slett ved å sortere det.

Som et eksempel, se igjen på de innebygde data om statene i USA Først oppretter en dataramme kalt some.states som inneholder informasjon som finnes i den innebygde variablene state.region og state.x77:

> Some.states <- data.frame (
+ Region = state.region,
+ State.x77)

For å holde eksempel håndterlig, lage en undergruppe av bare de første ti rader og de tre første kolonnene:

> Some.states <- some.states [01:10, 1: 3]
> some.states
Region Befolkning Inntekt
Alabama South 3615 3624
Alaska West 365 6315
Arizona West 2212 4530
....
Delaware South 579 4809
Sør-Floridas 8277 4815
Georgia Sør 4931 4091

Du har nå en variabel kalt some.states som er en dataramme som består av ti rader og tre kolonner (Region, befolkning, og inntekt).

R gjør det enkelt å sortere vektorer i enten stigende eller synkende rekkefølge. Fordi hver kolonne av en dataramme er en vektor, kan du oppleve at du utfører denne operasjonen ganske ofte.

Hvordan å sortere en vektor i stigende rekkefølge

Hvis du vil sortere en vektor, bruker du den typen () -funksjonen. For eksempel vil sortere Befolkning i stigende rekkefølge, prøv dette:

> Sort (some.states $ Befolkning)
[1] 365 579 2110 2212 2541 3100 3615 4931 8277
[10] 21198

Hvordan å sortere en vektor i synkende rekkefølge

Du kan også fortelle sort () for å gå om sin virksomhet i synkende rekkefølge. For å gjøre dette, må du angi argumentet mink = TRUE:

> Sort (some.states $ Befolkning, mink = TRUE)
[1] 21 198 8277 4931 3615 3100 2541 2212 2110 579
[10] 365

Du får tilgang til hjelpedokumentasjonen for den slags () -funksjonen ved å skrive? Liksom inn i R-konsollen.