Hvordan lage undergrupper av dine data i R

May 16  by Eliza

Ofte den første oppgaven i databehandling er å opprette undergrupper av dine data i R for videre analyse. Youâ € ™ re allerede er kjent med de tre delsett operatører:

  • $: Dollaren-skilt operatøren velger en enkelt element av dine data (og slipper dimensjonene av den returnerte objekt). Når du bruker dette operatør med en dataramme, er resultatet alltid en vektor; når du bruker det med en navngitt liste, får du det elementet.
  • [[: Den doble-kvadrat-parentes operatør returnerer også et enkelt element, men det gir deg fleksibilitet til å henvise til elementene ved posisjon, snarere enn av navn. Du bruker den for data rammer og lister.
  • [: Singelen-kvadrat-parentes operatør kan returnere flere elementer av dine data.

Dette sammendraget er forenklet.

Når du bruker single-kvadrat-brak operatør, returnerer du flere elementer av dine data. Dette betyr at du trenger en måte å angi nøyaktig hvilke elementer du trenger.

I dette avsnittet, kan du prøve undergruppe med de innebygde datasettet øyer, en navngitt numerisk vektor med 48 elementer.

> str (øyer)
Oppkalt num [01:48] 11506 5500 16988 2968 16 ...
- Attr (*, "navn") = chr [01:48] "Afrika" "Antarctica" "Asia" "Australia" ...

Delsett Effekt Eksempel
Blank Returnerer alle dine data øyer []
Positive tallverdier Pakker ut elementer på disse stedene øyer [c (8, 1, 1, 42)]
Negative tallverdier Pakk alt, men disse elementene; med andre ord, fjerner disse elementer øyer [- (3:46)]
Logiske verdier En logisk verdi av SANN inkluderer element; FALSKE ekskluderer element øyer [øyene <20]
Tekststrenger Inkluderer elementer der navnene sams øyer [c ("Madagaskar", "Cuba")]