Hvordan å analysere data Avvik i Modeller med R

October 25  by Eliza

En analyse av varians (ANOVA) er en svært vanlig teknikk som brukes med R for å sammenligne middel mellom ulike grupper av data. For å illustrere dette, ta en titt på datasettet InsectSpray:

> str (InsectSprays)
'Data.frame': 72 obs. av to variabler:
$ Teller: num 10 7 20 14 14 12 10 23 17 20 ...
$ Spray: Factor m / 6 nivåer "A", "B", "C", "D", ..: 1 1 1 1 1 1 1 1 1 1 ...

Dette datasettet inneholder resultatene av en landbruks eksperiment. Seks insektmidler ble testet på 12 felt hver, og forskerne telte antall pesky bugs som forble på hvert felt. Nå bøndene trenger å vite om de insektmidler gjør noen forskjell, og i så fall, hvilken de beste bruk. Du svare på dette spørsmålet ved hjelp av AOV () -funksjonen til å utføre en ANOVA.

Hvordan bygge modellen

For dette enkle eksempel bygge modellen er en bit av kaken. Du i hovedsak ønsker å modellere midler for variabelen teller som en funksjon av den variable spray. Du oversette det til R slik:

> AOVModel <- AOV (count ~ spray, data = InsectSprays)

Du passerer to argumenter til AOV () -funksjonen i denne linjen med kode:

  • Formelen teller ~ spray, som lyder som "telle som en funksjon av spray"
  • Argumentet data, der du angir datarammen der variablene i formelen kan bli funnet

Hver modellering funksjonen returnerer en modell objekt med mye informasjon om den tilpassede modellen. Alltid sette denne modellen objekt i en variabel. På denne måten trenger du ikke å montere modellen når du trenger å utføre ekstra beregninger.

Hvordan du ser på modellen objekt

Som med hvert objekt, kan du se på en modell objekt bare ved å skrive navnet sitt i konsollen. Hvis du gjør det for objektet Model du opprettet, ser du følgende resultat:

> AOVModel
Ring:
AOV (formel = count ~ spray, data = InsectSprays)
Vilkår:
spray Residualer
Summen av Squares 2668.833 1015.167
Deg. av Freedom 5 66
Residual standard error: 3.921902
Estimerte effekten kan være ubalansert

Dette betyr ikke fortelle deg så mye, bortsett fra kommandoen (eller samtalen) du brukte til å bygge modellen og noen grunnleggende informasjon om montering resultat.

I produksjonen, du også lese at de estimerte effektene kan være ubalansert. Dette er ikke en advarsel - det er en melding som er bygget inn av forfatteren av AOV () -funksjonen. Dette kan man komme opp i to situasjoner:

  • Du trenger ikke ha samme antall tilfeller i hver gruppe.
  • Du satt ikke ortogonale kontraster.

I dette tilfellet er det den andre grunnen.