Hva er antall frihetsgrader?

October 5  by Eliza

Frihetsgrad (df) er et begrep mest brukt i statistikk og fysikk. I begge tilfeller er det en tendens til å definere grensene for et system og en stilling eller størrelsen av det som blir analysert, slik at den kan representeres visuelt. Definisjon av df i begge feltene er beslektet, men ikke helt det samme.

I fysikk, grad av frihet plasserer gjenstander eller systemer, og hver grad refererer til en posisjon i tid, rom eller i andre målinger. Df kunne brukes synonymt med begrepet koordinere, og det betyr vanligvis uavhengige koordinatene til færrest. Den faktiske grad av frihet er basert på systemet som beskrives i faserommet eller i alle mulige typer plass et system inhabits samtidig. Hver enkelt del av faserommet i systemet tar opp kan betraktes som en df, noe som bidrar til å definere den fulle realitetene i systemet som betraktes.

Fra et statistisk synspunkt, grad av frihet definerer distribusjoner av populasjoner eller prøver og er oppstått når folk begynner å studere resultater i statistikk: hypotesetesting og konfidensintervall. Som med den vitenskapelige definisjonen beskriver df i statistikk form eller aspekter ved prøve eller befolkningen avhengig av data. Ikke alle tegnede fremstillinger av distribusjoner har en grad av frihet måling. Den felles standard normalfordeling ikke er definert av grader; i stedet, vil det være det samme klokkeformet kurve i alle tilfeller.

En tilsvarende fordeling til standard normal er student-t. Studenten-t er definert delvis av grad av frihet i formelen n-1, hvor n er utvalgsstørrelsen. Dette betyr at var variable fra fordelingen for å bli plukket en etter en, alle unntatt den siste kan velges fritt. Det er ikke noe annet valg enn å ta den aller siste og ingen frihet til å velge noen annen variabel på det punktet. Derfor en variabel er ikke gratis; det er som å måtte plukke den siste flisen ut av en pose under en Scrabble® spill hvor det ikke er noe annet valg enn å velge den bokstaven.

Ulike distribusjoner som F og chi-kvadrat har ulike definisjoner av grad av frihet, og noen enda bruke mer enn ett df i definisjonen. Spørsmålet blir forvirrende fordi df definisjon er knyttet til type test utført og er ikke det samme med de ulike para (basert på parametere) og ikke-para (ikke basert på parametere) tester. I hovedsak vil det ikke alltid være n-en. Egnethets eller beredskaps tabellen testing kan bruke chi-kvadrat fordeling med forskjellig df enn det som evaluerer enkelt variabel hypotesetesting av variansen eller standardavvik.

Hva er viktig å huske er at hver gang grad av frihet til å definere en distribusjon, det forandrer det. Det kan likevel ha visse egenskaper som er uforanderlig, men størrelse og utseende kan variere. Når folk trekker representasjoner av fordelinger, spesielt to av de samme distribusjoner som har en annen df, de er bedt om å få dem til å se annerledes ut i størrelse for å formidle at df er ikke det samme.