Hva er enkel lineær regresjon?

June 29  by Eliza

Enkel lineær regresjon gjelder for statistikk og bidrar til å beskrive (x, y) data som ser ut til å ha et lineært forhold, slik at for noen prediksjon av y hvis x er kjent. Denne informasjonen blir ofte plottet på scatterplots og formelen for lineær regresjon skaper en linje som passer best alle poengene, forutsatt at de virkelig har en lineær sammenheng. Det vil ikke passe nøyaktig alle poengene, men det bør være en linje der summen av kvadratene av differansen mellom faktiske data og forventede data (ut restene) skaper det laveste tallet, som ofte kalles den minste kvadrater linje eller linje med best mulig passform. Ligningen av linjen for eksempeldata og befolkningsdata er følgende: y = b 0 + b 1 x og y = b 0 + B 1 x.

Noen kjent med algebra kan merke likheten av denne linjen y = mx + b, og faktisk de to er forholdsvis identiske, bortsett fra de to uttrykkene på høyre side av ligningen er slått, slik at B er lik en skråning eller m. Grunnen til dette omorganisering er det da blir elegant enkelt å legge ytterligere betingelser med funksjoner som eksponenter som kan beskrive ulike lineære former for forholdet.

Formlene for å få en enkel lineær regresjon linje er relativt komplisert og tungvint, og folk flest ikke bruker mye tid på å skrive disse ned fordi de tar lang tid å fullføre. I stedet kan ulike programmer, for eksempel for Excel® eller for mange typer vitenskapelige kalkulatorer, enkel måte beregne minste kvadraters linje. Linjen er kun egnet for prediksjon om det er klare bevis for en sterk korrelasjon mellom settene med (x, y) data. En kalkulator vil generere en linje, uavhengig av om det gir noen mening å bruke den.

Samtidig er en enkel lineær regresjonslinje ligning blir generert, må folk ser på nivået av korrelasjon. Dette betyr evaluere r, korrelasjonskoeffisienten, mot en tabell over verdier for å bestemme om lineær korrelasjon. I tillegg evaluere dataene ved å plotte det som et spredningsplott er en god måte å få en følelse hvis data har en lineær sammenheng.

Hva kan da gjøres med en enkel lineær regresjon linje, forutsatt at det har en lineær korrelasjon, er at verdiene kan være substituert i x, for å få en forutsagt verdi for y. Denne spådommen har sine grenser. Dataene til stede, spesielt hvis det er bare et eksempel, kan ha en lineær sammenheng nå, men kanskje ikke senere med ytterligere prøvemateriale lagt.

Alternativt kan en hel prøve dele en sammenheng mens en hel befolkning ikke. Prediksjon er derfor begrenset, og går langt utover de tilgjengelige dataverdier kalles ekstrapolering, og er ikke oppmuntret. Videre bør folk vite at hvis ingen lineær korrelasjon, det beste estimatet av x er gjennomsnittet av alle y data.

I hovedsak er enkel lineær regresjon et nyttig statistisk verktøy som kan, med diskresjon, brukes til å forutsi y verdier basert på økse verdi. Det er nesten alltid lært med ideen om lineær korrelasjon siden bestemme nytten av en regresjonslinje krever analyse av r. Heldigvis med mange moderne tekniske programmer, kan folk graf scatterplots, legge regresjonslinjer og bestemme korrelasjonskoeffisient r med et par oppføringer.