Hvordan beregne data Korrelasjoner i R

November 5  by Eliza

Mengden der to data variabler varierer sammen kan beskrives ved korrelasjonskoeffisienten. I R, får du sammenhenger mellom et sett av variabler veldig enkelt ved hjelp av cor () -funksjonen. Du bare legge de to variablene du ønsker å undersøke som argumenter. For eksempel, hvis du ønsker å sjekke hvor mye bladet bredde korrelerer med bladet lengde, du bare gjøre følgende:

> Med (iris, cor (Petal.Width, Petal.Length))
[1] 0,9628654

Dette forteller deg at forholdet mellom bladet bredde og bladet lengde er nesten en perfekt linje, som du også kan se i fjerde tomt på tredje rad.

Du kan også beregne sammenhengen mellom flere variabler samtidig, mye på samme måte som du kan plotte forholdet mellom flere variabler. Så, for eksempel, kan du beregne korrelasjoner som korresponderer med tomt med følgende linje:

> Iris.cor <- cor (iris [-5])

Som alltid, kan du spare utfallet av denne funksjonen i et objekt. Dette lar deg undersøke strukturen i funksjon utgang slik at du kan finne ut hvordan du kan bruke det i resten av koden din. Her er en titt på strukturen av objektet iris.cor:

> Str (iris.cor)
num [1: 4, 1: 4] en -0,118 0,872 0,818 -0,118 ...
- Attr (*, "dimnames") = Liste over to
.. $: Chr [1: 4] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width"
.. $: Chr [1: 4] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width"

Denne utgangen forteller deg at iris.cor er en matrise med navnene på de variablene som både radnavnet og kolonnenavn. For å finne sammenhengen mellom to variabler i at matrisen, kan du bruke navnene som indekser - for eksempel:

> Iris.cor ['Petal.Width', 'Petal.Length']
[1] 0,9628654