Kan korrelasjonskoeffisienten brukes til å måle avhengighet?

GeoGebra - 62 Kurvetilpasning (regresjon) V (November 2024)

GeoGebra - 62 Kurvetilpasning (regresjon) V (November 2024)
Kan korrelasjonskoeffisienten brukes til å måle avhengighet?
Anonim
a:

Korrelasjonskoeffisienten kan brukes til å måle den lineære avhengigheten mellom to tilfeldige variabler. Den vanligste korrelasjonskoeffisienten, generert av Pearson-produkt-øyeblikkskorrelasjonen, kan brukes til å måle det lineære forholdet mellom to variabler. I et ikke-lineært forhold kan denne korrelasjonskoeffisienten imidlertid ikke alltid være et passende mål for avhengighet.

Forskjellene mellom korrelasjon og avhengighet kan illustreres av begreper korrelasjon og årsakssammenheng. Korrelasjonskoeffisienten indikerer ikke tilstedeværelsen av et årsakssammenheng mellom to variabler. For eksempel er det ikke bevist årsakssammenheng mellom lykke og fysisk styrke. Selv om en analyse av data kan indikere en positiv sammenheng mellom de to variablene, betyr det ikke at lykke fører til en økning i fysisk styrke eller dens omvendte - at en økning i fysisk styrke gir lykke - er sant. Følgelig kan avhengigheten av en variabel på den andre ikke fastslås direkte fra koeffisienten av korrelasjon på grunn av virkningen av fremmede tilfeldige variabler som påvirker statistisk avhengighet. Forholdet mellom antall sjømenn på et skip og dets gjennomsnittlige hastighet indikerer for eksempel ikke årsakssammenheng på grunn av tilstedeværelsen av flere andre faktorer, for eksempel værforholdene, gassinnstillinger og nyttelast. Den finansielle næringen bruker også prinsippene for årsakssammenheng og korrelasjon i forhold til forholdet mellom resultat per aksje og andre finansielle beregninger.

Det finnes flere typer korrelasjonskoeffisienter som brukes til å bestemme forholdet mellom ulike datatyper, inkludert Spearman rangordre korrelasjon, Biserial korrelasjon og Phi korrelasjon. Pearson-koeffisienten av korrelasjon er betegnet med bokstaven "r" og kan brukes til å tolke styrken eller svakheten i et forhold mellom to variabler mellom verdiene +1 og -1. Når kvadrert er den resulterende verdien kjent som determinanskoeffisienten som uttrykker variasjonen av et slikt forhold.