Korrelationskoeffizientenformeln, Berechnung, Interpretation, Beispiel

Korrelationskoeffizientenformeln, Berechnung, Interpretation, Beispiel

Er Korrelationskoeffizient In Statistiken ist es ein Indikator, der den Trend von zwei quantitativen Variablen x und y misst, um eine Beziehung zwischen Linearität oder Verhältnismäßigkeit zwischen ihnen zu haben.

Im Allgemeinen sind die Variablenpaare x und y zwei Merkmale derselben Population. Zum Beispiel kann X die Größe einer Person E und ihr Gewicht sein.

Abbildung 1. Korrelationskoeffizient für vier Datenpaare (x, y). Quelle: f. Zapata.

In diesem Fall würde der Korrelationskoeffizient angeben, ob ein Verhältnis von Verhältnismäßigkeit zwischen Größe und Gewicht einer bestimmten Population besteht oder nicht.

Der lineare Korrelationskoeffizient von Pearson wird mit dem Brief bezeichnet R Kleinbuchstaben und seine minimalen und maximalen Werte sind -1 bzw. +1. 

Ein Wert r = +1 würde zeigen. Andererseits, wenn es passiert, dass r = -1, wären die Paare auch perfekt ausgerichtet, aber in diesem Fall, wenn X wächst und in demselben Verhältnis abnimmt.

Figur 2. Verschiedene Werte des linearen Korrelationskoeffizienten. Quelle: Wikimedia Commons.

Andererseits würde ein Wert r = 0 angeben, dass es keine lineare Korrelation zwischen den Variablen x und y gibt. Während ein Wert von r = +0,8 anzeigen würde, dass die Paare (x, y) dazu neigen.

Die Formel zur Berechnung des Korrelationskoeffizienten R lautet wie folgt:

Wobei der Zähler die Kovarianz zwischen den Variablen x und y repräsentiert, während der Nenner das Produkt der Standardabweichung für die Variable x und die Standardabweichung für die Variable und die Standardabweichung ist.

Wie man den Korrelationskoeffizienten berechnet?

Der lineare Korrelationskoeffizient ist eine statistische Menge, die in wissenschaftliche Taschenrechner in den meisten Tabellenkalkulationen und statistische Programme einbezogen wird.

Kann Ihnen dienen: Hyperbolisches Paraboloid: Definition, Eigenschaften und Beispiele

Es ist jedoch zweckmäßig zu wissen, wie die Formel, die sie definiert.

Und wie im vorherigen Abschnitt angegeben, ist der Korrelationskoeffizient die SXY -Kovarianz geteilt durch das Produkt der Standardabweichung SX für die Variablen X und SY für die Variable und die Variable und.

Kovarianz und Varianz

Die SXY -Kovarianz lautet:

Sxy = [σ (xi -) (yi -)] / (n -1)

Wo die Summe von 1 zu den N -Paaren (xi, yi) geht. E sind die arithmetischen Strümpfe des Daten xi e yi.

Die Standardabweichung für die Variable x ist die Quadratwurzel der Varianz des XI -Datensatzes mit I von 1 bis n:

Sx = √ [σ (xi -)^2) / (n -1)]

In ähnlicher Weise ist die Standardabweichung für die Variable und ist die Quadratwurzel der Varianz des YI -Datensatzes mit I von 1 bis n:

Sy = √ [σ (yi -)2 ) / (N-1)]

Illustrativer Fall

Um ausführlich den Weg zur Berechnung des Korrelationskoeffizienten zu zeigen, werden wir den folgenden Satz von vier Datenpaaren nehmen 

(X, y): (1, 1); (23); (3, 6) und (4, 7).

Zuerst berechnen wir den arithmetischen Mittelwert für x und y wie folgt:

= (1 + 2 + 3 + 4) / 4 = 2.5

= (1 + 3 + 6 + 7) / 4 = 4 = 4.25

Dann werden die verbleibenden Parameter berechnet:

SXY -Kovarianz

Sxy = [(1 - 2.5) (1 - 4.25) + (2 - 2.5) (3 - 4.25) + (3 - 2.5) (6 - 4.25) +.. ... .(4 - 2.5) (7 - 4.25)] / (4-1)

Sxy = [(-1.5) (-3.25) + (-0.5) (-1.25) + (0.5) (1.75) +.. . 

Kann Ihnen dienen: Ableitung Regeln (mit Beispielen)

.. .(1.5) (2.75)] / (3) = 10.5/3 = 3.5

Standardabweichung SX

Sx = √ [(-1).5)2 + (-0.5)2 + (0.5)2 + (1.5)2) / (4-1)] = √ [5/3] = 1.29

Standardabweichung SY

Sx = √ [(-3.25)2 + (-1.25)2 + (1.75)2 + (2.75)2) / (4-1)] = 

√ [22.75/3] = 2.75

Geländerkoeffizient r

R = 3.5 / (1.29 * 2.75) = 0.98

Deutung

Im Datensatz des vorherigen Fall die Einheit.

In dem Maße, in dem der Korrelationskoeffizient näher an 1 oder -1 liegt, macht mehr Sinn die Einstellung der Daten auf eine Zeile, das Ergebnis der linearen Regression.

Lineare Regression

Die lineare Regressionslinie wird erhalten Methode der kleinsten Quadrate. in dem der Parameter der Regressionslinie aus der Minimierung der Summe des Quadrats der Differenz zwischen dem Wert und dem geschätzten und dem yi der n -Daten erhalten wird.

Andererseits sind die Parameter A und B der Regressionslinie y = a + bx, die mit der Methode der minimalen Quadrate erhalten wurden,:

*B = sxy / (sx2) Für den Hang

*A = - b für den Schnittpunkt der Regressionslinie mit der Achse des und.

Erinnern Sie sich daran, dass SXY die oben definierte Kovarianz und SX ist2 Es ist die Varianz oder das Quadrat der zuvor definierten Standardabweichung. E sind das arithmetische Mittel des Daten x bzw. bzw. bzw.

Beispiel

Der Korrelationskoeffizient wird verwendet, um zu bestimmen, ob zwischen zwei Variablen eine lineare Korrelation besteht. Es ist anwendbar, wenn die zu untersuchenden Variablen quantitativ sind und auch einer normalen Typverteilung folgen sollen.

Kann Ihnen dienen: Korrespondenzregel einer Funktion

Ein illustratives Beispiel, das wir unten haben: Ein Maß für den Grad der Fettleibigkeit ist der Body Mass Index, der durch Teilen des Gewichts einer Person in Kilogramm zwischen der Größe derselben in den quadratischen Einheiten zum Quadrat erhalten wird.

Es ist zu wissen, ob es eine starke Korrelation zwischen dem Body -Mass -Index und der Konzentration des HDL -Cholesterinspiegels im Blut gibt, gemessen in Millimole pro Liter. Zu diesem Zweck wurde eine Studie mit 533 Personen durchgeführt, die in der folgenden Grafik zusammengefasst sind, in denen jeder Punkt die Daten einer Person darstellt.

Figur 3. IMC -Studie und HDL -Cholesterin bei 533 Patienten. Quelle: Aragones Institute of Health Sciences (IACS).

Aus der sorgfältigen Beobachtung des Diagramms gibt es einen bestimmten linearen (nicht sehr ausgeprägten) Trend zwischen der HDL -Cholesterinkonzentration und dem Body Mass Index. Das quantitative Maß für diesen Trend ist der Korrelationskoeffizient, der sich für diesen Fall als r = -0.276 herausstellte.

Verweise

  1. González c. Allgemeine Statistiken. Erholt von: Tarwi.La Molina.Edu.Sport
  2. IACs. Das Aragonesen Institut für Gesundheitswissenschaften. Abgerufen von: ICS-Aragon.com 
  3. Salazar c. und Castillo s. Grundlegende Statistiken Prinzipien. (2018). Abgerufen von: dspace.Uce.Edu.EC
  4. Superprof. Korrelationskoeffizient. Erholt von: Superprof.Ist
  5. USAC. Beschreibender Statistikhandbuch. (2011). Erholt aus: Statistik.Maschinenbau.USAC.Edu.Gt
  6. Wikipedia. Pearson -Korrelationskoeffizient. Geborgen von: ist.Wikipedia.com.