Chi-Quadrat-Verteilung (χ²), wie es berechnet wird, Beispiele
- 4087
- 576
- Lewis Holzner
Der Beweis Chi quadriert entweder Ji-Quadrat (χ2, Wobei χ der griechische Buchstaben mit dem Namen "Chi") verwendet wird, um das Verhalten einer bestimmten Variablen zu bestimmen und auch, wenn Sie wissen möchten, ob zwei oder mehr Variablen statistisch unabhängig sind.
Um das Verhalten einer Variablen zu überprüfen, muss der Test aufgerufen werden CHI -Quadrattest der Einstellung. Zu wissen, ob zwei oder mehr Variablen statistisch unabhängig vom Test genannt werden Chi -Quadrat der Unabhängigkeit, auch genannt von Kontingenz.
Abbildung 1. Hypothesentests über Chi CuadradoDiese Erkenntnisse sind Teil der statistischen Entscheidungstheorie, in der eine Bevölkerung untersucht wird, und es werden Entscheidungen darüber getroffen, und analysiert ein oder mehrere Proben, die daraus extrahiert werden. Dazu ist es notwendig, bestimmte Annahmen in Bezug auf die Variablen zu treffen, die genannt werden Hypothese, das kann sicher sein oder nicht.
Es gibt einige Tests, um diese Vermutungen zu kontrastieren und zu bestimmen, welche innerhalb eines bestimmten Vertrauensrandes gültig sind, einschließlich des Chi-Quadrat-Tests, der angewendet werden kann, um zwei und die meisten Populationen zu vergleichen.
Wie wir sehen werden, werden in der Regel zwei Arten von Hypothese über einen Populationsparameter in zwei Proben berücksichtigt: die Nullhypothese, genannt Hentweder (Die Proben sind unabhängig) und die alternative Hypothese, die als H bezeichnet wird1, (Die Proben sind korreliert) was dem widerspricht.
[TOC]
Wann wird der Chi-Quadrat-Test verwendet??
Der Chi -Quadrat -Test gilt für Variablen, die Eigenschaften wie Geschlecht, Zivilstatus, Blutgruppe, Augenfarbe und Vorlieben verschiedener Typen beschreiben.
Der Test ist nach Wunsch ausgelegt:
-Überprüfen Sie, ob eine Verteilung geeignet ist, um eine Variable zu beschreiben, die genannt wird Anpassungsgüte. Durch den CHI -Quadrattest können Sie wissen, ob es signifikante Unterschiede zwischen der ausgewählten theoretischen Verteilung und der beobachteten Frequenzverteilung gibt.
-Wissen Sie, ob zwei x- und y -Variablen unabhängig von der statistischen Sicht sind. Dies ist bekannt als als Unabhängigkeitstest.
Da es für qualitative oder kategoriale Variablen gilt, wird der CHI -Quadrattest in Sozialwissenschaften, Verwaltung und Medizin häufig verwendet.
Bedingungen, um es anzuwenden
Es gibt zwei wichtige Anforderungen, um es korrekt anzuwenden:
Es kann Ihnen dienen: Wie ist die Beziehung zwischen dem Rhombusbereich und dem Rechteck?-Die Daten müssen in Frequenzen gruppiert werden.
-Die Probe muss groß genug sein, um die Chi -Quadratverteilung gültig zu machen, ansonsten wird ihr Wert überschätzt und führt zur Ablehnung der Nullhypothese, wenn sie nicht so sein sollte.
Die allgemeine Regel ist, dass, wenn in den gruppierten Daten eine Häufigkeit mit einem Wert von weniger als 5 erscheint, nicht verwendet wird. Wenn mehr als eine Frequenz weniger als 5 vorhanden ist, müssen sie in einem kombiniert werden, um eine Frequenz mit numerischer Wert von mehr als 5 zu erhalten.
Chi Square Distribution
χ2 Es ist eine kontinuierliche Verteilung der Wahrscheinlichkeiten. Je nach Parameter gibt es tatsächlich unterschiedliche Kurven k genannt Freiheitsgrade nach dem Zufallsprinzip.
Seine Eigenschaften sind:
-Die Fläche unter der Kurve entspricht 1.
-Die Werte von χ2 Sie sind positiv.
-Die Verteilung ist asymmetrisch, dh sie hat eine Verzerrung.
Figur 2. Chi Square -Verteilung für Watts -Freiheitsgrade. Quelle: Wikimedia Commons.Freiheitsgrade
Wenn die Freiheitsgrade zunehmen, ist die Chi-Quadrat-Verteilung zu normal.
Für eine bestimmte Verteilung werden die Freiheitsgrade durch die bestimmt Kontingenztabelle, Dies ist die Tabelle, in der die beobachteten Frequenzen der Variablen aufgezeichnet werden.
Wenn ein Tisch hat F Ränge und C Spalten, der Wert von k Ist:
K = (f - 1) ≤ (c - 1)
Hypothesenformulierung
Wenn der CHI -Quadrattest die Einstellung ist, werden die folgenden Hypothesen formuliert:
-Hentweder: variable x hat Wahrscheinlichkeitsverteilung f (x) mit spezifischen Parametern und1, Und2… , UndP
-H1: X hat eine andere Wahrscheinlichkeitsverteilung.
Die Wahrscheinlichkeitsverteilung, die in der Nullhypothese angenommen wird.
Darüber hinaus wird die Nullhypothese mit einem gewissen Signifikanzniveau bewertet, dh ein Maß für den Fehler, der bei der Ablehnung der wahren Wahrung gemacht wird.
Im Allgemeinen wird dieses Niveau von 1 %, 5 % oder 10 % festgelegt und je niedriger das Testergebnis ist, desto zuverlässiger.
Kann Ihnen dienen: MummUnd wenn der Chi -Quadrat -Test der Kontingenz verwendet wird, der, wie wir gesagt haben, die Unabhängigkeit zwischen zwei Variablen x und y dient, sind die Hypothesen:
-Hentweder: Die Variablen X und Y sind unabhängig.
-H1: X und y sind abhängig.
Auch hier ist es notwendig, ein Signifikanzniveau anzugeben, um das Maß des Fehlers bei der Entscheidung zu kennen.
Wie werden Chi-Quadrat-Statistiken berechnet??
Die Chi -Quadrat -Statistiken werden wie folgt berechnet:
Das Symbol ∑ bedeutet "Summierung", die wir über den angegebenen fraktionalen Ausdruck machen müssen.
Die Summe erfolgt von der ersten Klasse I = 1 bis zum letzten, was i = k ist.
Neben:
-Fentweder Es ist eine beobachtete Frequenz (sie stammt aus den erhaltenen Daten).
-FUnd Es ist die erwartete oder theoretische Häufigkeit (es ist erforderlich, sie aus den Daten zu berechnen).
Um die Nullhypothese zu akzeptieren oder abzulehnen, wird χ berechnet2 Für beobachtete Daten und verglichen mit einem Wert genannt Chi Critical Square, das hängt von den Freiheitsgraden ab k und das Signifikanzniveau α:
χ2kritisch = χ2K, α
Wenn wir zum Beispiel den Test mit einem Signifikanzniveau von 1 %durchführen möchten, dann α = 0.01, wenn es mit 5% ist, dann α = 0.05 und so weiter. P, der Verteilungsparameter, wie:
P = 1 - α
Diese kritischen quadratischen Werte werden durch Tabellen bestimmt, die den Wert der akkumulierten Fläche enthalten. Zum Beispiel für k = 1, was 1 Freiheitsgrad und α = 0 darstellt.05, äquivalent zu p = 1-.05 = 0.95, der Wert von χ2 Es ist 3.841.
Figur 3. Chi Quadratverteilungswerte Tabelle. Quelle: f. Zapata.AC -Akzeptanzkriterienentweder
Die Kriterien für die Akzeptanz hentweder Ist:
-Ja χ2 < χ2kritisch Hentweder, Andernfalls wird es abgelehnt (siehe Abbildung 1).
Beispiel für die Berechnung
In der folgenden Anwendung wird der CHI -Quadrattest als Unabhängigkeitstest verwendet.
Angenommen, Forscher möchten wissen, ob die Präferenz für schwarzen Kaffee mit dem Genre der Person zusammenhängt, und die Antwort mit einem Signifikanzniveau von α = 0 angeben.05.
Kann Ihnen dienen: externe alternative Winkel: Übungen und Übungen gelöstZu diesem Zweck sind ein Beispiel von 100 befragten Personen und ihre Antworten verfügbar:
Schritt 1
Hypothesen festlegen:
-Hentweder: Geschlecht und Präferenz für schwarzen Kaffee sind unabhängig.
-H1: Der Geschmack für schwarzen Kaffee hängt mit dem Genre der Person zusammen.
Schritt 2
Berechnen Sie die erwarteten Frequenzen für die Verteilung, für die die Gesamtsumme in der letzten Zeile und in der rechten Spalte erforderlich sind. Jede Zelle im roten Box hat einen erwarteten Wert FUnd, Dies wird berechnet, indem die Summe seiner R -Reihe F mit der Gesamtspalte C geteilt wird, geteilt durch die Gesamtprobe N:
FUnd = (F x c) /n
Die Ergebnisse sind für jede Zelle wie folgt:
-C1: (36 x 47) / 100 = 16.92
-C2: (64 x 47) / 100 = 30.08
-C3: (36 x 53) / 100 = 19.08
-C4: (64 x 53) / 100 = 33.92
Schritt 3
Dann müssen Sie die Chi -Cuadrado -Statistik für diese Verteilung gemäß der angegebenen Formel berechnen:
χ2= [(21 - 16.92)2 ÷ 16. 92] + [(26 - 30.08)2 ÷ 30.08] + [(15 - 19).08)2 ÷ 19.08]+ [(38 - 33.92)2 ÷ 33. 92] = 0.9838 + 0.5534 + 0.8725 + 0.4908 = 2.9005
Schritt 4
Bestimmen Sie χ2kritisch, Zu wissen, dass die registrierten Daten bei F = 2 Zeilen und C = 2 -Spalten liegen, ist die Anzahl der Freiheitsgrade daher:
K = (2-1) ⋅ (2-1) = 1.
Dies bedeutet, dass wir in der Tabelle nach dem Wert von χ nachsehen müssen2K, α = χ21; 0.05 , welches ist:
χ2kritisch = 3.841
Schritt 5
Vergleichen Sie die Werte und entscheiden Sie:
χ2 = 2.9005
χ2kritisch = 3.841
Da χ2 < χ2kritisch Die Nullhypothese wird akzeptiert und es wird der Schluss gezogen, dass die Präferenz für schwarzen Kaffee nicht mit dem Genre der Person mit einem Signifikanzniveau von 5% verbunden ist.
Verweise
- Chi Square Test for Unabhängigkeit. Erholt von: Saylordotorg.Github.Io.
- Med Welle. Statistiken, die für Gesundheitswissenschaften angewendet wurden: Der Ji-Quadrat-Test. Erholt von: medwave.Cl.
- Wahrscheinlichkeiten und Statistiken. Shi Square Adjustment Goodness Test. Abgerufen von: Wahrscheinlichkeiten undes.com.
- Triola, m. 2012. Elementarstatistik. 11. Auflage. Addison Wesley.
- Unam. Chi-Quadrat-Test. Erholt von: Beratung.Cuautitlan2.Unam.mx.
- « Gruppierte Datenbeispiele und gelöste Übung
- Charakteristische Balkendiagramme, was ist es, Beispiele, Beispiele »