U -Test von Mann - Whitney Was ist und wenn gilt, Ausführung, Beispiel

U -Test von Mann - Whitney Was ist und wenn gilt, Ausführung, Beispiel

Der U -Test von Mann - Whitney Es wird angewendet, um zwei unabhängige Proben zu vergleichen, wenn sie nur wenige Daten haben oder keine Normalverteilung befolgen. Auf diese Weise wird es als Test angesehen nicht parametrisch, Im Gegensatz zu Ihrem Gegenstück Student t Test, Dies wird verwendet, wenn die Probe groß genug ist und der Normalverteilung folgt.

Frank Wilcoxon schlägt es 1945 zum ersten Mal für Proben identischer Größen vor, aber zwei Jahre später wurde es bei Proben unterschiedlicher Größe von Henry Mann und D erweitert. R. Whitney.

Abbildung 1. Der U -Test von Mann - Whitney wird für den Vergleich unabhängiger Proben angewendet. Quelle: Pixabay.

Häufig wird der Test angewendet, um zu überprüfen, ob eine Beziehung zwischen einer qualitativen Variablen und einer anderen quantitativen Beziehung besteht.

Ein illustratives Beispiel besteht darin, eine Reihe von hypertensiven Personen zu nehmen und zwei Gruppen zu extrahieren, denen die täglichen Blutdruckdaten für einen Monat aufgezeichnet werden.

Zu einer Gruppe wird die Behandlung a und eine andere die Behandlung b angewendet B. Hier ist Blutdruck die quantitative Variable und die Art der Behandlung ist die qualitative.

Sie möchten wissen, ob der Median und nicht der Durchschnitt der gemessenen Werte statistisch gleich oder unterschiedlich sind, um festzustellen, ob es einen Unterschied zwischen beiden Behandlungen gibt. Um die Antwort zu erhalten, wird der Wilcoxon oder U -Test von Mann - Whitney angewendet.

[TOC]

Problemansatz im U -Test von Mann - Whitney

Ein weiteres Beispiel, bei dem der Test angewendet werden kann, ist wie folgt:

Angenommen, Sie möchten wissen, ob sich der Verbrauch von Erfrischungsgetränken in zwei Regionen des Landes erheblich unterscheidet.

Einer von ihnen heißt Region A und die andere Region B. Ein Rekord der Liter, die wöchentlich in zwei Proben verzehrt werden.

Die Daten sind wie folgt:

-Region a: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

-Region b: 12,14, 11, 30, 10

Die folgende Frage wird aufgeworfen:

Hängt der Verbrauch von Erfrischungsgetränken (y) von der Region (x) ab?

Qualitative Variablen gegen quantitative Variablen

-Qualitative Variable x: Region

-Quantitative Variable und: Gasförmiger Verbrauch

Wenn die Menge der verbrauchten Liter in beiden Regionen gleich ist, ist die Schlussfolgerung, dass es keine Abhängigkeit zwischen den beiden Variablen gibt. Der Weg zu wissen besteht darin, den durchschnittlichen oder mittleren Trend für die beiden Regionen zu vergleichen.

Normalfall

Wenn die Daten einer Normalverteilung folgten, werden zwei Hypothesen angehoben: die Null H0 und die H1 -Alternative durch den Vergleich zwischen den Mitteln:

Kann Ihnen dienen: bemerkenswerte Produkte

-H0: Es gibt keinen Unterschied zwischen dem Durchschnitt der beiden Regionen.

-H1: Die Mittel beider Regionen sind unterschiedlich.

Fall ohne No - normale Tendenz

Im Gegenteil, wenn die Daten nicht einer Normalverteilung folgen oder einfach die Stichprobe sehr gering ist, anstatt den Durchschnitt zu vergleichen Der Median der beiden Regionen.

-H0: Es gibt keinen Unterschied zwischen dem Median der beiden Regionen.

-H1: Die Mediane beider Regionen sind unterschiedlich.

Wenn die Medianen zusammenfallen, ist die Nullhypothese erfüllt: Es gibt keine Beziehung zwischen Soda -Konsum und der Region.

Und wenn das Gegenteil auftritt, ist die alternative Hypothese wahr: Es besteht eine Beziehung zwischen Verbrauch und Region.

Es ist für diese Fälle, in denen der U -Test von Mann - Whitney angezeigt wird.

Probe oder nicht gepaarte Proben

Das folgende wichtige Problem, um zu entscheiden, ob Mann Whitneys U -Test angewendet wird.

Wenn die beiden Proben gepaart werden, würde die ursprüngliche Wilcoxon -Version gelten. Aber wenn nicht, wie im Beispiel, wird der modifizierte Wilcoxon -Test angewendet, der genau Mann Whitneys U -Test ist.

Mann Whitney U -Testmerkmale

Der u -Test von Mann -Whitney Ein nicht parametrischer Test, der für Proben anwendbar ist, die nicht der Normalverteilung oder mit wenigen Daten folgen. Es hat die folgenden Eigenschaften:

1.- Vergleichen Sie die Mediane

2.- Arbeiten an bestellten Bereichen

3.- Es ist weniger kraftvoll und versteht durch Macht die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie in Wirklichkeit falsch ist.

Unter Berücksichtigung dieser Eigenschaften wird der U -Test von Mann - Whitney angewendet, wenn:

-Die Daten sind unabhängig

-Sie folgen der Normalverteilung nicht

-Die Null H0 -Hypothese wird akzeptiert, wenn das Medium der beiden Proben zusammenfällt: ma = mb

-Die alternative H1 -Hypothese wird akzeptiert, wenn sich das Medium der beiden Proben unterscheidet: ma ≠ mb

Mannformel - Whitney

Die U -Variable ist die im Mann -Whitney -Test verwendete Kontraststatität und wird definiert:

U = min (ua, ub)

Dies bedeutet, dass u der geringste der Werte zwischen UA und UB ist, die für jede Gruppe angewendet werden. In unserem Beispiel wäre es für jede Region: a o b.

UA- und UB -Variablen werden gemäß der folgenden Formel definiert und berechnet:

Ua = nb + na (na +1)/2 - ra

Ub = nb + nb (nb +1)/2 - rb

Kann Ihnen dienen: Reduzierung ähnlicher Begriffe

Hier sind die Na- und NB -Werte die Größen der Stichproben, die den Regionen A bzw. B entsprechen, und andererseits sind RA und RB die Bereichsummen dass wir unten definieren werden.

Schritte zur Anwendung des Tests

1.- Bestellen Sie die Werte der beiden Proben.

2.- Weisen Sie jedem Wert einen Bestellbereich zu.

3.- Korrigieren Sie vorhandene Ligaturen in den Daten (wiederholte Werte).

4.- Berechnen Sie RA = Summe der Bereiche der Probe a.

5.- Finden Sie RB = Summe der Bereiche der Probe B.

6.- Bestimmen Sie den UA- und UB -Wert gemäß den im vorherigen Abschnitt angegebenen Formeln.

7.- Vergleiche UA und UB, und der Minderjährige der beiden wird der oder der experimentellen Statistik (dh den Daten) im Vergleich zur theoretischen oder normalen Statistik zugeordnet.

Praktische Anwendung der Anwendung

Jetzt wenden wir das oben erwähnte auf das zuvor angesprochene Problem der Soda an:

Region A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12

Region B: 12,14, 11, 30, 10

Je nachdem, dass die Mittel beider Stichproben statistisch oder unterschiedlich sind, akzeptieren oder ablehnen wir die Nullhypothese an: Es besteht keine Beziehung zwischen der Variablen und und dem X, dh der Verbrauch von Soda hängt nicht von der Region ab:

H0: ma = mb

H1: ma ≠ mb

Figur 2. Gasverbrauchsdaten in Regionen A und B. Quelle: f. Zapata.

- Schritt 1

Wir bestellen die Daten gemeinsam für die beiden Proben und bestellen die Werte am wenigsten bis zum größten:

Beachten Sie, dass der Wert 11 2 -mal erscheint (einmal in jeder Probe). Ursprünglich hat es Positionen oder Bereiche 3 und 4, aber nicht, um einen oder anderen zu überschätzen oder zu unterschätzen. Der Durchschnittswert wird als Bereich ausgewählt, dh 3,5.

In ähnlicher Weise wird der 12 -Wert fortgesetzt, der dreimal mit den Bereichen 5, 6 und 7 wiederholt wird.

Nun, dem Wert 12 wird der durchschnittliche Bereich von 6 = (5+6+7)/3 zugewiesen. Und das Gleiche gilt für Wert 14, der Ligation (in beiden Stichproben) in den Positionen 8 und 9 aufweist, der durchschnittliche Bereich 8 wird zugeordnet.5 = (8+9)/2.

- Schritt 2

Die Daten für Region A und B werden dann erneut getrennt, aber jetzt sind ihre entsprechenden Bereiche in einer anderen Zeile zugewiesen:

Region a

Region b

RB -Bereiche werden aus den Summen der Elemente der zweiten Reihe für jeden Fall oder für Regionen erhalten.

Schritt 3

Die jeweiligen UA- und UB -Werte werden berechnet:

UA = 10 × 5 + 10 (10 + 1)/2 - 86 = 19

UB = 10 × 5 + 5 (5 + 1)/2 -34 = 31

Experimenteller Wert u = min (19, 31) = 19

Schritt 4

Der Theoretiker soll einer Normalverteilung n mit Parametern folgen, die ausschließlich durch die Größe der Proben angegeben sind:

Kann Ihnen dienen: Irrationale Zahlen: Geschichte, Eigenschaften, Klassifizierung, Beispiele

N ((Naënb) /2, √ [Nb (Na + Nb +1) /12])

Um die Variable oder experimentell erhaltene zu vergleichen, müssen Sie mit der theoretischen Änderung eine variable Änderung vornehmen. Es geht von der Variablen oder experimentell bis zu seinem Wert typisiert, die genannt werden Z, Um mit der einer Normalverteilung vergleichen zu können, die typisiert ist.

Die variable Änderung ist wie folgt:

Z = (u - na.Nb / 2) / √ [na. NB (Na + NB + 1) / 12] 

Es ist zu beachten, dass für die Änderung der Variablen die Parameter der theoretischen Verteilung für u verwendet wurden. Dann die neue Z -Variable, die ein Hybrid zwischen theoretischer und experimenteller oder normaler Verteilung ist, das n (0,1) typisiert ist, (0,1).

Vergleichskriterien

Wenn z ≤ zα ⇒ Die Null H0 -Hypothese wird akzeptiert

Ja z> zα ⇒ Die Null H0 -Hypothese wird abgelehnt

Die kritischen Werte zα typisiert von der erforderlichen Konfidenzniveau, beispielsweise für ein Vertrauensniveau α = 0,95 = 95%, was am üblichsten ist, hat den kritischen Wert Zα = 1,96.

Für die hier gezeigten Daten:

Z = (u - nb / 2) / √ [nb (na + nb + 1) / 12] = -0,73

Das liegt unter dem kritischen Wert 1.96.

Dann ist die endgültige Schlussfolgerung, dass die Nullhypothese akzeptiert wird:

Es gibt keinen Unterschied im Verbrauch von Soda zwischen den Regionen A und B.

Online -Taschenrechner für den U -Test von Mann - Whitney

Es gibt bestimmte Programme für statistische Berechnungen, einschließlich SPSS und Minitab, aber diese Programme werden bezahlt und ihre Verwendung ist nicht immer einfach. Dies liegt daran.

Glücklicherweise gibt es mehrere sehr präzise, ​​kostenlose und einfache Online -Programme, die unter anderem die U -Whitney -U -Tests ermöglichen.

Diese Programme sind:

-Sozialwissenschaftliche Statistiken (Socscistatistics.com), der sowohl den U-Whitney U-Test als auch Wilcoxon im Fall von ausgewogenen oder gepaarten Proben hat.

-AI-Therapiestatistik (AI-Therapie.com), das mehrere der üblichen beschreibenden Statistiktests hat.

-Statistisch zu verwenden (Physik.CSBSJU.EDU/STATS), eine der ältesten, damit Ihre Benutzeroberfläche veraltet aussehen kann, obwohl es ein sehr effizientes kostenloses Programm ist.

Verweise

  1. Dietrichson. Quantitative Methoden: Bereiche Test. Erholt von: Bookdown.Org
  2. Marín J p. SPSS -Leitfaden: Analyse und Verfahren in nicht -parametrischen Tests. Erholt von: Halweb.UC3M.Ist
  3. USAL MOOC. Nicht -parametrischer Test: U of Mann - Whitney. Erholt von: YouTube.com
  4. Wikipedia. U -Test von Mann - Whitney. Geborgen von: ist.Wikipedia.com
  5. Xlstat. Hilfezentrum. Mann -Test -Tutorial - Whitney in Excel. Erholt von: Hilfe.Xlsat.com