Hypergeometrische Verteilungsformeln, Gleichungen, Modell

Hypergeometrische Verteilungsformeln, Gleichungen, Modell

Der Hypergeometrische Verteilung Es ist eine diskrete statistische Funktion, die ausreicht, um die Wahrscheinlichkeit in zufälligen Experimenten mit zwei möglichen Ergebnissen zu berechnen. Die für die Anwendung erforderliche Bedingung ist, dass es sich um kleine Populationen handelt, in denen die Extraktionen nicht ersetzt werden und die Wahrscheinlichkeiten nicht konstant sind. 

Wenn ein Element der Bevölkerung ausgewählt wird, um das Ergebnis (wahr oder falsch) eines bestimmten Merkmals zu kennen, kann das gleiche Element nicht erneut ausgewählt werden.

Abbildung 1. In einer solchen Population von Schrauben gibt es sicherlich defekte Exemplare. Quelle: Pixabay.

Sicherlich erzielt das nächste ausgewählte Element daher eher ein echtes Ergebnis, wenn das vorherige Element ein negatives Ergebnis hatte. Dies bedeutet, dass die Wahrscheinlichkeit variiert, sofern Elemente der Probe extrahiert werden.

Die Hauptanwendungen der hypergeometrischen Verteilung sind: Qualitätskontrolle in Prozessen mit wenig Bevölkerung und Berechnung der Wahrscheinlichkeiten bei zufälligen Spielen.

Was die mathematische Funktion betrifft, die die hypergeometrische Verteilung definiert, besteht dies aus drei Parametern, dh:

- Bevölkerungselemente Anzahl (n)

- Probengröße (m) 

- Anzahl der Ereignisse in der gesamten Bevölkerung mit einem günstigen (oder ungünstigen) Ergebnis der untersuchten Merkmale (n).

[TOC]

Formeln und Gleichungen

Die hypergeometrische Verteilungsformel ergibt eine Wahrscheinlichkeit P worüber X Günstige Fälle eines bestimmten Merkmals treten auf. Die Art und Weise, es mathematisch zu schreiben, abhängig von kombinatorischen Zahlen ist:

Im vorherigen Ausdruck N, N Und M Sie sind Parameter und X die Variable selbst. 

-Gesamtbevölkerung ist N.

-Anzahl der positiven Ergebnisse eines bestimmten binären Merkmals in Bezug auf die Gesamtbevölkerung ist N.

-Anzahl der Elemente der Stichprobe ist M.

In diesem Fall, X Es ist eine zufällige Variable, die Wert nimmt X Und P (x) zeigt die Wahrscheinlichkeit des Auftretens von an X günstige Fälle der untersuchten Merkmale.

Wichtige statistische Variablen

Andere statistische Variablen für die hypergeometrische Verteilung sind:

- Halb μ = m*n/n

- Varianz σ^2 = m*(n/n)*(1-n/n)*(n-m)/(n-1)

- Typische Abweichung σ Welches ist die Quadratwurzel der Varianz.

Modell und Eigenschaften 

Um zum hypergeometrischen Verteilungsmodell zu gelangen, basiert es auf der Wahrscheinlichkeit, dass sie erhalten X Günstige Fälle in einer Größenprobe M. Diese Stichprobe enthält Elemente, die die untersuchte Eigenschaft erfüllen, und Elemente, die dies nicht tun.

Erinnern Sie sich daran, dass wir uns daran erinnern N repräsentiert die Anzahl der günstigen Fälle in der Gesamtbevölkerung von N Artikel. Dann würde die Wahrscheinlichkeit so berechnet:

Kann Ihnen dienen: Vektorraum: Basis und Dimension, Axiome, Eigenschaften

P (x) = (# der Möglichkeiten, X# auf fehlgeschlagene Arten zu erhalten)/(# Gesamtmethode der Auswahl)

Das Ausdruck des oben genannten in Form von kombinatorischen Zahlen wird das folgende Wahrscheinlichkeitsverteilungsmodell erreicht:

Haupteigenschaften der hypergeometrischen Verteilung

Sind die folgenden:

- Die Stichprobe muss immer klein sein, obwohl die Bevölkerung groß ist.

- Die Elemente der Stichprobe werden aus einem extrahiert, ohne sie wieder in die Bevölkerung einzubeziehen.

- Die zu untersuchende Eigenschaft ist binär, dh nur zwei Werte: 1 entweder 0, Ach ja WAHR entweder gefälscht.

In jedem Schritt -Extraktionsschritt ändert sich die Wahrscheinlichkeit abhängig von den vorherigen Ergebnissen.

Ansatz durch Binomialverteilung

Eine weitere Eigenschaft der hypergeometrischen Verteilung ist, dass sie durch Binomialverteilung angegangen werden kann, bezeichnet als als Bi, Solange die Bevölkerung N Seien Sie groß und mindestens 10 -mal höher als die Probe M. In diesem Fall wäre es so:

P (n, n, m; x) = bi (m, n/n, x)           

Solange n groß und n> 10m ist

Beispiele

Beispiel 1

Nehmen wir an, eine Maschine, die Schrauben und akkumulierte Daten erzeugt. In einer Schachtel mit n = 500 Schrauben wird die Anzahl der Defekte lautet:

N = 500 * 1/100 = 5

Wahrscheinlichkeiten durch hypergeometrische Verteilung

Nehmen wir an, dass wir aus dieser Schachtel (dh dieser Bevölkerung) eine Probe von M = 60 Schrauben nehmen.

Die Wahrscheinlichkeit, dass keine Schraube (x = 0) der Probenblätter defekt ist, beträgt 52,63%. Dieses Ergebnis wird bei Verwendung der hypergeometrischen Verteilungsfunktion erzielt:

P (500, 5, 60; 0) = 0,5263

Die Wahrscheinlichkeit, dass x = 3 Probenschrauben defekt sind, ist: P (500, 5, 60; 3) = 0,0129.

Andererseits ist die Wahrscheinlichkeit, dass x = 4 Schrauben der sechziger Jahre der Proben defekt sind: P (500, 5, 60; 4) = 0,0008.

Schließlich ist die Wahrscheinlichkeit, dass x = 5 Schrauben in dieser Probe mit Defekt herauskommen,: P (500, 5, 60; 5) = 0.

Wenn Sie jedoch die Wahrscheinlichkeit wissen möchten, dass in dieser Probe mehr als 3 defekte Schrauben vorhanden sind, muss die akkumulierte Wahrscheinlichkeit erhalten werden, was hinzugefügt werden muss:

P (3)+P (4)+P (5) = 0,0129+0,0008+0 = 0,0137.

Dieses Beispiel ist in Abbildung 2 dargestellt, die durch die Verwendung von erhalten wurden GeogeBra Große Nutzung kostenlose Software in Schulen, Instituten und Universitäten.

Figur 2. Beispiel für eine hypergeometrische Verteilung. Vorbereitet durch f. Zapata mit GeoGebra.

Beispiel 2

Ein spanisches Deckendeck hat 40 Karten, von denen 10 Gold und die restlichen 30 nicht haben. Angenommen, 7 Karten werden aus diesem Deck extrahiert, die nicht zum Deck zurückkehren.

Kann Ihnen dienen: Zentrale Symmetrie: Eigenschaften, Beispiele und Übungen

Wenn x die Anzahl der in den extrahierten 7 Karten vorhandenen Goldlagen ist, wird die Wahrscheinlichkeit, dass x Oros in einer Extraktion von 7 Karten besteht, durch die hypergeometrische Verteilung P (40,10,7; x) angegeben.

Schauen wir uns dies an: Um die Wahrscheinlichkeit zu berechnen, 4 Gold in einer Extraktion von 7 Karten zu haben, verwenden wir die hypergeometrische Verteilungsformel mit den folgenden Werten:

Und das Ergebnis ist: 4,57% Wahrscheinlichkeit.

Wenn Sie jedoch die Wahrscheinlichkeit wissen möchten, mehr als 4 Karten zu erhalten, müssen wir hinzufügen:

P (4)+P (5)+P (6)+P (7) = 5,20%

Gelöste Übungen

Die folgenden Übungen sollen die in diesem Artikel vorgestellten Konzepte veranschaulichen und assimilieren. Es ist wichtig, dass der Leser versucht, sie selbst zu lösen, bevor er die Lösung betrachtet.

Übung 1

Eine prophylaktische Fabrik hat festgestellt, dass 5 von 1000 von einer bestimmten Maschine erzeugte Kondome defekt sind. Um eine Qualitätskontrolle durchzuführen, werden 100 Kondome zufällig eingenommen und das Los wird abgelehnt, wenn mindestens ein oder mehrere defekte Defekte vorhanden sind. Antwort:

a) Welche Möglichkeit muss eine 100 -Los sein, die weggeworfen wird?

b) Ist dieses Qualitätskontrollkriterium effizient?

Lösung

In diesem Fall erscheinen sehr große kombinatorische Zahlen. Die Berechnung ist schwierig, es sei denn, ein angemessenes Computerpaket ist verfügbar.

Da es sich jedoch um eine große Bevölkerung handelt und die Stichprobe zehnmal geringer ist als die Gesamtbevölkerung, können Sie den Ansatz zur hypergeometrischen Verteilung aufgrund der Binomialverteilung verwenden:

P (1000,5,100; x) = bi (100, 5/1000, x) = bi (100, 0.005, x) = c (100, x)*0.005^x (1-0.005)^(100-x)

Im vorherigen Ausdruck C (100, x) Es ist eine kombinatorische Zahl. Dann wird die Wahrscheinlichkeit von Haya mehr als ein Defekt wie folgt berechnet:

P (x> = 1) = 1 - bi (0) = 1-.6058 = 0.3942

Es ist ein ausgezeichneter Ansatz im Vergleich zu dem Wert, der bei der Anwendung der hypergeometrischen Verteilung erhalten wurde: 0.4102

Es kann gesagt werden, dass eine Wahrscheinlichkeit von 40% viele 100 Prophylaktik verworfen werden sollte, was nicht sehr effizient ist.

Aber ein wenig weniger anspruchsvoll im Qualitätskontrollprozess und Verwerfen.

Übung 2

Eine Kunststoff -Taco -Maschine arbeitet so, dass von 10 Teilen eine deformiert ist. In einer 5 -Stück -Probe muss diese Möglichkeit ein Stück defekt sein.

Lösung

Bevölkerung: n = 10

Kann Ihnen dienen: pythagoräische Identitäten: Demonstration, Beispiel, Übungen

Nummer n defekt für jedes n: n = 1

Stichprobengröße: M = 5

P (10, 1, 5; 1) = C (1,1)*C (9,4)/C (10,5) = 1*126/252 = 0.5

Daher besteht eine Wahrscheinlichkeit von 50%, dass in einer Probe von 5 ein Taco deformiert wird.

Übung 3

In einem Treffen junger High Schools gibt es 7 Damen und 6 Herren. Unter den Mädchen studieren 4 Geisteswissenschaften und 3 Wissenschaften. In der Gruppe der Jungen untersucht 1 Geisteswissenschaften und 5 Wissenschaften. Berechnen Sie Folgendes:

a) zufällig ausgewählt drei Mädchen: Wie groß ist die Wahrscheinlichkeit, dass alle Geisteswissenschaften untersucht werden??.

b) Wenn drei Teilnehmer zufällig für das Treffen von Freunden ausgewählt werden: Was sind drei davon, unabhängig von Sex, studieren Sie die drei oder Geisteswissenschaften auch alle drei?.

c) Wählen Sie nun zwei zufällige Freunde aus und rufen Sie an X zur zufälligen Variablen "Anzahl derjenigen, die Geisteswissenschaften studieren". Bestimmen Sie unter den beiden ausgewählten den Durchschnitt oder den erwarteten Wert von X und die Varianz σ^2.

Lösung für 

Die Bevölkerung ist die Gesamtzahl der Mädchen: n = 7. Diejenigen, die Geisteswissenschaften untersuchen. Die Zufallsstichprobe von Mädchen wird m = 3 sein.

In diesem Fall wird die Wahrscheinlichkeit, dass die drei Geisteswissenschaften sind, durch die hypergeometrische Funktion gegeben:

P (n = 7, n = 4, m = 3, x = 3) = c (4, 3) c (3, 0) / c (7, 3) = 0.1143

Dann gibt es 11.4% Wahrscheinlichkeit, dass drei zufällige Chicas Geisteswissenschaften untersuchen.

Lösung b

Die zu verwendenden Werte sind:

-Bevölkerung: n = 14

-Menge, die Buchstaben untersucht, lautet: n = 6 und die

-Stichprobengröße: M = 3.

-Anzahl der Freunde, die Geisteswissenschaften studieren: x

Aus diesem Grund bedeutet x = 3, dass die drei Geisteswissenschaften, aber x = 0, dass keine Geisteswissenschaften untersucht. Die Wahrscheinlichkeit, dass die drei genauso untersucht werden, wird durch die Summe angegeben:

P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0.0560 + 0.1539 = 0.2099

Anschließend haben wir eine Wahrscheinlichkeit von 21%, dass drei Besprechungsteilnehmer, die nach dem Zufallsprinzip ausgewählt wurden, dasselbe studieren.

Lösung c

Hier haben wir die folgenden Werte:

N = 14 Gesamtbevölkerung von Freunden, n = 6 Gesamtzahl der Bevölkerung, die Geisteswissenschaften untersucht, die Größe der Stichprobe beträgt M = 2.

Hoffnung ist:

E (x) = m * (n/n) = 2 * (6/14) = 0.8572

Und die Varianz:

σ (x)^2 =  m*(n/n)*(1-n/n)*(n-m)/(n-1) = 2*(6/14)*(1-6/14)*(14-2)/(14) -1) =

= 2*(6/14)*(1-6/14)*(14-2)/(14-1) = 2*(3/7)*(1-3/7)*(12) (13)  = 0.4521

Verweise

  1. Diskrete Wahrscheinlichkeitsverteilungen. Erholt von: Biplot.USAL.Ist
  2. Statistik und Wahrscheinlichkeit. Hypergeometrische Verteilung. Abgerufen von: Projectodescartes.Org
  3. CDPYE-UGR. Hypergeometrische Verteilung. Geborgen von: Ugr.Ist
  4. GeogeBra. Klassische Geogebra, Wahrscheinlichkeitsberechnung. Von GeogeBra geborgen.Org
  5. Einfacher Nachlass. Löste hypergeometrische Verteilungsübungen gelöst. Erholt von: probafacil.com
  6. Minitab. Hypergeometrische Verteilung. Abgerufen von: Unterstützung.Minitab.com
  7. Universität von Vigo. Hauptdiskrete Verteilungen. Erholt von: Anapg.Websites.Uvigo.Ist
  8. Vitutor. Statistik und kombinatorisch. Abgerufen von: Vitutor.Netz
  9. Weisstein, Eric W. Hypergeometrische Verteilung. Erholt von: Mathworld.Wolfram.com
  10. Wikipedia. Hypergeometrische Verteilung. Geborgen von: ist.Wikipedia.com