Daten keine gruppierten Beispiele und Übung gelöst

Daten keine gruppierten Beispiele und Übung gelöst

Der Nicht gruppierte Daten Sie sind diejenigen, die, die aus einer Studie erhalten wurden, noch nicht nach Klassen organisiert sind. Wenn es sich um eine überschaubare Anzahl von Daten handelt, normalerweise 20 oder weniger, und es nur wenige verschiedene Daten gibt, können sie als nicht gruppiert behandelt werden und wertvolle Informationen von ihnen extrahieren.

Die nicht gruppierten Daten stammen wie aus der Umfrage oder der Studie, um sie zu erhalten, und daher fehlen daher die Verarbeitung. Schauen wir uns einige Beispiele an:

Abbildung 1. Nicht gruppierte Daten stammen direkt aus einer Studie und wurden nicht klassifiziert. Quelle: pxhere.

-Ergebnisse einer CI -Prüfung einer intellektuellen Koeffizienten bei 20 zufälligen Studenten einer Universität. Die erhaltenen Daten waren folgende:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112,106

-Alter von 20 Mitarbeitern einer sehr beliebten Cafeteria:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 19, 22, 27, 29, 23, 20

-Die durchschnittlichen endgültigen Notizen von 10 Schülern einer Mathematikklasse:

3.2; 3.1; 2,4; 4.0; 3,5; 3.0; 3,5; 3,8; 4.2; 4.9

[TOC]

Dateneigenschaften

Es gibt drei wichtige Eigenschaften, die eine Reihe statistischer Daten charakterisieren, die gruppiert sind oder nicht, nämlich:

-Position, Dies ist die Tendenz der Daten, die sich um bestimmte Werte gruppieren,.

-Dispersion, Ein Hinweis darauf, wie verteilt oder verteilt die Daten um einen bestimmten Wert sind.

-Form, Es bezieht sich auf die Art und Weise, in der die Daten verteilt sind, was zu sehen ist, wenn ein Diagramm von ihnen konstruiert wird. Es gibt sehr symmetrische und auch voreingenommene Kurven, entweder links oder rechts von einem bestimmten zentralen Wert.

Für jede dieser Eigenschaften gibt es eine Reihe von Maßnahmen, die sie beschreiben. Einmal erhalten sie uns ein Panorama des Datenverhaltens:

-Die am häufigsten verwendeten Positionsmaßnahmen sind arithmetischer Mittelwert oder einfach mittel, median und modisch.

-In der Dispersion werden häufig der Bereich, die Varianz und die Standardabweichung verwendet, aber sie sind nicht die einzigen Dispersionsmaßnahmen.

Kann Ihnen dienen: Homotecia

-Und um die Form zu bestimmen, werden der Durchschnitt und der Median durch Verzerrungen verglichen, wie es in Kürze zu sehen ist.

Berechnung von Durchschnitt, Median und Mode

-Das arithmetische Mittel, Auch als Durchschnitt bezeichnet und als X bezeichnet, wird es wie folgt berechnet:

X = (x1 + X2 + X3 +... XN) / N

Wo x1, X2,.. . XN, sind die Daten und n ist die insgesamt von ihnen. Insgesamt gibt es:

Hier repräsentiert der Index I Daten 1, Daten 2, Daten 3 und so weiter, bis er den einzigen erreicht, was der letzte ist.

-Der Median Es ist der Wert, der in der Mitte einer ordnungsgemäßen Folge von Daten erscheint. Um ihn zu erhalten, ist es erforderlich, die Daten zuerst zu bestellen.

Wenn die Anzahl der Beobachtungen ungerade ist, gibt es kein Problem, den Mittelpunkt des Satzes zu finden. Wenn wir jedoch ein Datenpaar haben, werden die beiden zentralen Daten gesucht und gemittelt.

-Mode Es ist der am häufigsten beobachtete Wert im Datensatz. Es existiert nicht immer, da es möglich ist, dass kein Wert häufiger als ein anderer wiederholt wird. Es könnte auch zwei Daten mit gleicher Häufigkeit geben. In diesem Fall wird eine bi-modale Verteilung gesprochen.

Im Gegensatz zu den beiden vorherigen Maßnahmen kann die Mode mit qualitativen Daten verwendet werden.

Mal sehen, wie diese Positionsmaßnahmen mit einem Beispiel berechnet werden:

Gelöstes Beispiel

Angenommen, Sie möchten den arithmetischen Durchschnitt, den Median und die Mode in dem zu Beginn vorgeschlagenen Beispiel bestimmen: das Alter von 20 Mitarbeitern einer Cafeteria:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 19, 22, 27, 29, 23, 20

Der Hälfte Es wird einfach berechnet, indem alle Werte hinzugefügt und durch n = 20 geteilt werden, was die Gesamtzahl der Daten ist. Hier entlang:

Kann Ihnen dienen: Verhältnismäßigkeitsbeziehungen: Konzept, Beispiele und Übungen

X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =

= 22.3 Jahre.

Um das zu finden Median Es ist erforderlich, zuerst den Datensatz zu bestellen:

18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29

Wie einige Daten sind die beiden zentralen Daten, die fett hervorgehoben werden, genommen und gemittelt. Da beide 22 sind, beträgt der Median 22 Jahre.

Endlich, das Mode Es ist die Tatsache, die am meisten wiederholt wird oder deren Frequenz größer ist und diese 22 Jahre sind.

Bereich, Varianz, Standardabweichung und Verzerrung

Der Bereich ist einfach der Unterschied zwischen dem Hauptfach und dem geringsten Daten und ermöglicht deren Variabilität schnell zu schätzen. Abgesehen davon gibt es andere Dispersionsmaßnahmen, die weitere Informationen zur Datenverteilung enthalten.

Varianz und Standardabweichung

Die Varianz wird als S bezeichnet und durch Ausdruck berechnet:

Es wird oft mit der Quasiranz anstelle der Varianz bearbeitet, die auf die gleiche Weise berechnet wird, nur durch N-1 geteilt, anstatt zwischen n:

Da die Varianz die Summe der Quadrate ist, führt das Quadrat der Probeneinheit. Zum Beispiel würde in der Untersuchung des Alters der Mitarbeiter in der Cafeteria die Varianz in Jahren erfolgen2.

Um die Ergebnisse zu Recht zu interpretieren, wird die Standardabweichung wie die Quadratwurzel der Varianz oder auch die Standard-Quasi-Deviation definiert, die die Quadratwurzel der Quasizaranz ist:

Voreingenommenheit

Es ist der Vergleich zwischen dem Durchschnitt x und dem Median Median:

-Ja Med = Media X: Die Daten sind symmetrisch.

-Wenn x> med: nach rechts voreingenommen.

-Und wenn x < Med: los datos sesgan hacia la izquierda.

Übung gelöst

Finden Sie durchschnittlich, Median, Mode, Rang, Varianz, Standardabweichung und Verzerrung für die Ergebnisse einer Prüfung von 20 Studenten einer Universität:

Kann Ihnen dienen: mathematische Funktionen

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106

Lösung

Wir werden die Daten bestellen, da es notwendig sein wird, den Median zu finden.

106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124

Und wir werden sie wie folgt in eine Tabelle setzen, um die Berechnungen zu erleichtern. Die zweite Spalte mit dem Titel "akkumuliert" ist die Summe der entsprechenden Daten plus die vorherigen.

Diese Spalte findet leicht den Durchschnitt und dividiert die zuletzt akkumulierte zwischen der Gesamtzahl der Daten, wie am Ende der Spalte „akkumuliert“ zu sehen ist:

X = 112.9

Der Median ist der Durchschnitt der in Rot hervorgehobenen zentralen Daten: Nummer 10 und Nummer 11. Wie gleich ist der Median 112.

Schließlich ist Mode der Wert, der am meisten wiederholt und 112 ist, mit 7 Wiederholungen.

Bei Dispersionsmaßnahmen beträgt der Bereich:

124-106 = 18.

Die Varianz wird erhalten, indem das Endergebnis der rechten Spalte zwischen n: Division geteilt wird:

S = 668.6/20 = 33.42

In diesem Fall ist die Standardabweichung die Quadratwurzel der Varianz: √33.42 = 5.8.

Andererseits sind die Werte der Quasiivarlichkeit und der Quasi -Standardabweichung:

SC= 668.6/19 = 35.2

Standard-Quasi-Deviation = √35.2 = 5.9

Schließlich ist die Verzerrung leicht rechts, da durchschnittlich 112.9 ist größer als der Median 112.

Verweise

  1. Berenson, m. 1985. Statistiken für Verwaltung und Wirtschaftswissenschaften. Inter -American s.ZU.
  2. Canavos, g. 1988. Wahrscheinlichkeit und Statistik: Anwendungen und Methoden. McGraw Hill.
  3. Devore, j. 2012. Wahrscheinlichkeit und Statistik für Ingenieurwesen und Wissenschaft. 8. Auflage. Cengage.
  4. Levin, r. 1988. Statistiken für Administratoren. 2. Auflage. Prentice Hall.
  5. Walpole, r. 2007. Wahrscheinlichkeit und Statistik für Ingenieurwesen und Wissenschaft. Pearson.