Kategoriale variable Eigenschaften und Beispiele

Kategoriale variable Eigenschaften und Beispiele

Der Kategoriale Variable Es ist das in Statistiken verwendete, um einem Objekt, einer Person, einem Unternehmen, einer Bedingung oder einem Verfahren ein nicht numerisches oder qualitatives Merkmal oder eine Eigenschaft zuzuweisen. Es ist möglich, alle Arten von kategorialen Variablen gemäß jedem Bedarf zu definieren. 

Beispiele für kategoriale Variablen sind: Farbe, Geschlecht, Blutgruppe, Familienstand, Materialtyp, Zahlungsformular oder Art des Bankkontos und werden täglich häufig verwendet.

Abbildung 1: Farbe ist eine kategoriale Variable. Quelle: Pixabay

Die oben genannten sind die Variablen, aber ihre möglichen Werte sind qualitativ, dh Qualität oder Merkmal und nicht von numerischer Messung. Zum Beispiel die möglichen Werte für die Variable Sex Sind: männlich , HEmbra.

Wenn diese Variable in einem Computerprogramm gespeichert wird, kann sie als Textvariable deklariert werden und die einzigen akzeptierten Werte werden ernannt: Männlich , Weiblich.

Allerdings die gleiche Variable Sex kann als Ganzzahl deklariert und gespeichert werden, wenn Männlich wird zugewiesen 1 bereits Weiblich Der Wert wird zugewiesen 2. Aus diesem Grund werden kategoriale Variablen manchmal als aufgeführter Typ bezeichnet.

Das Hauptmerkmal kategorischer Variablen ist, dass es im Gegensatz zu anderen Variablen wie kontinuierlich und diskret nicht möglich ist, mit ihnen Arithmetik zu machen. Statistiken können jedoch mit ihnen durchgeführt werden, wie später zu sehen ist.

[TOC]

Beispiele

Beachten Sie die folgenden Beispiele für kategoriale Variablen und ihre möglichen Werte:

-Blutgruppe, Wertebereich: A, b, ab oder

-Zivilstand, Kategoriale Werte: Einzel (ZU), Verheiratet (B), Witwer (C) , Geschieden (D).

-Art des Materials, Kategorien oder Werte: 1 = Holz, 2 = Metall, 3 = Kunststoff

-Weg zu zahlen, Werte oder Kategorien: (1) Bargeld, (2) Belastung, (3) Übertragung, (4) Gutschrift

Kann Ihnen dienen: Tesla Coil: Geschichte, wie es funktioniert, wofür ist es

In den vorherigen Beispielen wurde jeder Kategorie auf eine vollständig willkürliche Weise eine Zahl assoziiert. 

Es könnte dann angenommen werden, dass diese willkürliche numerische Assoziation es einem gleichwertig macht Diskrete quantitative Variable, Aber nicht da arithmetische Operationen mit diesen Zahlen nicht durchgeführt werden können.

Um die Idee in der Variablen zu veranschaulichen Weg zu zahlen, Die Summenoperation macht keinen Sinn:

 (1) wirksam + (2) Lastschrift wird niemals gleichbedeutend mit sein (3) Übertragung

Klassifizierung kategorischer Variablen

Die Klassifizierung basiert darauf, ob sie eine implizite Hierarchie haben oder ob die Anzahl der möglichen Ergebnisse mehr als zwei oder zwei beträgt.

Eine kategoriale Variable mit einem einzigen möglichen Ergebnis ist keine Variable, sondern eine kategoriale Konstante.

Nominalkategorische 

Wenn sie nicht durch eine Nummer dargestellt werden können oder eine Bestellung haben. Zum Beispiel die Variable: Type_de_material, tNennwerte (Holz, Metall, Kunststoff), sie haben keine Hierarchie oder Reihenfolge, selbst wenn jeder Antwort oder Kategorie eine willkürliche Nummer zugewiesen wird.

Ordinale kategoriale

Variable: Akademischeleistung

Nennwerte: Hoch Mittel Niedrig

Obwohl die Werte dieser Variablen nicht numerisch sind, haben sie eine Ordnung oder Hierarchie implizit.

Binärkategorische

Dies sind nominale Variablen mit zwei möglichen Antworten, zum Beispiel:

-Variable: Antworten

-Nennwerte: WAHR, Gefälscht

Beachten Sie, dass die Variable Antworten Es bedeutet keine Hierarchie und hat nur zwei mögliche Ergebnisse, daher ist es eine binäre kategoriale Variable.

Einige Autoren nennen diesen Typ binäre Variable, Und sie betrachten es nicht zur Zugehörigkeit zur kategorische Variablen die auf diejenigen mit mehr als drei möglichen Kategorien beschränkt sind.

Statistiken mit kategorialen Variablen

Statistiken können mit kategorialen Variablen hergestellt werden, obwohl keine numerischen oder quantitativen Variablen sind. Zum Beispiel, um den wahrscheinlichsten Trend oder Wert einer kategorialen Variablen zu kennen, wird er genommen Mode.

Es kann Ihnen dienen: Astroclymics: Geschichte, welche Studien, Zweige

Mode In diesem Fall ist das wiederholte Ergebnis oder Wert einer kategorialen Variablen. In kategorialen Variablen ist es nicht möglich, weder den Durchschnitt noch den Median zu berechnen.

Der Durchschnitt kann nicht berechnet werden, da er nicht mit kategorialen Variablen arithmetisch gemacht werden kann. Weder der Median, weil die quantitativen oder kategorialen Variablen keine Ordnung oder Hierarchie haben. Daher ist es nicht möglich, einen zentralen Wert zu bestimmen.

Grafische Darstellung kategorischer Variablen

Bei einer bestimmten kategorialen Variablen können Sie die Frequenz oder Häufigkeit finden, mit der ein Ergebnis dieser Variablen wiederholt wird. Wenn dies für jedes Ergebnis erfolgt, kann abhängig von jeder Kategorie oder jedem Ergebnis ein Frequenzdiagramm erstellt werden.

Hier sind einige Beispiele dafür, wie kategoriale Variablen grafisch dargestellt werden können.

Gelöste Übungen

Übung 1

Ein Unternehmen hat Daten von 170 Mitarbeitern. Eine der Variablen, die in diesen Aufzeichnungen enthalten sind, ist: Zivilstand. Diese Variable hat vier mögliche Kategorien oder Werte:

Einzel (ZU), Verheiratet (B), Witwer (C) , Geschieden (D).

Obwohl es sich um eine Nicht-Nummer-Variable handelt, ist es möglich zu wissen, wie viele der Gesamtdatensätze in einer bestimmten Kategorie enthalten sind und in Form eines Balkendiagramms dargestellt werden, wie in der folgenden Abbildung gezeigt:

Figur 2. Darstellung der Ergebnisse einer kategorialen Variablen. Quelle: Selbst gemacht

Beispiel 2

Ein Schuhgeschäft trägt einen Rekord seines Umsatzes. Unter den Variablen, die mit ihren Datensätzen umgehen, befindet sich die Schuhfarbe für jedes Modell. Die Variable: 

Color_zapato_modelo_aw3

Es ist kategorisch und verfügt über fünf mögliche Kategorien oder Werte. Für jede Kategorie dieser Variablen ist die Anzahl der Umsätze insgesamt und der Prozentsatz desselben wird festgelegt. Die Ergebnisse sind in der Grafik der folgenden Abbildung dargestellt:

Kann Ihnen dienen: Elektrische Eigenschaften von Materialien Figur 3. Kategoriale variable Farbe _ Zapato. In dieser variablen Weise ist weiß. Quelle: Selbst gemacht.

Es kann dann gesagt werden, dass aus dem AW3 -Schuhmodell, das von ist Mode, Das am häufigsten verkaufte ist die Weiss, genau gefolgt von der Schwarz

Es kann auch gesagt werden, dass 70% Wahrscheinlichkeit der nächste Schuh, der dieses Modell verkauft wird Weiss entweder Schwarz.

Diese Informationen können für den Laden nützlich sein, wenn Sie neue Bestellungen abgeben, oder können sogar Rabatte auf die am wenigsten verkauften Farben für überschüssige Inventar anwenden.

Beispiel 3

Für eine bestimmte Bevölkerung von Blutspendern möchten wir die Anzahl der Personen darstellen, die einer bestimmten Blutgruppe gehören. Eine grafische Möglichkeit, die Ergebnisse zu visualisieren.

In der ersten Spalte wird die Variable dargestellt Blutgruppe und seine möglichen Ergebnisse oder Kategorien. Die zweite Spalte hat die Darstellung in einer ikonischen oder bildlichen Art der Anzahl der Personen in jeder Kategorie. In unserem Beispiel wird ein rotes Tröpfchen als Symbol verwendet, von denen jede 10 Personen darstellt.

Figur 4. Piktogramm. Quelle: Selbst gemacht

Verweise

  1. Khan Akademie. Analyse kategorischer Daten. Erholt von: Khanacademy.Org
  2. Universumformeln. Qualitative Variable. Abgerufen von: Univesformulas.com
  3. Minitab. Die kategorialen, diskreten und kontinuierlichen Variablen sind. Erholt von: Unterstützung.Minitab.com
  4. Excel Tutorial. Charakterisierung von Variablen. Erholt von: Hilfe.Xlslat.com.
  5. Wikipedia. Statistische Variable. Von Wikipedia geborgen.com
  6. Wikipedia. Kategoriale Variable. Von Wikipedia geborgen.com
  7. Wikipedia. Variable kategorisch. Von Wikipedia geborgen.com