Statistische Analyse: Datentypen

Siehe auch: Korrelationen verstehen

Unsere Seite auf Beobachtungsforschung und Sekundärdaten beschrieben zwei Hauptdatenquellen (Ihre eigene Forschung und Daten, die zuvor veröffentlicht wurden). Es gibt jedoch auch viele verschiedene Datentypen - und Daten können auf verschiedene Arten klassifiziert werden. Die Art der Daten wirkt sich darauf aus, wie Sie sie verwenden können und welche statistischen Analysen möglich sind. Dies wirkt sich auch auf Schlussfolgerungen und Schlussfolgerungen aus, die Sie ziehen können.

Die Wahl des Datentyps ist daher sehr wichtig. Diese Seite beschreibt einige der Unterschiede in den Datentypen und die Auswirkungen auf Forschungsmethoden und -ergebnisse.

Quantitative vs. qualitative Daten

Die erste und offensichtlichste Unterscheidung besteht zwischen quantitativen und qualitativen Daten:



  • Quantitative Daten sind numerisch: Sie können gesammelt und als Zahlen dargestellt werden; und

  • Qualitative Daten sind nicht numerisch.

Unsere Seite auf qualitative und quantitative Forschung erklärt diese Unterscheidung ausführlicher und erläutert die Vor- und Nachteile beider.

Objektive vs. subjektive Daten

Daten können auch unterteilt werden in Objektiv und subjektiv.

  • Objektive Daten sind beobachtbar und messbar . Dazu gehören Dinge wie Größe, Gewicht oder Anzahl der Elemente. Sie werden normalerweise durch Beobachtungen oder direkte Messungen gesammelt.

  • Subjektive Daten werden aus persönlichen Mitteilungen von Einzelpersonen gesammelt . Dies kann gesprochen oder geschrieben werden, kann aber auch andere Formen annehmen. Zum Beispiel kann die Körpersprache subjektive Informationen liefern („ Sie lag still, mit geschlossenen Augen und festem Mund [objektiv], als hätte sie Schmerzen [subjektiv] ”).

Sowohl objektive als auch subjektive Daten können sowohl qualitativ als auch quantitativ sein. Sie können beispielsweise eine Farbänderung (qualitativ) beobachten (objektiv) und Personen auffordern, ihre Meinung zu einem Thema (subjektiv) anhand einer numerischen Skala (quantitativ) zu äußern.

wie schreibt man ein tagebuch

Beide Typen haben Vor- und Nachteile. Zum Beispiel können subjektive Daten ein viel breiteres Informationsspektrum liefern, da viele Dinge einfach nicht messbar sind. Dazu gehören Variablen wie das Schmerzniveau, bei denen jeder seine eigene Interpretation hat. Selbst die Verwendung einer Skala von 1 bis 10, die die Daten quantitativ macht, bedeutet nicht, dass sie zwischen Einzelpersonen direkt vergleichbar sind.

Subjektive Daten hängen jedoch auch davon ab, dass sich Menschen an Dinge erinnern und sie genau bewerten. Subjektive Daten sind daher wahrscheinlich unzuverlässiger, wenn sich Menschen an Ereignisse von vor langer Zeit erinnern müssen.

Wenn möglich, werden daher objektive Daten bevorzugt, aber es besteht allgemeines Verständnis, dass manchmal nur subjektive Daten verfügbar sind.



Längs- und Querschnittsdaten

Die Unterscheidung zwischen Längs- und Querschnittsdaten ist eigentlich eher eine Unterscheidung in Studiendesign als Datentyp.

  • Langzeitstudien arbeite im Laufe der Zeit mit derselben Gruppe. Sie können daher Veränderungen im Laufe der Zeit zeigen und die Ursache identifizieren.

  • Querschnittsstudien kann Daten zu verschiedenen Zeitpunkten, aber von verschiedenen Gruppen sammeln. Sie können daher immer nur einen Schnappschuss oder eine Reihe von Schnappschüssen rechtzeitig anzeigen.

Der entscheidende Unterschied zwischen den beiden Arten von Studien und damit den Daten besteht darin, dass Längsschnittdaten eine Kausalität nachweisen können.

Es wird im Allgemeinen als unmöglich angesehen, die Ursache anhand von Querschnittsdaten nachzuweisen, da Sie nur Informationen über einen bestimmten Zeitpunkt haben. Es ist daher nicht möglich, etwas zu ändern und zu sehen, welche Wirkung es hat (dh wenn es eine gibt Kausalzusammenhang ).

Querschnittsstudien sind jedoch viel bequemer. Sie müssen nur eine einzige Umfrage oder Recherche durchführen, anstatt einer Kohorte im Laufe der Zeit zu folgen. Längsschnittstudien können Daten von sehr hoher Qualität liefern und Ursachen aufzeigen, leiden jedoch unter Problemen wie dem Abbruch der Kohorte. Es ist auch schwierig, Mittel für langfristige, qualitativ hochwertige Längsschnittstudien zu erhalten.

Beispiel: Kombination von Querschnitts- und Längsschnittforschung


Das Surrey Kommunikation und Sprache im Bildungsstudium (SCALES ) ist ein gutes Beispiel für eine Langzeitlängsstudie, die auch einige Querschnittselemente umfasste.

Das erste Element der Studie war eine groß angelegte Befragung von Kindern im Empfangsjahr an 180 Grundschulen in Surrey. Alle Kinder in der Bevölkerung wurden beim Schuleintritt anhand einer Umfrage, die von Klassenlehrern für jedes Kind durchgeführt wurde, auf Sprachkenntnisse untersucht. Sie wurden nach Verhalten, Sprache und sozialen Fähigkeiten gefragt. Dies gab einen Überblick über die Sprachfähigkeiten beim Schuleintritt und ermöglichte es den Forschern, zu beurteilen, ob der Lehrplan den Fähigkeiten entsprach, und festzustellen, dass jüngere Kinder mit größerer Wahrscheinlichkeit Sprachprobleme hatten.

In der nächsten Stufe wurde eine Stichprobe von 590 Kindern aus den untersuchten ausgewählt, die anhand der Ergebnisse der ersten Stufe geschichtet wurden, um eine Reihe von Sprachfähigkeiten zu vermitteln. Sie wurden von einem Forscher im ersten und erneut im dritten Jahr gesehen und ihre Sprachkenntnisse wurden bewertet. Die Eltern wurden außerdem gebeten, an beiden Stellen Informationen über Sprache und Verhalten bereitzustellen.

Die nächste Phase folgte der ursprünglichen SCALES-Kohorte in den Jahren 6 und 8, um ihre sozialen, emotionalen und psychischen Gesundheitsergebnisse zu bewerten.

Die Forscher interessierten sich für den Zusammenhang zwischen der Sprachentwicklung in der frühen Kindheit und der sozialen und emotionalen Entwicklung im Jugendalter. Diese Art von Informationen kann einfach nicht aus einer Querschnittsstudie oder aus zwei getrennten Studien in verschiedenen Altersstufen gewonnen werden. Sie könnten Teilnehmer und Eltern bitten, zurück zu denken, aber die Zeitlücke ist so groß, dass es unwahrscheinlich ist, dass die Erinnerung zuverlässig ist.

Kategoriale, kontinuierliche, diskrete und bewertete Daten

Eine weitere Unterscheidung sind kategoriale, kontinuierliche, diskrete oder eingestufte Daten:

  • Kategoriale Daten werden in verschiedene Gruppen oder Kategorien unterteilt .

    Dazu gehört beispielsweise das Geschlecht, ob Sie Eis mögen und ob Sie jemals ein bestimmtes Land besucht haben. Sie können auch das Alter einschließen, wenn es in zehn- oder fünfjährige Abschnitte unterteilt ist.

  • Kontinuierliche Daten werden als solche definiert, die eine unendliche Anzahl von Werten zwischen zwei beliebigen Werten annehmen können.

    Das klingt kompliziert, ist aber eigentlich einfach. Hierbei handelt es sich um Daten wie Gewicht oder Größe, bei denen es sich um einen beliebigen Wert im Bereich möglicher Gewichte und Höhen handeln kann, nicht um feste Werte oder um einen Prozentsatz einer Klasse, die Eis mag (ein beliebiger Wert im Bereich von 0 bis 100%). Jeder Datenpunkt ist eine eindeutige und separate Nummer und fällt nicht in eine Gruppe. Das Alter wird beispielsweise berücksichtigt, wenn Sie es sehr genau in Tagen oder Bruchteilen eines Jahres und nicht in ganzen Jahren messen.

  • Diskrete Daten werden als solche definiert, die eine definierte Anzahl möglicher Werte zwischen zwei beliebigen Werten aufweisen

    Zu den diskreten Daten gehört daher die Anzahl der Kundenbeschwerden oder die Anzahl der Personen, die Eis mögen, d. H. Sie können keine halbe Beschwerde oder ein Drittel einer Person haben. Ein anderes Beispiel wäre das Alter in ganzen Jahren. Für die Analyse werden diskrete Daten als sehr ähnlich zu kontinuierlichen Daten angesehen.

  • Rangdaten wurden sortiert und sortiert und dann nach ihrer Rangfolge nummeriert

    Wenn Sie beispielsweise vier Datenbits mit den Werten 4, 6, 3 und 7 hätten, könnten Sie diese in aufsteigender Reihenfolge als 3, 4, 6 und 7 einstufen. Sie würden dann ihre Rangfolge annehmen, also 3 1 (1.), 4 wäre 2 (2.) und so weiter. Daten werden im Allgemeinen eingestuft, wenn Sie nur die Reihenfolge und nicht die absoluten Werte interessieren. Dies ist normalerweise der Fall, wenn sich zwei Variablen zusammen ändern, aber keine geradlinige Beziehung haben (dh sie ändern sich mit unterschiedlichen Raten). Das folgende Diagramm zeigt beispielsweise diese Art von Beziehung (in diesem Fall exponentiell).

    Grafik mit exponentieller Beziehung zwischen zwei Variablen.

    Warnung!


    Es ist wichtig, sich daran zu erinnern, dass Sie beim Ranking von Daten Informationen verlieren.

    Dies sollte daher nur dann erfolgen, wenn Sie es wirklich tun müssen.


Diese vier Datentypen eignen sich für verschiedene Analysetypen. Sie müssen jeweils unterschiedliche statistische Tests und Analyseformen verwenden.

was ist eine nonverbale kommunikation
Weitere Informationen zur Verwendung verschiedener Datentypen für die Analyse finden Sie auf unserer Seite unter Korrelationen .

Fazit

Es gibt viele verschiedene Arten von Daten, die Sie im Rahmen Ihrer Forschung sammeln können. Die Wahl des Datentyps hängt in der Regel von Ihren Forschungsmethoden ab, die wiederum von Ihrer Forschungsfrage und Ihrem allgemeinen Forschungsansatz abhängen. Die Wahl des Datentyps hat jedoch auch Auswirkungen auf die Art der Analyse und die Schlussfolgerungen, die Sie ziehen können.


Weiter:
Korrelationen verstehen
Einfache statistische Analyse