Statistik

Merkmal

Merkmale sind jene Eigenschaften, die in einer Erhebung untersucht werden.
Bei einer Befragung entspricht ein Merkmal einer gestellten Frage.
Man unterscheidet zwischen qualitativen und quantitativen Merkmalen.
Nicht zu verwechseln ist das Merkmal mit den

Merkmalsauspr�gung

Merkmale k�nnen verschiedene Werte annehmen, die Merkmalsauspr�gungen genannt werden.
Bei Befragungen sind die Merkmalsauspr�gungen die Antwortm�glichkeiten, die der Befragte angeben kann.
Merkmal: Geschlecht
Merkmalsauspr�gung: weiblich, m�nnlich

Merkmalstr�ger

Als statistische Einheiten (bzw. Merkmalstr�ger) kommen ganz unterschiedliche Objekte in Frage, zum Beispiel Personen, L�nder, Religionsgruppen, Autotypen, T�tensuppen usw.
Die Eigenschaften, die in Hinblick auf die Merkmalstr�ger untersucht werden, nennt

Variable

Die Bezeichnungen Merkmal und Variable werden synonym verwendet, wobei im statistischen Kontext der Begriff der Variablen bevorzugt wird.
Die Bezeichnung Variable leitet sich aus der Tatsache ab, da� sich die Auspr�gungen eines Merkmals von Untersuchungse

Grundgesamtheit

Die Anzahl der statistischen Einheiten ( Merkmalstr�ger) zu denen eine Aussage getroffen werden soll.
�Alle Niedersachsen ab 18 Jahren".
Da f�r eine Befragung nicht alle Niedersachsen befragt werden k�nnen, wird in der Regel eine Stichprobe ausgew�hlt (Te

Stichprobe

steht stellvertretend f�r die Grundgesamtheit
Auswahl einer hochwertigen Stichprobe:
Zufallsauswahl -> die Wahrscheinlichkeit ist bei allen gleich
Die Auswahl der n Personen aus der Population erfolgt zuf�llig und kann somit als ein Zufallsexperiment betr

Stichprobenumfang
n

Anzahl der zuf�llig ausgesuchten Repr�sentanten unserer GG

arithmetisches Mittel
x-

Sch�tzer f�r den wahren Mittelwert der GG ?

Median (Zentralwert)
Z = Q50 = x~

der Wert, der in der Mitte liegt
teilt geordnete Reihe !!! der Messwerte in die oberen und unteren 50 Prozent.

Modus/Modalwert
D
(Dichtemittel)

Der am h�ufigsten vorkommende Wert einer Verteilung
-> also den Wert mit der gr��ten Wahrscheinlichkeit.
Da eine Verteilung, wenn man sie graphisch darstellt, mehrere H�hepunkte oder Gipfel haben kann, k�nnen einer Verteilung auch mehrere Modi (bimodal, m

Dichtefunktion
(auch Wahrscheinlichkeitsfunktion)
?

beschreibt, mit welcher Wahrscheinlichkeit eine Zufallsvariable eine bestimmte Merkmalsauspr�gung annimmt.
(monovariable Daten)
Die Fl�che unter der Kurve ist die Wahrscheinlichkeit
(die ganze Fl�che = 1)

Streuung

Streuung ist die Verteilung von einzelnen Werten um den Mittelwert.
Die Werte 10, 20 und 30 sowie die Werte 19, 20 und 21 haben zwar den gleichen Mittelwert 20,
sind aber unterschiedlich um ihn herum verteilt.

Varianz
Sx^2

Wie weit streuen die Messwerte um den Mittelwert x-
(quadriert)
Symbol der Varianz f�r eine Zufallsvariable ist �?�

Standardabweichung
Sx
?

Wie weit streuen die Messwerte um den Mittelwert x-
(dieselbe Einheit wie die Messwerte)
Standardabweichung die durchschnittliche Entfernung aller gemessenen Auspr�gungen eines Merkmals vom Durchschnitt.

Standardfehler des Mittelwerts
Sx-

Wie genau sch�tzen wir mit dem x- den wahren Mittelwert der GG ?

Quantile

Wenn die Verteilung in n gleich gro�e Teile unterteilt wird

Quartile

Form der Quantile. (n=4)
Unterteilt man eine Verteilung in vier gleich gro�e Abschnitte, spricht man von vier Quartilen.

Konfidenzintervall

Liegt das Konfidenzniveau bei 95 Prozent, hei�t dies �bersetzt, dass ein statistischer berechneter Wert auf Grundlage einer Stichprobenerhebung mit 95-prozentiger Wahrscheinlichkeit auch f�r die Grundgesamtheit innerhalb des errechneten Konfidenzintervall

absolute H�ufigkeit
fi
relative H�ufigkeit
hi

W�hrend die absolute H�ufigkeit angibt, wie oft ein bestimmtes Ereignis eintritt (Anzahl)
beschreibt die relative H�ufigkeit, wie gro� der Anteil der absoluten H�ufigkeit an der Gesamtzahl der Versuche ist.

Korrelation

haben jetzt pro Untersuchungsobjekt 2 Merkmale erfasst
(bivariate Daten)
uns interessiert der Zusammenhang zwischen 2 Variablen.
hat die 1 Variable Einfluss auf die andere?
graphische Darstellung: Scatterplot

Kovarianz
Sxy^2

Gibt es �berhaupt einen Zusammenhang?
+
Ist die Korrelation positiv/negativ
Sxy^2 = 0 -> Kein Zusammenhang
+ Wert
- Wert

Pearsonscher Korrelationskoeffizient
r

Wie stark ist der Zusammenhang?
von -1 (perfekte negative Korrelation)
bis +1 (perfekt +)
dimensionlose Gr��e (ohne Einheit)

Bestimmtheitsma�
B (r^2)

Anteil der erkl�rten Streuung an der Gesamtstreuung

Lineare Regression
(lin.mod)

berechnen ein Model, eine Geradengleichung, die den Zusammenhang beschreibt

Vorrausetzungen f�r die Berechnung von
r,B & lin.Regression

X und Y metrisch skaliert
X und Y am selben Objekt gemessen
Normalverteilung von X und Y
Stichprobe aus nur 1 GG
Unabh�ngige Beobachtungen (Objekte zuf�llig aussuchen)
linearer Zusammenhang von X und Y
(nur dann rechnen, wenn wir durch die Punktewolke ein

Wann und wie eine Gerade ziehen?
yDACH = a + bx

wenn r nahe 1 liegt, machen wir Regressionsgerade.
Wie finde ich die perfekte Gerade?
-> mit der Methode der kleinsten Quadrate.
minimiert die Residuumquadrate in y-Richtung.
yDACH - unsere Gerade
auf der yDACH Geraden liegen unsere Sch�tzwerte.
Residuum

Methode der kleinsten Quadrate

minimiert die Residuumquadrate in y-Richtung.

Residuum
ei

Abweichung des Messwerts vom gesch�tzten Wert (liegt auf der Geraden, yDACH)

Mit der Ausgleichsgeraden Fragen beantworten

yDach = a +b.x
a ausrechnen
b ausrechnen
x einsetzen aus der Fragestellung
-> kriegen Sch�tzer y Dach.

Macht es einen Sinn, Gerade zu ziehen? Ist der Zusammenhang linear?

Wenn Residuen einen zuf�lligen Zeichenwechsel haben. Sonst nicht.