Merkmal
Merkmale sind jene Eigenschaften, die in einer Erhebung untersucht werden.
Bei einer Befragung entspricht ein Merkmal einer gestellten Frage.
Man unterscheidet zwischen qualitativen und quantitativen Merkmalen.
Nicht zu verwechseln ist das Merkmal mit den
Merkmalsauspr�gung
Merkmale k�nnen verschiedene Werte annehmen, die Merkmalsauspr�gungen genannt werden.
Bei Befragungen sind die Merkmalsauspr�gungen die Antwortm�glichkeiten, die der Befragte angeben kann.
Merkmal: Geschlecht
Merkmalsauspr�gung: weiblich, m�nnlich
Merkmalstr�ger
Als statistische Einheiten (bzw. Merkmalstr�ger) kommen ganz unterschiedliche Objekte in Frage, zum Beispiel Personen, L�nder, Religionsgruppen, Autotypen, T�tensuppen usw.
Die Eigenschaften, die in Hinblick auf die Merkmalstr�ger untersucht werden, nennt
Variable
Die Bezeichnungen Merkmal und Variable werden synonym verwendet, wobei im statistischen Kontext der Begriff der Variablen bevorzugt wird.
Die Bezeichnung Variable leitet sich aus der Tatsache ab, da� sich die Auspr�gungen eines Merkmals von Untersuchungse
Grundgesamtheit
Die Anzahl der statistischen Einheiten ( Merkmalstr�ger) zu denen eine Aussage getroffen werden soll.
�Alle Niedersachsen ab 18 Jahren".
Da f�r eine Befragung nicht alle Niedersachsen befragt werden k�nnen, wird in der Regel eine Stichprobe ausgew�hlt (Te
Stichprobe
steht stellvertretend f�r die Grundgesamtheit
Auswahl einer hochwertigen Stichprobe:
Zufallsauswahl -> die Wahrscheinlichkeit ist bei allen gleich
Die Auswahl der n Personen aus der Population erfolgt zuf�llig und kann somit als ein Zufallsexperiment betr
Stichprobenumfang
n
Anzahl der zuf�llig ausgesuchten Repr�sentanten unserer GG
arithmetisches Mittel
x-
Sch�tzer f�r den wahren Mittelwert der GG ?
Median (Zentralwert)
Z = Q50 = x~
der Wert, der in der Mitte liegt
teilt geordnete Reihe !!! der Messwerte in die oberen und unteren 50 Prozent.
Modus/Modalwert
D
(Dichtemittel)
Der am h�ufigsten vorkommende Wert einer Verteilung
-> also den Wert mit der gr��ten Wahrscheinlichkeit.
Da eine Verteilung, wenn man sie graphisch darstellt, mehrere H�hepunkte oder Gipfel haben kann, k�nnen einer Verteilung auch mehrere Modi (bimodal, m
Dichtefunktion
(auch Wahrscheinlichkeitsfunktion)
?
beschreibt, mit welcher Wahrscheinlichkeit eine Zufallsvariable eine bestimmte Merkmalsauspr�gung annimmt.
(monovariable Daten)
Die Fl�che unter der Kurve ist die Wahrscheinlichkeit
(die ganze Fl�che = 1)
Streuung
Streuung ist die Verteilung von einzelnen Werten um den Mittelwert.
Die Werte 10, 20 und 30 sowie die Werte 19, 20 und 21 haben zwar den gleichen Mittelwert 20,
sind aber unterschiedlich um ihn herum verteilt.
Varianz
Sx^2
Wie weit streuen die Messwerte um den Mittelwert x-
(quadriert)
Symbol der Varianz f�r eine Zufallsvariable ist �?�
Standardabweichung
Sx
?
Wie weit streuen die Messwerte um den Mittelwert x-
(dieselbe Einheit wie die Messwerte)
Standardabweichung die durchschnittliche Entfernung aller gemessenen Auspr�gungen eines Merkmals vom Durchschnitt.
Standardfehler des Mittelwerts
Sx-
Wie genau sch�tzen wir mit dem x- den wahren Mittelwert der GG ?
Quantile
Wenn die Verteilung in n gleich gro�e Teile unterteilt wird
Quartile
Form der Quantile. (n=4)
Unterteilt man eine Verteilung in vier gleich gro�e Abschnitte, spricht man von vier Quartilen.
Konfidenzintervall
Liegt das Konfidenzniveau bei 95 Prozent, hei�t dies �bersetzt, dass ein statistischer berechneter Wert auf Grundlage einer Stichprobenerhebung mit 95-prozentiger Wahrscheinlichkeit auch f�r die Grundgesamtheit innerhalb des errechneten Konfidenzintervall
absolute H�ufigkeit
fi
relative H�ufigkeit
hi
W�hrend die absolute H�ufigkeit angibt, wie oft ein bestimmtes Ereignis eintritt (Anzahl)
beschreibt die relative H�ufigkeit, wie gro� der Anteil der absoluten H�ufigkeit an der Gesamtzahl der Versuche ist.
Korrelation
haben jetzt pro Untersuchungsobjekt 2 Merkmale erfasst
(bivariate Daten)
uns interessiert der Zusammenhang zwischen 2 Variablen.
hat die 1 Variable Einfluss auf die andere?
graphische Darstellung: Scatterplot
Kovarianz
Sxy^2
Gibt es �berhaupt einen Zusammenhang?
+
Ist die Korrelation positiv/negativ
Sxy^2 = 0 -> Kein Zusammenhang
+ Wert
- Wert
Pearsonscher Korrelationskoeffizient
r
Wie stark ist der Zusammenhang?
von -1 (perfekte negative Korrelation)
bis +1 (perfekt +)
dimensionlose Gr��e (ohne Einheit)
Bestimmtheitsma�
B (r^2)
Anteil der erkl�rten Streuung an der Gesamtstreuung
Lineare Regression
(lin.mod)
berechnen ein Model, eine Geradengleichung, die den Zusammenhang beschreibt
Vorrausetzungen f�r die Berechnung von
r,B & lin.Regression
X und Y metrisch skaliert
X und Y am selben Objekt gemessen
Normalverteilung von X und Y
Stichprobe aus nur 1 GG
Unabh�ngige Beobachtungen (Objekte zuf�llig aussuchen)
linearer Zusammenhang von X und Y
(nur dann rechnen, wenn wir durch die Punktewolke ein
Wann und wie eine Gerade ziehen?
yDACH = a + bx
wenn r nahe 1 liegt, machen wir Regressionsgerade.
Wie finde ich die perfekte Gerade?
-> mit der Methode der kleinsten Quadrate.
minimiert die Residuumquadrate in y-Richtung.
yDACH - unsere Gerade
auf der yDACH Geraden liegen unsere Sch�tzwerte.
Residuum
Methode der kleinsten Quadrate
minimiert die Residuumquadrate in y-Richtung.
Residuum
ei
Abweichung des Messwerts vom gesch�tzten Wert (liegt auf der Geraden, yDACH)
Mit der Ausgleichsgeraden Fragen beantworten
yDach = a +b.x
a ausrechnen
b ausrechnen
x einsetzen aus der Fragestellung
-> kriegen Sch�tzer y Dach.
Macht es einen Sinn, Gerade zu ziehen? Ist der Zusammenhang linear?
Wenn Residuen einen zuf�lligen Zeichenwechsel haben. Sonst nicht.