Newest Viewed Downloaded

Die t-VerteilungJonathan Harrington

Die t-Verteilung

Jonathan Harrington

Standard error of the mean (SE)

ist die Standardabweichung von Mittelwerten Ich werfe 5 Würfel und berechne den Mittelwert der Zahlen m = 3.5 der wahrscheinlichste Wert Die Verteilung der Mittelwerte. Bedeutung: ich werde nicht jedes Mal einen Mittelwert m = 3.5 bekommen, sondern davon abweichende Mittelwerte. Der SE ist eine numerische Verschlüsselung dieser Abweichung.

sigma <- function(unten=1, oben=6) { x = unten:oben n = length(x) m = mean(x) sqrt((sum(x^2)/n - m^2)) } sigma()/sqrt(5) 0.7637626 Standard error of the mean (SE)

Standard error of the mean (SE) und der Vertrauensintervall

95% Vertrauensintervall Wenn ich 5 Würfel werfe, dann liegt der Stichproben-Mittelwert, m, dieser 5 Zahlen zwischen 2.00 und 5.00 mit einer Wahrscheinlichkeit von 95% (0.95). Bedeutung: Probieren! a = proben(1, 6, 5, 100) sum(a < 2 | a > 5) qnorm(0.025) 3.5 - 1.96 * sigma()/sqrt(5) 2.003025 qnorm(0.025, 3.5, sigma()/sqrt(5)) oder 4.996975 qnorm(0.975, 3.5, sigma()/sqrt(5))

Standard error of the mean (SE) und der Vertrauensintervall

SE wird kleiner, umso größer n. umso größer n, umso weniger weicht m von m ab. Oder: Je mehr Würfel wir werfen, umso wahrscheinlicher ist es/sicherer wird es sein, dass m nah an m ist. Im unendlichen Fall – wir werfen unendlich viele Würfel und berechnen deren Zahlenmittelwert – ist SE 0 (NULL) und m = m = 3.5.

Standard error of the mean (SE) wenn s unbekannt ist.

Lenneberg behauptet, dass wir im Durchschnitt mit einer Geschwindigkeit von 6 Silben pro Sekunde sprechen. Präzisere/bessere Frage: ist der Unterschied zwischen m und m signifikant? (Oder: fällt m außerhalb des 95% Vertrauensintervalls von m?). Hier sind 12 Werte (Silben/Sekunde) von einem Sprecher. Frage: sind die Werte überraschend? (angenommen m = 6?). werte [1] 6 5 6 9 6 5 6 8 5 6 10 9 Das Verfahren: a one-sampled t-test

Präzisere/bessere Frage: fällt m außerhalb des 95% Vertrauensintervalls von m?

A. Um das Vertrauensintervall um m zu berechnen, benötigen wir den SE. B. Damit lässt sich ein Vertrauensintervall m – k SE bis m + k SE setzen (k ist eine gewisse Anzahl von SEs). C. Wenn m (in diesem Fall 6.75) innerhalb dieses Intervalls fällt, ist das Ergebnis 'nicht signifikant' (konsistent mit der Hypothese, dass wir im Durchschnitt mit 6 Silben pro Sekunde sprechen).

A. Standard error of the mean (SE) berechnen

Aber das können wir nicht berechnen, weil wir s nicht wissen! Wir können aber s oder unsere beste Einschätzung von s berechnen ^ Für diesen Fall: werte [1] 6 5 6 9 6 5 6 8 5 6 10 9 shut = sd(werte) In R kann s ganz einfach mit sd() berechnet werden. ^

SE ^ = SEhut = shut/sqrt(12) 0.5093817 werte [1] 6 5 6 9 6 5 6 8 5 6 10 9 shut = sd(werte) Einschätzung des Standard-Errors A. Standard error of the mean (SE) einschätzen

B. Vertrauensintervall: die t-Verteilung

Wenn die Bevölkerungs-Standardabweichung eingeschätzt werden muss, dann wird das Vertrauensintervall nicht mit der Normal- sondern der t-Verteilung mit einer gewissen Anzahl von Freiheitsgraden berechnet. Bei diesem one-sample t-test ist die Anzahl der Freiheitsgrade, df (degrees of freedom), von der Anzahl der Werte in der Stichprobe abhängig: df = n – 1 Je höher df, umso sicherer können wir sein, dass s = s und umso mehr nähert sich die t-Verteilung der Normalverteilung ^ Die t-Verteilung ist der Normalverteilung recht ähnlich, aber die 'Glocke' und daher das Vertrauensintervall sind etwas breiter (dies berücksichtigt, die zusätzliche Unsicherheit die wegen s entsteht). ^

Normalverteilung, m = 0, s = 1.

curve(dt(x, 10), -4, 4, add=T, col="red") curve(dnorm(x, 0, 1), -4, 4) -4 -2 0 2 4 0.0 0.1 0.2 0.3 0.4 x function(x) dnorm(x, 0, 1) (x) t-Verteilung, m = 0, s = 1, df = 3 curve(dt(x, 3), -4, 4, add=T, col="blue")

B. Vertrauensintervall um m = 6

mu = 6 SEhut = sd(swerte)/sqrt(n) # eingeschätzter SE mu + SEhut * qt(0.025, frei) # untere Grenze frei = n - 1 # Freiheitsgrade 4.878858 mu + SEhut * qt(0.975, frei) # obere Grenze 7.121142 n = length(swerte)

Auf der Basis dieser Stichprobe liegt m zwischen 4.878858 und 7.121142 mit einer Wahrscheinlichkeit von 95%.

Frage: angenommen m = 6 sind die Werte überraschend? mean(werte) [1] 6.75 Nein. C. Signifikant?

The two-sampled t-test

Meistens werden wir 2 Stichprobenmittelwerte miteinander vergleichen wollen (und wesentlich seltener wie im vorigen Fall einen Stichprobenmittelwert, m, mit einem Bevölkerungsmittelwert, m).

Zwei Händler, X und Y, verkaufen Äpfel am Markt.

Ich kaufe 20 Äpfel von X, 35 von Y. Ich wiege jeden Apfel und berechne: Gewicht-Mittelwert mx = 200 Gewicht S-abweichung sx = 20 Anzahl nx = 20 ny = 35 sy = 30 my = 220 X Y Ist dieser Unterschied mx – my = 200 – 220 = – 20 g signifkant? Die Äpfel von Y sind teuerer, weil seine Äpfel mehr wiegen (behauptet Y).

H0: Es gibt keinen signifikanten Unterschied zwischen den Mittelwerten.

= die Wahrscheinlichkeit, dass der Unterschied zwischen diesen Mittelwerten 0 sein könnte ist mehr als 0.05 (kommt öfter als 5 Mal pro Hundert vor). H1: Es gibt einen signifikanten Unterschied zwischen den Mittelwerten = die Wahrscheinlichkeit, dass der Unterschied zwischen diesen Mittelwerten 0 sein könnte ist weniger als 0.05 (kommt seltener als 5 Mal pro Hundert vor). Hypothesen

Vorgang

Wir nehmen an, dass mx – my = -20 g eine Stichprobe aus einer Normalverteilung ist. 1. Wir müssen die Parameter m, s (und dann SE) dieser Normalverteilung einschätzen. 2. Wir erstellen ein 95% Vertrauensintervall fuer die t-Verteilung. 3. Wenn dieses Vertrauenintervall 0 einschließt, ist H0 akzeptiert (kein signifikanter Unterschied zwischen mx und my) sonst H1 (der Unterschied ist signifikant).

1. m, SE einschätzen

Die beste Einschätzung von m ist der Mittelwertunterschied unserer Stichprobe Fuer diesen Fall mu = mx – my = – 20

1. SE einschätzen

Die beste Einschätzung von SE Gewicht-Mittelwert mx = 200 Gewicht S-abweichung sx = 20 Anzahl nx = 20 ny = 35 sy = 30 my = 220 X Y Für diesen Fall, SEhut = 7.525339 Bitte in R-Befehle umsetzen und bestätigen. x

nx = 20 ny = 35 sx = 20 sy = 30 z = ((nx - 1) * sx^2) + ((ny - 1) * sy^2) nenn = nx + ny - 2 SEhut = sqrt(z/nenn) * sqrt(1/nx + 1/ny)

[1] 7.525339

Showing 1 - 20 of 38 items Details

Name: 
tverteilung
Author: 
jmh
Company: 
ipds
Description: 
Die t-VerteilungJonathan Harrington
Tags: 
test | mean | unterschied | sehut | vertrauensintervall | werte | sqrt | signifikant
Created: 
5/15/2009 5:11:09 AM
Slides: 
38
Views: 
0
Downloads: 
0
Rating: 
0


> Comment



Share this presentation
|

Comments

Share this presentation:

|
Sitemap