Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

SUMMARY. critical region Z* Z-critical value Decision errors Type I: you reject the null, but you shouldn't. (α) Type II: You do not reject the null,

Podobné prezentace


Prezentace na téma: "SUMMARY. critical region Z* Z-critical value Decision errors Type I: you reject the null, but you shouldn't. (α) Type II: You do not reject the null,"— Transkript prezentace:

1 SUMMARY

2 critical region Z* Z-critical value

3 Decision errors Type I: you reject the null, but you shouldn't. (α) Type II: You do not reject the null, but you should. Decision Reject H 0 Retain H 0 State of the world H 0 true Type I error FP H 0 false Type II error FN

4 Summary of t-tests two-sample tests

5 NEW STUFF

6 Výrobce garantuje, že jím vyrobené žárovky mají životnost v průměru 1000 hodin. Aby útvar kontroly zjistil, že tomuto konstatování odpovídá i v daném období vyrobená a expedovaná část produkce, vybral z připravené dodávky náhodně 50 žárovek a došel k závěru, že průměrná doba životnosti je 950 hodin se směrodatnou odchylkou 100 hodin. Je zjištěný rozdíl doby životnosti známkou nekvality produkce?

7 Ve Zpiťákově se dělal výzkum požívání alkoholu tak, že se náhodně vybralo 8 občanů a u nich se zjistila průměrná měsíční konzumace alkoholu. Po nějaké době došlo ve městě ke dvěma úmrtím na cirrhózu jater (u jiných Zpiťarů, než kteří byli statisticky testováni). K posouzení, zda tato událost snížila konzumaci ve městě, se u stejných 8 občanů zjistila opět měsíční spotřeba. Rozhodněte, zda ona dvě úmrtí snížila konzumaci?

8 Průměrná váha žen v ČR ve věku 20-25 let je 67 kg se směrodatnou odchylkou 4 kg. Průměrná hmotnost 10 náhodně vybraných studentek VŠCHT činí 65,4 kg se směrodatnou odchylkou 3,2 kg. Vede dlouhotrvající sezení na nudných přednáškách a stres ze zkoušek z nesrozumitelných předmětů k poklesu váhy studentek?

9 Porovnáváme množství organických látek v odpadních vodách dvou papíren. Na základě několika náhodných měření v těchto papírnách máme rozhodnout, zda se tyto papírny liší v množství odpadních látek. V první papírně proběhlo 20 měření s průměrem 14,9 a směrodatnou odchylkou 4,8. 25 měření z druhé papírny vykazovalo průměr 22,0 a směrodatnou odchylku 7,4.

10 Podnikatel začal vyrábět jehly do šicích strojů. Prosadí se na trhu jedině tehdy, jestliže jeho jehly budou mít vyšší životnost než konkurenční. Z odborného tisku podnikatel zjistil, že životnost konkurenčních jehel je 8,72 milion stehů. Sám na zkoušku vyrobil 395 jehel, jejichž průměrná životnost činila 8,92 milionu stehů se směrodatnou odchylkou 1,81 milionu stehů. Má podnikatel rozjet výrobu naplno?

11 Report statistical results I Descriptive statistics mean, s.d. Confidence intervals confidence level (e.g., 95%) lower limit upper limit CI on what (e.g., on a mean)? APA style See, for example, http://my.ilstu.edu/~jhkahn/apastats.htmlhttp://my.ilstu.edu/~jhkahn/apastats.html Confidence interval on the mean difference; 95% CI = (4,6)

12 Report statistical results II

13 ANOVA

14 A problem You're comparing three brands of beer.

15 A problem You buy four bottles of each brand for the following prices. What do you think, which of these brands have significantly different prices? Primátor and Kocour Primátor and Matuška Kocour and Matuška No significant difference between any of these. PrimátorKocourMatuška 153965 1245 144832 116038

16 t-test We can do three t-tests to show if there is a significant difference between these brands. How many t-tests would you need to compare four samples? 6 To compare 10 samples, you need 45 t-tests! This is a lot. We don’t want to do a million t-tests. But in this lesson you'll learn a simpler method. Its called Analysis of variance (Analýza rozptylu) – ANOVA.

17 Multiple comparisons problem

18 http://www.graphpad.com/guides/prism/6/statistics/index.htm?beware_of_multiple_comparisons.htm Bennet et al., Journal of Serendipitous and Unexpected Results, 1, 1-5, 2010

19 Correcting for multiple comparisons

20 Main idea Variability between sample means Error, variability within samples

21 Beer brands – a boxplot 13 454835 PrimátorKocourMatuška 153965 1245 144832 116038

22 Numerator How can we compare three or more samples? 1. Use the maximum distance between any two sample means. 2. Use the average deviation of each sample mean from the total mean. 3. Find the averaged squared deviation of each sample mean from the total mean. 4. Find the average squared deviation of each value in each sample from the total mean. This is called between-group variability (variabilita mezi skupinami).

23 Between-group variability What conclusions can we draw from deviation of each sample mean from the grand mean? 1. The greater the distance between sample means, the less likely population means will differ significantly. 2. The smaller the distance between sample means, the less likely population means will differ significantly. 3. The greater the distance between sample means, the more likely population means will differ significantly. 4. The smaller the distance between sample means, the more likely population means will differ significantly.

24 Denominator

25 How variability impacts the difference in means

26 What does this say about comparing three or more samples? Check all that apply. 1. The greater the variability of each individual sample, the less likely population means will differ significantly. 2. The smaller the variability of each individual sample, the less likely population means will differ significantly. 3. The greater the variability of each individual sample, the more likely population means will differ significantly. 4. The smaller the variability of each individual sample, the more likely population means will differ significantly. Within-group variability

27 ANOVA If we compare samples we simply extend the idea of the t- test. We can compare samples to each other by comparing how far each sample mean is from the grand mean (between-group variability). But we also want to look at the variability of each sample because this impacts whether or not the samples are significantly different (within-group variability). ANOVA can compare as many means as you want just with one test.

28 Hypothesis

29 F ratio As between-group variability increases, F-statistic increases and this leans more in favor of the alternative hypothesis that at least one pair of means is significantly different. As within-group variability increases, F-statistic decreases and this leans more in favor of the null hypothesis that the means are not siginificantly different.

30 Between-group variability SS – sum of squares, součet čtverců MS – mean square, průměrný čtverec SSB – součet čtverců mezi skupinami MSB – průměrný čtverec mezi skupinami 13 454835

31 Within-group variability SSW – součet čtverců uvnitř skupin MSW – průměrný čtverec uvnitř skupin

32 Within-group variability PrimátorKocourMatuška 153965 1245 144832 116038

33 F-ratio

34 F-distribution

35 F distribution

36 Beer prices PrimátorKocourMatuška 153965 1245 144832 116038 134845

37 F 2,9 F 9,2

38 Beer brands – ANOVA


Stáhnout ppt "SUMMARY. critical region Z* Z-critical value Decision errors Type I: you reject the null, but you shouldn't. (α) Type II: You do not reject the null,"

Podobné prezentace


Reklamy Google