Didaktické testy II Psychometrická analýza úloh a testů podle klasické teorie testování Martin Chvál Brno, 26.5.2015.

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Testování statistických hypotéz
Statistické charakteristiky variability
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Hodnocení způsobilosti měřících systémů
Cvičení 6 – 25. října 2010 Heteroskedasticita
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Charakteristiky variability
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
CHYBY MĚŘENÍ.
Tloušťková struktura porostu
Teorie psychodiagnostiky a psychometrie
Principy konstrukce norem a základní statistické pojmy
Zkvalitnění kompetencí pedagogů ISŠ Rakovník IV/2 Inovace a zkvalitnění výuky směřující k rozvoji matematické gramotnosti žáků středních škol Integrovaná.
Charakteristiky variability
Lineární regrese kalibrační přímky
Biostatistika 7. přednáška
Biostatistika 4. přednáška
Charakteristiky variability
Popisná statistika III
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
PSY717 Statistická analýza dat 2010 První konzultace.
Pohled z ptačí perspektivy
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Pavel Najman. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
PROBLEMATIKA DIDAKTICKÉHO TESTU
Biostatistika 8. přednáška
Základy statistiky Autor: Jana Buršová.
Elektronický materiál byl vytvořen v rámci projektu OP VK CZ.1.07/1.1.24/ Zvyšování kvality vzdělávání v Moravskoslezském kraji Střední průmyslová.
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
© Tom Vespa STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Aplikovaná statistika 2. Veronika Svobodová
Popisná analýza v programu Statistica
1. cvičení
Inferenční statistika - úvod
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Zlepšení podmínek pro vzdělávání na středních školách Operačního programu Vzdělávání pro konkurenceschopnost Název a adresa školy: Integrovaná střední.
Odhady odhady bodové a intervalové odhady
… jsou bohatší lidé šťastnější?
Popisná statistika I tabulky četností
Induktivní statistika
Induktivní statistika
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Normální rozložení Intervalová/poměrová proměnná
Statistika 2.cvičení
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Popisná statistika: přehled
Popisná analýza v programu Statistica
STATISTICKÉ CHARAKTERISTIKY
Induktivní statistika
METODOLOGIE MAGISTERSKÉ PRÁCE
Spojitá a kategoriální data Základní popisné statistiky
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Kapitola 3: Centrální tendence a variabilita
Střední škola obchodně technická s. r. o.
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

Didaktické testy II Psychometrická analýza úloh a testů podle klasické teorie testování Martin Chvál Brno, 26.5.2015

Obsah Statistické charakteristiky testových úloh – položková analýza Statistická analýza výsledků testování Vše bude prezentováno podle klasické teorie testů s příležitostnými odkazy na IRT.

Statistické charakteristiky testových úloh položková analýza

Co napoví statistické charakteristiky úloh Zda je úloha přiměřeně obtížná Obtížnost, index obtížnosti, úspěšnost, rozložení dílčích bodů Obtížnost čistá, korigovaná, hrubá Zda je úloha z hlediska konstrukce testu a interpretace výsledků „efektivní“ (citlivá) Koeficient(y) citlivosti ULI Korelační koeficient (RIR a RIT) Změna vnitřní konsistence testu Grafické vyjádření citlivosti Zda úloha neobsahuje jiný konstrukční nedostatek Analýza distraktorů Další charakteristiky úlohy Porovnání výsledků skupin (chlapci – dívky, intaktní – SVP, typy školy, …)

Proces vzniku statistických charakteristik Tabulka odpovědí X – žádná odpověď Klíč správných řešení Tabulka bodů Někdy se počítá, někdy není vidět a jen si ji generuje SW sám pro další analýzy. Forma statistického zpracování (Excel, SW na zpracování výsledků DT, Statistický SW) Analýza distraktorů Porovnávání výsledků skupin Obtížnost a citlivost úloh Analýza výsledků testu

Příklady forem statistického zpracování výsledků DT podle klasické teorie testů ITEMAN RESTAN

Obtížnost úlohy Určí se jako míra chybovosti nebo naopak správnosti řešení úlohy testovanými žáky. Různí autoři definují různě, ale z hlediska informačního přínosu ekvivalentně. V zásadě se jedná o podíl: počet žáků, kteří danou úlohu řešili CHYBNĚ počet všech žáků, kteří řešili test Tento vztah však lze bez problémů uplatnit pouze u úloh s binárním skórováním 0 – chybně, 1 – správně.

Nejčastější varianty obtížnosti SPRÁVNĚ – index obtížnosti, úspěšnost počet žáků, kteří danou úlohu řešili CHYBNĚ počet všech žáků, kteří řešili test X 100 počet žáků, kteří na danou úlohu „dosáhli“ (řešili tuto nebo některou z následujících) – korigovaná úspěšnost Univerzální vztah i pro úlohy s jiným než binárním skórováním součet bodů všech žáků v dané úloze počet všech žáků, kteří řešili test x dosažitelné maximum bodů v úloze X 100 (%) tj. „čistá úspěšnost“, označme ji P

Varianty obtížnosti (úspěšnosti) Vztah obtížnosti a úspěšnosti Z hlediska výpočtu úspěšnost = index obtížnosti = 100 - obtížnost Z hlediska interpretace obtížnost je chápána jako vlastnost úlohy úspěšnost je charakteristikou žáka nebo skupiny testovaných Korigovaná úspěšnost Hrubá úspěšnost Nejprve se provede přeskórování na binární a pak se provede výpočet podle vztahu pro čistou úspěšnost. Lze tak např. zjistit % žáků, kteří danou úlohu řešili zcela správně. součet bodů všech žáků v dané úloze počet žáků, kteří „dosáhli“ na danou úlohu x dosažitelné maximum bodů v úloze X 100 (%)

Obtížnosti úloh (úspěšnosti v úlohách) Devítky 2007, ČJ var A, úlohy hodnocené max 3 body

Obtížnosti úloh (úspěšnosti v úlohách) Devítky 2007, M var A, úlohy hodnocené max 4 body

Co napoví statistické charakteristiky úloh Zda je úloha přiměřeně obtížná Obtížnost, index obtížnosti, úspěšnost, rozložení dílčích bodů Obtížnost čistá, korigovaná, hrubá Zda je úloha z hlediska konstrukce testu a interpretace výsledků „efektivní“ (citlivá) Koeficient(y) citlivosti ULI (diskriminace) Korelační koeficient (RIR a RIT) Změna vnitřní konsistence testu Grafické vyjádření citlivosti Zda úloha neobsahuje jiný konstrukční nedostatek Analýza distraktorů Další charakteristiky úlohy Porovnání výsledků skupin (chlapci – dívky, intaktní – SVP, typy školy, …)

Citlivost úlohy Měří úloha to samé jako celý test (ostatní úlohy v testu)? Pokud ano, budou žáci úspěšnější v celém testu úspěšnější i v této úloze. Statistické ukazatele citlivosti Koeficient ULI (upper-lower-index) Korelační koeficienty RIR a RIT (Rbis a Rpbis) Změna vnitřní konsistence testu po vynechání úlohy (Alpha w/o) Grafické vyjádření citlivosti

Výpočet koeficientu ULI Všichni žáci utvoří pořadí podle celkové úspěšnosti v testu. Rozdělí se přibližně (jak to bodové hranice dovolí) na poloviny (třetiny, čtvrtiny, pětiny …) podle dosažených celkových výsledků. Spočítá se úspěšnost žáků v dané úloze zvlášť pro nejlepší a nejhorší skupinu podle předchozího rozdělení. Tyto úspěšnosti se od sebe odečtou (případně vydělí 100, aby výsledek vyšel menší nebo roven 1) ULI = (Plepší skupina – Phorší skupina)/100

Vztah mezi obtížností a citlivostí úlohy Šanci dosáhnout vyšší citlivosti mají spíše úlohy pohybující se kolem obtížnosti 0,5 (50 %). Na úlohy s vyšší nebo nižší náročností je třeba klást nižší nároky z hlediska citlivosti.

RIR, RIT a změna vnitřní konsistence RIT (Rbis) - korelační koeficient úlohy a celého testu RIR (Rpbis) – korelační koeficient položky a celého testu vyjma této úlohy Změna vnitřní konsistence (Alpha w/o) – vnitřní konsistence testu při vynechání dané úlohy Teoreticky se ULI, RIR i RIT pohybují v intervalu <-1;1>, prakticky <0;1>. Vyšší hodnota koeficientů znamená vyšší citlivost úlohy. Vnitřní konsistence se pohybuje v intervalu <0;1>. Větší snížení vnitřní konsistence při odebrání dané úlohy znamená vyšší citlivost úlohy (a obráceně). RIT je vždy o něco vyšší než RIR. Při vynechání málo citlivé položky vnitřní konsistence testu vzroste. Změny vnitřní konsistence mají daleko nižší hodnoty než rozdíly u ostatních koeficientů citlivosti.

Výběr úloh pro grafické vyjádření citlivosti U17 U21 U16 U23

Grafické vyjádření citlivosti ULI (1/5) ULI (1/10)

Závislost citlivosti na homogenitě skupin V závorce jsou uvedeny hodnoty směrodatné odchylky hrubého skóre v jednotlivých skupinách. Nižší hodnota znamená vyšší homogenitu skupiny z hlediska ověřovaných znalostí a dovedností. Čím je skupina homogenější, tím jsou hodnoty citlivosti nižší. Některým úlohám v homogenější skupině výrazně klesla citlivost – jedná se o úlohy mimořádně jednoduché pro celou tuto skupinu.

Co napoví statistické charakteristiky úloh Zda je úloha přiměřeně obtížná Obtížnost, index obtížnosti, úspěšnost, rozložení dílčích bodů Obtížnost čistá, korigovaná, hrubá Korekce na hádání Zda je úloha z hlediska konstrukce testu a interpretace výsledků „efektivní“ (citlivá) Koeficient(y) citlivosti ULI Korelační koeficient (RIR a RIT) Změna vnitřní konsistence testu Grafické vyjádření citlivosti Zda úloha neobsahuje jiný konstrukční nedostatek Analýza distraktorů Další charakteristiky úlohy Porovnání výsledků skupin (chlapci – dívky, intaktní – SVP, typy školy, …)

Analýza distraktorů ULI (1/5) x 100 úspěšnost Tento distraktor uměli „dobří“ žáci správně vyloučit, tedy dobře diferencuje. ULI (1/5) x 100 Tyto distraktory volili stejně často žáci s dobrým i špatným výsledkem v celém testu. Jejich volba byla patrně výsledkem náhodného hádání. úspěšnost Velmi dobře postavená úloha

Analýza distraktorů – ze SW RESTAN

Statistická analýza výsledků testování

Obsah této části Rozložení hrubého skóre (úspěšnosti) Popisné charakteristiky rozložení

Histogram – rozdělení relativních četností bodů Devítky 2007, ČJ

Popisné charakteristiky rozdělení „Kde ve vodorovném směru balík leží?“ (míry polohy) Aritmetický průměr (průměrné skóre - body, průměrná úspěšnost) Medián (skóre, úspěšnosti) „Jak je balík tlustej?“ (míry rozptýlení) Směrodatná odchylka Kolem průměru na obě strany zabere asi 2/3 všech žáků Rozpětí kvartilové, decilové, … Hranice úspěšnosti a procento neúspěšných Na půl cesty mezi grafem a číslem Percentilové rozdělení