SPC v případě autokorelovaných dat

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Riziko zbytečného signálu v regulačním diagramu
Statistická indukce Teorie odhadu.
Analýza experimentu pro robustní návrh
UKAZATELE ZPŮSOBILOSTI A VÝKONNOSTI
Národní informační středisko
kvantitativních znaků
Kontrola kvality,“Westgardova pravidla“
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Hodnocení způsobilosti měřících systémů
Cvičení 6 – 25. října 2010 Heteroskedasticita
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
Národní informační středisko
Národní informační středisko pro podporu kvality.
Úvod do regresní analýzy
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Testování hypotéz (ordinální data)
Statistika Vypracoval: Mgr. Lukáš Bičík
Analýza způsobilosti procesů a výrobních zařízení
Autor: Boleslav Staněk H2IGE1.  Omyly  Hrubé chyby  Chyby nevyhnutelné  Chyby náhodné  Chyby systematické Rozdělení chyb.
Tloušťková struktura porostu
kvantitativních znaků
Testování hypotéz vymezení důležitých pojmů
Základy ekonometrie Cvičení září 2010.
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
Základy ekonometrie Cvičení října 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
Charakteristiky variability
1 Nedodržení předpokladu normality v regulačním diagramu.
Regulační diagram Ing. Zdeněk Aleš, Ph.D.
Lineární regrese.
Lineární regresní analýza
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Ekonomické modelování Analýza podnikových procesů Statistická simulace je vhodný nástroj pro analýzu stochastických podnikových procesů (výrobní, obchodní,
Metrologie   Přednáška č. 5 Nejistoty měření.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Biostatistika 8. přednáška
Korelace.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
Systémy vnitřní kontroly kvality
IV..
Aplikovaná statistika 2.
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Základy zpracování geologických dat R. Čopjaková.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Základy statistické indukce
t-test Počítání t-testu t statistika Měření velikosti efektu
Signály a jejich vyhodnocení
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Příklad (investiční projekt)
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Neparametrické testy pro porovnání polohy
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

SPC v případě autokorelovaných dat Jiří Michálek, Jan Král OSSM, 21.6.2012

Pojem korelace Statistická vazba mezi veličinami Korelace vs. stochastická nezávislost Koeficient korelace = míra lineární vazby mezi veličinami Autokorelace = korelace mezi sousedícími daty v jedné časové řadě Autokorelační funkce, odhad autokorelace pořízený z dat

Předpoklady pro Shewhartovy diagramy Normálně rozdělený znak jakosti Sbíraná data z procesu jsou nezávislá jak mezi podskupinami, tak i uvnitř podskupin Parametr polohy a úroveň variability jsou konstantní Regulační meze jsou pak počítány na základě těchto předpokladů

Porušení předpokladů Závislost mezi daty v rámci podskupiny – může mít vliv na vyhodnocování průběhu diagramu, odhad směrodatné odchylky pro výpočet regulačních mezí Závislost mezi podskupinami – může podstatně ovlivnit výskyt falešných poplachů

Podezření na autokorelaci Vysoká frekvence sběru dat, hlavně při automatickém odběru Fyzikální důvody – např. vliv teploty, vliv okolního prostředí Setrvačnost v datech vyvolaná např. způsobem měření, systematickými vlivy Záměrná manipulace s daty – opisování, falšování

Příklad regulačního diagramu

Odhad autokorelační funkce

Co říká koeficient korelace? Koeficient korelace je mezi -1 a 1 Čím je koeficient korelace v absolutní hodnotě blíže k 1, tím je větší stochastická vazba mezi veličinami Čím je koeficient korelace v absolutní hodnotě blíže 0, tím je menší stochastická vazba mezi veličinami Pro hodnoty -1 a 1 stochastická vazba přechází dokonce ve funkční lineární vztah

Test korelace mezi 2 veličinami Data jsou spárována do dvojic Vypočte se odhad r koeficientu korelace Vypočte se statistika která za nulové hypotézy o nekorelovanosti má přibližně t-rozdělení o n-2 stupňů volnosti ( n je počet dvojic) Pozn. U normálně rozdělených veličin nekorelovanost = nezávislost

Jak se s korelací vyrovnat? Pro praktické účely má cenu se zabývat korelací, pokud odhad koeficientu korelace má hodnotu nad 0,75 – 0,80 Znaky kvality na jednom výrobku mohou být vzájemně korelovány – vylepšení jednoho znaku může vyvolat zhoršení jiného znaku Použití vícerozměrných regulačních diagramů – odhad korelační matice

Jak se s korelací vyrovnat? Při zjištěné silné korelaci uvnitř podskupin je nutno toto zohlednit při výpočtu regulačních mezí – zásadní roli hraje špatný odhad směrodatné odchylky na základě výběrového rozpětí či výběrové směrodatné odchylky počítaných uvnitř podskupin Korelace může způsobit podhodnocení úrovně variability a toto může vést ke zvýšenému počtu falešných poplachů, protože regulační meze jsou pak blíže u sebe

Jak se s korelací vyrovnat? Zvláště je nutné si dát pozor u regulačního diagramu pro individuální data při sériové korelaci – odhad založený na klouzavém rozpětí opět může podhodnotit úroveň variability V tomto případě v praxi stačí se zaměřit pouze na autokorelaci 1.řádu a použít faktor √(1 – r2) pro úpravu regulačních mezí

Jak se s korelací vyrovnat? Pro výpočet klasických regulačních mezí nepoužijeme Rbar či sbar, ale jejich hodnoty získané z dat podělíme právě faktorem √(1 – r2), čímž dosáhneme rozšíření regulačních mezí Pokud jsou mezi daty autokorelace vyšších řádů, je obvykle možno v praxi je ignorovat

Jak se vyrovnat s korelací? Komplikovanější přístup je založen na nalezení vhodného modelu pro sledovanou časovou řadu (AR, ARMA, ARIMA či další modely) a pracovat s rezidui získanými při použití vhodného modelu Obvykle se vyžaduje, aby rezidua byla vzájemně nekorelovaná se střední hodnotou nula a konstantní úrovní variability (či dokonce normálně rozdělená) a na jejich sledování pak lze použít klasické Shewhartovy regulační diagramy

Příklad na úpravu mezí Na následujícím diagramu je vidět, že první 3-4 zleva, které jsou mimo regulační meze, by mohly znamenat pouze falěšný poplach Je nutné prošetřit autokorelaci a zjistíme, že korelační koeficient mezi sousedícími daty bude významný, jeho odhad je sice pouze 0,48, ale je mimo konfidenční meze

Příklad na úpravu mezí Původní meze pro individuální hodnoty: UCL = 5387, LCL = 3514 CL = 4450 Faktor opravy je při r = 0,4845 roven 0,8748 a přepočtené meze jsou: UCL = 5521, LCL = 3379

Graf s upravenými mezemi

Použití modelu časové řady Na základě odhadu autokorelační funkce budeme uvažovat model typu AR(1): X(i+1) = µ + αX(i) + e(i+1), kde chyby jsou normálně rozdělené se střední hodnotou 0 a nezávislé, µ je aditivní konstanta Vhodnost modelu posoudíme podle chování reziduí a průběh původního procesu pomocí regulačního diagramu pro rezidua

Použití modelu časové řady

Použití modelu časové řady

Použití modelu časové řady

Použití modelu časové řady Nalezený model má tvar: X(i+1) = 2262,73 + 0,4922X(i) + e(i+1), kde rezidua jakožto odhady chyb mají rozdělení N(µ,σ2). µ ≈ -4,33 σ ≈ 417,13

Srovnání obou přístupů Lze říci, že přístup založený na úpravě regulačních mezí se zdá přísnější, ale v žádném případě si oba přístupy neodporují a možné ovlivněné podskupiny označily podobně. Je zřejmé, že přístup založený na úpravě mezí je daleko jednodušší, přístup založený na modelování časové řady vyžaduje již vhodný software.