Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Jištění kvality technologických procesů 12. Statistická analýza dat Richard Březina.

Podobné prezentace


Prezentace na téma: "Jištění kvality technologických procesů 12. Statistická analýza dat Richard Březina."— Transkript prezentace:

1 Jištění kvality technologických procesů 12. Statistická analýza dat Richard Březina

2 Statistická analýza dat  Základní pojmy  Průzkumová analýza dat  Vyhodnocování trendů

3 Statistická analýza dat  Základní pojmy  Průzkumová analýza dat  Vyhodnocování trendů  Charakteristiky polohy a variability  Statistické šetření  Grafické metody

4 Statistická analýza dat  Základní pojmy  Průzkumová analýza dat  Vyhodnocování trendů  Výpočet popisných a intervalových charakteristik  Grafické metody

5 Statistická analýza dat  Základní pojmy  Průzkumová analýza dat  Vyhodnocování trendů  Tvorba a použití regulačních diagramů

6 Základní pojmy Statistické zkoumání Ve statistickém zkoumání se sledují hromadné jevy, tj. jevy vyskytující se u velkého množství prvků. Z hlediska účelu zkoumání hromadných jevů se předpokládá definování vymezené množiny objektů, prvků zkoumání neboli statistického souboru (soubor podniků, soubor obyvatelstva, soubor událostí apod.). Počet objektů, prvků, jednotek statistického souboru se nazývá rozsah souboru. Základní soubor Statistické soubory, které jsou předmětem statistického zkoumání, jsou označovány jako základní soubor. Výběrový soubor Z důvodu ekonomické náročnosti, praktické složitosti a velkých rozsahů se v praxi zpravidla nepracuje s celým rozsahem statistického souboru, ale jen se vzorkem statistických jednotek neboli s výběrovým souborem. Výběrové soubory se používají ke zkoumání zejména proto, že zobecnění provedené z dat výběrového souboru je považováno pro daný účel zkoumání za dostatečně přesné a z hlediska poznání za reprezentativní a že zkoumání celého statistického souboru by bylo nákladné, časově zdlouhavé nebo z jiných praktických ohledů neuskutečnitelné. Zkoumané vlastnosti statistického souboru sleduje statistika prostřednictvím měřitelných vlastností statistických jednotek. tzv. statistických znaků. Pracuje-li se u každé statistické jednotky jen s jedním znakem (s jednou proměnnou), jedná se o jednorozměrný soubor. Zjišťuje-li se současně více znaků a jejich vzájemné vztahy, jde o dvou-, tří-, resp. obecně vícerozměrný soubor.

7 Základní pojmy Kvalitativní a kvantitativní znaky Základním tříděním statistických znaků je rozlišování znaků číselných (kvantitativních, numerických) a znaků slovních (kvalitativních, alfabetických, kategoriálních). Číselné (kvantitativní, numerické) statistické znaky vyjadřují sledované vlastnosti statistických jednotek čísly. Číselné znaky se dělí na spojité (kontinuální), které mohou teoreticky nabývat libovolných reálných číselných hodnot v určitém intervalu (průtok vody, hmotnost výrobku, výška, peněžní obrat apod.) a znaky nespojité (diskrétní), které mohou v oboru reálných čísel nabývat pouze určitých číselných hodnot Cíle statistického zjišťování Cílem statistického šetření je získávání statistických dat o hodnotách statistických znaků u prvků, které tvoří statistický soubor. Každé statistické zjišťování má určitý, předem vymezený a konkrétní cíl. Z definice cílů šetření vyplývá, jak vymezíme statistický soubor jaké proměnné statistické znaky budeme zjišťovat. Zpracování rutinních dat Pro účely této přednášky se omezíme se na zpracování jednorozměrného souboru dat, u něhož sledujeme jednu vlastnost, měřením jednoho spojitého znaku

8 Základní pojmy Postup průzkumové analýzy dat Při statistickém vyhodnocení rutinních dat se předpokládá, že jde o nezávislé veličiny stejně rozdělené veličiny pocházející z normálního rozdělení Test nezávislosti prvků výběru Závislost měření je obvykle způsobena nestabilitou měřicího zařízení, nekonstantností podmínek, zanedbáním faktorů, které významně ovlivňují výsledek měření Test homogenity výběru K nehomogenitě naměřených dat dochází všude tam, kde se vyskytuje výrazná nestejnoměrnost měřených vlastností vzorků, mění se náhle podmínky experimentu a data obsahují vybočující měření Test normality dat Určení výběrového rozdělení a jeho konstrukce Stanovení parametrů polohy a rozptýlení Průzkumová analýza dat pomocí grafických metod

9 Základní pojmy Rozdělení pravděpodobnosti Normální rozdělení Rozdělení je charakterizováno parametrem polohy a rozptýlení funkcí hustoty pravd. Střední hodnotou  Rozptylem  2 Studentovo rozdělení Pro výběry pocházející z normálního rozdělení platí, že náhodná veličina t má Studentovo rozdělení s(n-1) stupni volnosti  2 - rozdělení Pro výběry pocházející z normálního rozdělení platí, náhodná veličina  2 má  2 – rozdělení s (n-1) stupni volnosti

10 Základní pojmy Výběrové charakteristiky polohy Výběrový průměr Je maximálně věrohodným odhadem střední hodnoty  Je velmi citlivý na odlehlé hodnoty Kvantily Kvantily jsou přirozenou mírou polohy. Daný výběr se nejdříve seřadí od nejmenší hodnoty po největší a poté určíme pro daný p% kvantil pořadové číslo jednotky n p, pro které platí: Mediánrobustní padesátiprocentní kvantil, který charakterizuje z hlediska velikosti prostřední hodnotu souboru. Ve statistickém souboru odděluje polovinu hodnot menších od poloviny hodnot větších. Kvartilyrobustní 25% a 75% kvantil Modus robustní Modus je hodnota, která se vyskytuje nejčastěji.

11 Základní pojmy Výběrové charakteristiky rozptýlení Výběrový rozptyl a směrodatná odchylka je nevychýleným odhadem rozptylu  2 pro normální rozdělení. Je definován jako aritmetický průměr ze čtverců odchylek jednotlivých hodnot od průměru, tj., s – směrodatná odchylka Varianční rozpětí robustní Variační rozpětí R je rychlou, jednoduchou, ale jen orientační charakteristikou variability založenou na informaci o maximální a minimální hodnotě v souboru, tj. Interkvartilové rozpětírobustní Kvantilový odhad směrodatné odchylky

12 Základní pojmy Charakteristika tvaru rozdělení Šikmost slouží k zjištění míry symetrie (souměrnosti) rozdělení Jednoduchou charakteristikou šikmosti je Pearsonův koeficient α. K hodnocení stupně šikmosti využívá vztah mezi velikostí aritmetického průměru a mediánu daný ve tvaru Jiný přístup k měření šikmosti je založen na aplikaci tzv. momentových charakteristik. Při práci s daty uspořádanými do rozdělení četností je vhodná tzv. momentová míra šikmosti Špičatost Míry špičatosti jsou založeny na srovnání stupně nahuštěnosti hodnot prostřední velikosti se stupněm nahuštěnosti ostatních

13 Základní pojmy Intervalové odhady statistických parametrů Koeficient spolehlivosti, hladina významnosti Ze statistického hlediska mají bodové odhady malý význam, protože neříkají nic o tom, kde leží skutečné hodnoty parametrů. Více informací poskytuje intervalový odhad, který určuje interval, v němž se bude se zadanou pravděpodobností ( 1-  )nacházet skutečná hodnota daného parametru. Pravděpodobnost nazýváme koeficient spolehlivosti ( 1-  ), volíme nejčastěji 95% nebo 99% a parametr  se nazývá hladina významnosti. Intervalový odhad střední hodnoty Intervalový odhad rozptylu Intervalový odhad mediánu

14 Základní pojmy Grafické metody Diagram rozptýlení a krabicový graf

15 Základní pojmy Grafické metody HistogramQ-Q graf Odhad hustoty pravděpodobnostiGraf rozptýlení s kvantily

16 Průzkumová analýza dat Obsahová stejnoměrnost Obsah účinné látky v tabletovině Naměřené hodnoty Výsledky analýzy obsahu účinné látky ve vzorcích odebraných z homogenizačního kontejneru při prospektivní validaci na 3 validačních šaržích Limity pro obsahovou stejnoměrnost v tabletovině : Interval % pro jednotlivé naměřené hodnoty Interval 18,6 – 21,4 mg/tbl RSD ≤ 3,2% Příklad: Homogenita tabletoviny

17 Průzkumová analýza dat Označení vzorkuObsah účinné látky v tabletovině [mg/tbl.] Š1Š2Š3 A19,7019,5019,60 B19,7019,5119,69 C19,6019,8419,47 D19,6019,6618,94 E19,6019,7019,52 F19,9019,4719,52 G19,8019,5419,52 H19,9020,1019,67 CH19,4019,6919,59 I19,8019,4819,45 Naměřené hodnoty

18 Průzkumová analýza dat Test normality : Název sloupce :šarže1šarže2šarže3 Normalita :Přijata Zamítnuta Vypočtený :0,5734,0127,690 Teoretický :5,991 Pravděpodobnost :0,7510,1340,021 Vybočující body : Název sloupce :šarže1šarže2šarže3 Homogenita :PřijataZamítnuta Počet vybočujících bodů :0,0001,000 Spodní mez :19,22219,08319,185 Horní mez :20,17820,08719,855 Autokorelace : Řád autokorelace :4 Název sloupce :šarže1šarže2šarže3 Řád autokorelace 1 Závěr :Nevýznamný

19 Průzkumová analýza dat Klasické parametry : Název sloupce :šarže1šarže2šarže3 Průměr :19,719,64919,497 Spodní mez :19,58819,50619,346 Horní mez :19,81219,79219,648 Rozptyl :0,0240,0400,045 Směr. odchylka :0,1560,2000,211 Šikmost-0,3681,195-1,974 Odchylka od 0 :Nevýznamná Významná Špičatost :2,4383,5496,134 Odchylka od 3 :Nevýznamná Významná Polosuma19,65019,78519,315 Modus :19,70019,52019,558 Robustní parametry : Název sloupce :šarže1šarže2šarže3 Medián :19,70019,60019,520 IS spodní :19,52719,39219,393 IS horní :19,87319,80819,647 Mediánová směr. odchylka :0,0770,0920,056 Mediánový rozptyl :0,0060,0080,003

20 Průzkumová analýza dat Grafické metody s2s2 s1s1 s3s3

21 Průzkumová analýza dat

22 Vyhodnocování trendů Vyhodnocování trendů zahrnuje metody a postupy sledování a vyhodnocování vybraných veličin procesu. Všechny tyto činnosti mají za cíl odhalit v získaných datech signály, že existují podmínky, které mohou způsobit odchylku od ustáleného stavu procesu a pomoci tak identifikovat nepříznivé vlivy, které mohou mít negativní dopad na produkt. Prakticky to znamená, že předpokládáme nějaké statistické vlastnosti procesu (obecně dat) a vyhodnocování trendů slouží (přinejmenším) k testování, zda se tyto statistické vlastnosti nemění. Postupy: Sledování středních hodnot a rozptylů Grafické zobrazení dat Regulační diagramy Vyhodnocování trendů

23 Diagram x-průměr Použití tohoto grafu se doporučuje pokud je možné vytvořit tzv. podskupiny (dvě nebo více hodnot pro jeden časový okamžik). Diagram x-individual Používá se tam, kde z nějakého důvodu není možné vytvořit podskupiny, do grafu se vynáší přímo naměřené hodnoty Diagram c Je vhodný pro sledování počtu jednotlivých vad na definovaném množství výrobku, který má Poissonovo rozdělení Regulační diagramy

24 Vyhodnocování trendů 1.Jedna hodnota mimo kontrolní meze, 2.Devět hodnot na téže straně centrální linie, 3.Šest hodnot za sebou roste nebo klesá, 4.Čtrnáct hodnot má střídavé znaménko svých diferencí, 5.Dvě ze tří hodnot jsou od základní linie dále než 2s, 6.Čtyři z pěti hodnot jsou na téže straně základní linie dále než 1s, 7.Patnáct hodnot je uvnitř intervalu ±s od základní linie, 8.Osm hodnot po sobě je mimo interval ±s od základní linie. Pravidla regulačních diagramů

25 Vyhodnocování trendů Výtěžek Množství přijaté na sklad z výrobní zakázky Naměřené hodnoty Množství přijaté na sklad z výrobních zakázek 9 sledovaných přípravků za období byly získány ze systému SAP Příklad: Sledování výtěžnosti

26 Vyhodnocení trendů Sledování středních hodnot a rozptylů Z tabulky je patrné, že Přípravek5 vykazuje za rok 2004 pokles výtěžnosti a změnu rozptylu. Proto provedeme analýzu pomocí regulačního diagramu X-individual. Nejdříve vytvoříme regulační diagram pro data za rok 2003.

27 Vyhodnocení trendů Regulační diagram Z grafu je patrné, že došlo zhruba po 100 šaržích ke změně ve výrobním postupu, proto je potřeba pro výpočet parametrů ustáleného stavu procesu vzít data pro šarže s pořadovým číslem větším než 100.

28 Vyhodnocení trendů Při tvorbě regulačního diagramu byly vypočteny následující hodnoty parametrů: ZL = 280,318 (výběrový průměr) s = 2,675 (výběrová směrodatná odchylka) LCL = 271,937 UCL = 288,700 Tyto vypočtené parametry byly použity pro regulační diagram z dat naměřených v roce 2004

29 Vyhodnocení trendů Červeně označené body indikují porušení jednoho nebo více z 8 pravidel regulačních diagramů. Kromě bodů mimo meze (kde se jednalo o výrobu na výjimku), se také jedná o šarže kolem pořadového čísla 300, kde je pro více než dvacet bodů porušeno pravidlo č.7 Patnáct hodnot je uvnitř intervalu ±s od základní linie Tento jev byl odůvodněn výrobou pod dohledem technologa z důvodů testování nového dodavatele suroviny.


Stáhnout ppt "Jištění kvality technologických procesů 12. Statistická analýza dat Richard Březina."

Podobné prezentace


Reklamy Google