TriloByte Statistical Software

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Cvičení 9 – Ekonomická funkce nelineární v parametrech :
Dynamické systémy.
OBECNÉ OPTIMALIZAČNÍ MODELY
Qualimetrics: PLS, NN a regresní modely v řízení kvality REQUEST 2006 Karel Kupka, TriloByte, Pardubice, Czech Republic Centrum pro jakost a spolehlivost.
Rekonstrukce povrchu objektů z řezů Obhajoba rigorózní práce 25. června 2003 Radek Sviták
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
Lekce 1 Modelování a simulace
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
Lineární regresní analýza Úvod od problému
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
ROZHODOVACÍ PROCESY PRO VÍCECESTNÉ TELEMATICKÉ APLIKACE Filip Ekl
DOK „Umělá inteligence“ v DOK (i jinde). NEURONOVÉ SÍTĚ.
Využití umělých neuronových sítí k urychlení evolučních algoritmů
Metody zpracování vybraných témat (projektů)
FORMALIZACE PROJEKTU DO SÍŤOVÉHO GRAFU
Robustní vyrovnání Věra Pavlíčková, únor 2014.
Neuronové sítě Jakub Krátký.
Vícevrstvé neuronové sítě.  Neuronové sítě jsou složeny z neuronů tak, že výstup jednoho neuronu je vstupem jednoho nebo více neuronů  Propojení neuronů.
Získávání informací Získání informací o reálném systému
Růstové a přírůstové funkce
Obecný lineární model Analýza kovariance Nelineární modely
Základy ekonometrie Cvičení září 2010.
Systémy pro podporu managementu 2
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
Informační systémy TPS,MIS, SIS.
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
Dokumentace informačního systému
Proces řízení rizik.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Neuronové sítě Jiří Iša
Experimentální fyzika I. 2
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Rozhodovací proces, podpory rozhodovacích procesů
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
V experimentu měníme hodnotu jedné nebo několika veličin x i a studujeme závislost veličiny y. - např. měníme, ostatní x i bereme jako parametry ( , ,
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
Dita Matesová, David Lehký, Zbyněk Keršner
Hodnocení výstupů dynamických modelů Obsah předmětu: Počítačová podpora řízení Předmět : Počítačová podpora řízení K126 POPR Obor : E LS, 2015, K126 EKO.
Klasifikace a rozpoznávání
Neuronové sítě. Vývoj NS 1943 – W. McCulloch, W. Pittse – první jednoduchý matematický model neuronu 1951 – M. Minsky - první neuropočítač Snark 1957.
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Neuronové sítě.
Klasifikace a rozpoznávání Lineární klasifikátory.
IV..
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Aplikovaná statistika 2.
Obor: Chemie a chemické technologie Chemik: Co se děje s hmotou při chemických reakcích? Chemický inženýr: Co se děje v aparátech, tj. reaktorech a separátorech?
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
Základy zpracování geologických dat R. Čopjaková.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Ukládání dat biodiverzity a jejich vizualizace
Interpolace funkčních závislostí
MOLEKULOVÁ ABSORPČNÍ SPEKTROFOTOMETRIE v UV a viditelné oblasti spektra 2.
ANALÝZA A KLASIFIKACE DAT
Klasifikace a rozpoznávání
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Neuronové sítě.
Parciální korelace Regresní analýza
Lineární optimalizační model
Neuronové sítě.
MOLEKULOVÁ ABSORPČNÍ SPEKTROFOTOMETRIE v UV a viditelné oblasti spektra 2.
ANALÝZA A KLASIFIKACE DAT
Lineární regrese.
Interpolace funkčních závislostí
ANALÝZA A KLASIFIKACE DAT
Transkript prezentace:

TriloByte Statistical Software

Qualimetrics: PLS, NN a regresní modely v řízení kvality Karel Kupka, TriloByte, Pardubice, Czech Republic

Klasická regrese y = Xa X Y

Robustní regrese Predikce senzorického hodnocení plzeňského piva Lp – odhady LTS (least trimmed squares) odhady LMS (least median of squares) odhady M – odhady BIR – odhady (Bounded Influence Regression) Predikce senzorického hodnocení plzeňského piva Predikce fyzikálních vlastností materiálů Predikce biologické a biochemické aktivity

Robustní regrese (1) Regresní přímka Nejmenší čtverce Robustní M-odhad Welsh

Robustní regrese (2) Regresní polynom Nejmenší čtverce Robustní BIR-odhad

Robustní regrese (3) Predikce vlastnosti oceli Nejmenší čtverce Robustní M-odhad Welsh

Redukce dimenze – PCR (1) ortogonalizace hlavní komponenty X Q Y Snížení dimenzionality úlohy – snadnější interpretace Ortogonalizace maximálně zvyšuje stabilitu řešení Přesnější predikce

Redukce dimenze – PCR (2) Hlavní komponenty – komprese informace do minima proměnných

Tok dat v QC/Technologii

PLS: Partial Least Squares: relace mezi vícerozměrnými daty Na rozdíl od klasické regrese, v PLS regresních modelech jsou X a Y zaměnitelné – lze tedy korektně predikovat Y z X stejně jako X z Y. X Y

Metody kvalimetrie, možnosti PLS Data vystupující v technologiích jakosti mají téměř vždy vícerozměrný charakter, protože představují několik hodnot měřených současně nebo na jednom produktu. Metody analyzující taková data jako celek se proto nazývají vícerozměrné. Vycházejí z datových tabulek, které jsou obvykle k dispozici v excelu, nebo databázi. Tyto tabulky obsahují například vlastnosti vstupních surovin a okolností, naměřené, nebo nastavené hodnoty sledovaných veličin v různých fázích výrobního nebo obchodního procesu. Některé veličiny představují parametry jakosti. Nejjednodušší představa zahrnuje tabulky Vstupních dat (suroviny, zdroje, dodavatelé, vstupní přejímky), Procesních dat (výrobní podmínky, procesní parametry, mezioperační kontroly), Výstupních dat (specifikace, parametry kvality produktu, hodnocení odběratele).

X = TP + E Y = UQ + F Metodika a metody PLS Podstata Metody PLS Metody PLS jsou založené na syntéze principu příbuzném metodě hlavních komponent (PCA) a vícenásobné lineární regrese. Tato matematická metoda je využívána v ekonometrii, chemometrii, biometrii a v poslední době se objevují aplikace v kvalimetrii. Cílem metody je odhalit vztahy mezi vícerozměrnými daty v databázích a využít této znalosti k přibližnému výpočtu hodnot jedné skupiny veličin z druhé. Podstata Metody PLS Tabulku naměřených hodnot p veličin (sloupců) s n řádky označme jako matici X(n x p), a odpovídající tabulku se stejným počtem řádků n ale s q veličinami označme Y(n x q), Abychom extrahovali maximum informace z p- a q- rozměrných matic do prostoru s nižší dimenzí k, rozložíme X a Y na ortogonální matice T (n x k) a U (n x k), s koeficienty P a Q X = TP + E Y = UQ + F

Y = TBQ T = XP- U = TB BQ = R X = TP + E Y = TR + F T (n x k), U (n x k), k  min(p, q). Zajištění maximální relevance X-komponent pro Y, tyto transformace maximalizují kovariance mezi T a U. Dimenzionalita T a U je typicky menší než X a Y a sloupce T a U jsou ortogonální. To zlepší stabilitu modelu. Šum a irelevantní informace se koncentruje v „popelnicích“ E a F. Je-li k = p, pak E = 0. Dekompozice U = TB (B je čtvercová diagonální matice) poskytuje nástroj pro predikci Y z X: Y = TBQ T = XP- Kombinací tohoto a předchozích vztahů je zřejmý vztah (vnitřní lineární vazba mezi X a Y. U = TB BQ = R X = TP + E Y = TR + F T se konstruuje z nových dat X. Protože T = XP–, Y = XP–BQ, a tedy P–BQ reprezentuje originální (obecně vychýlené a zkrácené – tedy stabilnější) regresní parametry modelu Y = XA.

P X T E = + Q Y U F = + PREDIKCE X Y

Možnosti robustních modifikací PLS Robustifikace kovarianční matice Robustifikace metriky, neeikleudovská geometrie Classical X 1 2 3 4 5 6 7 8 9 10 Robust y

Na rozdíl od klasické lineární regrese jsou v PLS X a Y rovnocenné, tedy zaměnitelné – je jedno, kterou matici označíme X a kterou Y. Proto lze predikovat Y z X stejně jako X z Y. Je tedy PLS rovněž často používaným nástrojem pro lineární vícerozměrnou kalibraci. Y X

Vícerozměrná kalibrace Chemické složení (koncentrace, pH) Spektrum (absorbance) Látka 1 Látka 2 Látka 3 Látka 4 Koncentrace 1 Koncentrace 2 Koncentrace 3 Koncentrace 4 … l1 l2 l3 l4 0.394 0.383 0.351 0.337 …

Vícerozměrná kalibrace v QI/QP Suroviny, technologie, podmínky Parametry produktu Vlhkost Teplota Průtok Tlak 4.48 188 45.2 5.82 … Surface Quality Defor mation Hard ness Tensile Strength 0.394 0.0383 3.51 17.37 …

Zkrácený postup iterativního výpočtu PLS E = X; F = Y Krok 1. w ~ ETu (odhad X vah) Krok 2. t ~ Ew (odhad X skórů) Krok 3. q ~ FTt (odhad Y vah) Krok 4. u = Fq (odhad Y skórů) E = E – tT p; F = F – tT b q (oprava E,F)

Některé aplikace billineárních modelů Technologie: Procesní parametry  Fyzikální vlastnosti Technologie: Procesní parametry  Fyzikální vlastnosti Proces/chemické složení  Sensoric/Quality parametry Vstupní faktory  Výstupní kval/kvant -itativní vlastnosti Procesní podmínky  Výstupní kval/kvant -itativní vlastnosti Toxicology: Composition/Structure  Toxicity Health: Chemical Structure  Bioeffects Pollution: Composition  Origin/Source Pollution: Composition  Human health effects Environment: Environmental factors  Species diversity

Jakost - Řízení jakosti? Zlepšení jakosti? Měření jakosti - Kvantifikace! Porozumění vztahům! Sestavení fungujících modelů. Plánování jakosti.

Aplikace: Vlastnosti hliníkové slitiny Chemické složení Fyzikální vlastnosti

Aplikace: Vlastnosti piva Y X

Bi-Plot v PLS Dekompozice TP a UQ se dají využít pro konstrukci společného grafu skórů a zátěží Bi-Plot, který umožní omezené posouzení dat a proměnných pro X i Y.

Bi-Plot v PLS Identifikace obchodních příležitostí modifikací PLS v produkci piva Hic Sunt Leones

Design nového produktu - QP Požadované vlastnosti, X T = XP- Y = TBQ Predikované složení, Y

Modified robust PLS prediction models Přínos – Plánování a posuzování vývoje produktu Úspory při vývoji produktu Analýza a predikce příležitostí na trhu Výsledky – Nalezení vztahů mezi technologií a kvalitou Kvantitativní predikce vlastností

Aplikace NN jako statistického predikčního modelu Neuronové sítě Aplikace NN jako statistického predikčního modelu

Inspirace neuronové sítě Jádro Dendrity-dostředivé výběžky Axon-neurit Synaptické přípojky pro předání vzruchu

EM fotografie neuronu

Model neuronu a aktivační funkce Nejjednodušší aktivační funkce Rosemblatt 1962 – učící algoritmus PERCEPTRON složený z modelů neuronu ve dvou vrstvách (vstupní a výstupní). Vstupní vrstva dostává data z okolí a výstupní vrstva posílá informace ze sítě ven.Každý vstupní neuron je přímo spojen se všemi výstupními (vstupy a výstupy jsou binární –1,1). Perceptron dokáže řešit úlohu lineárně oddělitelné klasifikace. Pro lineárně neoddělitelné klasifikace pomocí perceptronů nefunguje

Některé další typy aktivační funkce

Logistická aktivační funkce

Jednovrstvá neuronová síť z = xi.wij σj+1, i (z) = 1/(1 + e – z) zi = a0 + Σaij zi-1,j Vstupní veličina xi je po normalizaci vážena vahou wji a v neuronu transformována aktivační funkcí σj+1, i (z) = 1/(1 + e – z), kde z je lineární kombinace vstupních veličin, zi = a0 + Σaijzi-1,j. Váhy wji představují vazbu mezi vstupní hodnotou a neuronem.

Vícevrstvé neuronové sítě Mc Clelland a Rumelhart 1986 trénování vícevrstvých ANN pomocí Backpropagation-BP (zpětné šíření). Možno řešit problémy lineárně neoddělitelné klasifikace.

Postup použití NN Volba vhodné struktury sítě (architektura) Trénování sítě na změřených datech (učení) Predikce pomocí NN

Návrh a trénování NN Počet skrytých vrstev pro většinu problémů stačí jedna zvětšování počtu vede k výraznému nárůstu počítačové náročnosti Počet neuronů ve skryté vrstvě rámcové pravidlo, že postačuje přirozený logaritmus počtu vstupů Architektura nejběžnější je plně propojená dopředná síť, logistická AF Velikost trénovací množiny postačující pro zobecnění a zaplnění prostoru dat při menším počtu dojde ke kopírování všech informací (interpolace) Možnost použití crossvalidace Počet vstupů odstranění parasitních proměnných je nezbytné Standardizace vstupů standardizace zlepšuji rychlost učení

Optimalizace NN Minimalizace součtu čtverců odchylek Vstup do výstupní vrstvy (uvažuje se pouze jeden výstup) je vážený součet všech aktivačních funkcí ve tvaru Predikce Cílem je nalézt váhy wji j = 1,…M, i = 1,…m, a Wj j = 1…M. Jde tedy o celkem M*(m+1) parametrů. To je vzhledem ke tvaru kritéria K řešitelné pomocí derivačních algoritmů nelineární regrese.Pokud označíme aktivační funkci symbolem F(.), lze kriteriální podmínku K pro určení vah vyjádřit ve tvaru

Pro řešení optimalizační úlohy pro Wij lze použít jednoduchou iterativní metodu založenou na výpočtu gradientu, kdy pro přírůstek platí

Postup při optimalizaci metodou BP

Aplikace NN pro predikci optických vlastností pigmentu Ln2 Zr(2-x) Mx O7 Ln = lanthanoids M = Cr or V x = 0.05 to 0.2 T = 1400 or 1500˚C L* a* b* dE* } barevné koordináty

Aplikace NN pro modelování kvality piva (1) Plzeňský pivovar X ... Chemie + technologie Y ... Subjektivní vlastnosti

Aplikace NN pro modelování kvality piva (2) Predikční schopnost modelu X -> Y X ... Chemie + technologie Y ... Subjektivní vlastnosti

Aplikace NN pro modelování kvality piva (3) Predikční schopnost modelu Y -> X X ... Chemie + technologie Y ... Subjektivní vlastnosti

Neuronové sítě a časové řady Model časové řady Jednorozměrný- xi = g(x1, x2, ... ,xi-2, xi-1) Vícekrokový- (xi, ..., xi+m) = g(x1, x2, ... ,xi-2, xi-1) Vícerozměrný- xi = h(x1, x2, ... ,xi-2, xi-1, C) AR ARMA ARIMA ARCH GARCH

Predikce kvality média, JE Dukovany

Discovery and data analysis system SOFTWARE ... Discovery and data analysis system

LITERATURA ...

LITERATURA ...

Vývoj, výzkum, podpora... TriloByte Statistical Software CQR, D&R

Jakost - Quality ReQuEst Na shledanou na Jakost - Quality ReQuEst 20. – 21. 3. 2007 30. 1 – 1. 2. 2007 PRAHA OSTRAVA