Úvod do teorie Bayesovských sítí aneb co bychom měli znát, chceme-li je používat Radim Jiroušek 1.

Slides:



Advertisements
Podobné prezentace
Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
Advertisements

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
Obchodní akademie a Střední odborná škola, gen. F. Fajtla, Louny, p.o.
Fakulta životního prostředí Katedra informatiky a geoinformatiky
TEORIE ROZHODOVÁNÍ A TEORIE HER
19.1 Odčítání v oboru do 100 s přechodem přes desítku
Aplikace teorie grafů Základní pojmy teorie grafů
Zabývá se různými způsoby výběru prvků z daného souboru.
Základy informatiky přednášky Kódování.
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Čísla 0 – 100, sčítání a odčítání
Fakulta životního prostředí Katedra informatiky a geoinformatiky Přednáška 05 Spojitost a derivace funkce Matematika II. KIG / 1MAT2.
Tomáš NETERDA 1961 Sportovní kariéra : plavecké třídy ZŠ Komenského gymnázium Dašická plavecká škola
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Zápis čísla v desítkové soustavě
Kdo chce být milionářem ?
Výzkumy volebních preferencí za ČR a kraje od
NÁSOBENÍ ČÍSLEM 10 ZÁVĚREČNÉ SHRNUTÍ
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
Druhá mocnina a odmocnina
Dělitelnost přirozených čísel
Nejmenší společný násobek
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
ČLOVĚK A JEHO SVĚT 2. Ročník - hodiny, minuty Jana Štadlerová ŽŠ Věšín.
ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
Krácení a rozšiřování postupného poměru.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Střední škola Oselce Škola: SŠ Oselce, Oselce 1, Nepomuk, Projekt: Registrační číslo: CZ.1.07/1.5.00/ Název: Modernizace.
Základní číselné množiny
Zábavná matematika.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Název školyIntegrovaná střední škola technická, Vysoké Mýto, Mládežnická 380 Číslo a název projektuCZ.1.07/1.5.00/ Inovace vzdělávacích metod EU.
Letokruhy Projekt žáků Střední lesnické školy a střední odborné školy sociální ve Šluknově.
Stav studie „Seroprevalence VHC u injekčních uživatelů drog“ k Národní monitorovací středisko pro drogy a drogové závislosti Úřad vlády ČR tel.
Střední škola Oselce Škola: SŠ Oselce, Oselce 1, Nepomuk, Projekt: Registrační číslo: CZ.1.07/1.5.00/ Název: Modernizace.
Jazyk vývojových diagramů
Nejmenší společný násobek, největší společný dělitel
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Únorové počítání.
III. Řešení úloh v testech Scio z matematiky
52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Náhoda, generátory náhodných čísel
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
SČÍTÁNÍ A ODČÍTÁNÍ V OBORU DO 100
Celá čísla Dělení.
DĚLENÍ ČÍSLEM 7 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ
ORIENTOVANÉ GRAFY V této části se seznámíme s následujícími pojmy:
Číslo projektu CZ.1.07/1.500/ Číslo materiálu VY_42_INOVACE_matematika_22 Název školy Táborské soukromé gymnázium, s. r. o. Autor Bc. Ivana Kotková.
24.1 Písemné sčítání dvojciferných čísel v oboru do 100
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Jazyk vývojových diagramů
Úkoly nejen pro holky.
Základní škola Podbořany, Husova 276, okres Louny
Mgr. et Mgr. Pavel Římovský, Bc. Jaroslav Mudrák
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Přednost početních operací
Téma: Dělení desetinných čísel 2 Vytvořila: Mgr. Martina Bašová VY_32_Inovace2/_095.
Slovní úlohy řešené soustavou rovnic
Predikce chemických posunů
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
KONTROLNÍ PRÁCE.
Gymnázium, Broumov, Hradební 218
Porovnání výroby a prodejů vozidel ve světě
Znázornění dopravní sítě grafem a kostra grafu Předmět: Teorie dopravy - cvičení Ing. František Lachnit, Ph.D.
1 Lineární (vektorová) algebra
Transkript prezentace:

Úvod do teorie Bayesovských sítí aneb co bychom měli znát, chceme-li je používat Radim Jiroušek 1

Reprezentace znalostí Příklad: Ředitelé jsou obvykle starší lidé

Věk ředitelů dle velikosti podniku Ředitel podniku Malého do 20 zaměstnanců Středního do 150 zaměstnanců Velkého se 150 a více zaměstnanci 20 – 30 64 28 8 31 – 40 122 172 68 41 – 50 204 236 102 51 + 228 366 402

Pravděpodobnostní distribuce reprezentující znalost věk Ředitel podniku Malého do 20 zaměstnanců Středního do 150 zaměstnanců Velkého se 150 a více zaměstnanci 20 – 30 0,032 0,014 0,004 31 – 40 0,061 0,086 0,034 41 – 50 0,102 0,118 0,051 51 + 0,114 0,183 0,201

Pravidla reprezentující částečné znalosti IF podnik má více než 150 zaměstnanců THEN ředitel má více než 50 let [69]

Pravidla reprezentující částečné znalosti IF podnik má více než 150 zaměstnanců THEN ředitel má více než 50 let [69] IF ředitel má méně než 50 let THEN podnik nemá více než 150 zaměstnanců [84]

Pravidla reprezentující částečné znalosti IF podnik má více než 150 zaměstnanců THEN ředitel má více než 50 let [69] IF ředitel má méně než 50 let THEN podnik nemá více než 150 zaměstnanců [84] IF ředitel je mezi 30 a 40 THEN podnik patří do střední třídy [47]

Pravděpodobnostní distribuce reprezentující znalost Závislost výskytu revmatických chorob a věku Věk Revmatická choroba Ano Ne ≤ 30 0,03 0,43 31 – 40 0,02 0,12 41 - 55 0,06 0,13 > 55 0,11 0,10

Pravděpodobnostní distribuce reprezentující znalost Závislost výskytu revmatických chorob, pohlaví a věku věk obezita Ano Ne Revmatická choroba ≤ 30 0,02 0,11 0,01 32 31 – 40 0,04 0,08 41 – 55 0,05 > 55 0,06 0,03 0,07

Kolikarozměrné distribuce můžeme ukládat?

Kolikarozměrné distribuce můžeme ukládat? S kolikarozměrnými distribucemi můžeme počítat?

Kolikarozměrné distribuce můžeme ukládat? S kolikarozměrnými distribucemi můžeme počítat? Reálné problémy vyžadují stovky veličin!

250-dimenzionální distribuce (tabulka) vyžaduje alespoň 2250 pravděpodobností

250-dimenzionální distribuce (tabulka) vyžaduje alespoň 2250 pravděpodobností Promiňte,

250-dimenzionální distribuce (tabulka) vyžaduje alespoň 2250 pravděpodobností Promiňte, pouze (2250 − 1) pravděpodobností

Zavedení bayesovské sítě na příkladu: Večerní procházka

Zavedení bayesovské sítě na příkladu: Večerní procházka Veličina W 3 hodnoty: Long walk (L) Short walk (S) No walk (N) pravděpodobnostní distribuce L S N .10 .20 .70

Večerní procházka Veličina R 3 hodnoty: Heavy rain (H) Drizzling (D) No rain (N)

Večerní procházka Veličina R 3 hodnoty: Heavy rain (H) Drizzling (D) No rain (N) pravděpodobnostní distribuce L S N H .00 .05 D .10 .15 .60

Minikurz (disktrétní) teorie pravděpodobnosti I Veličiny X,Y,Z konečné množiny hodnot X,Y,Z pravděpodobnostní distribuce π(x,y,z) Σ π(x,y,z) = 1. (x,y,z) є X×Y×Z

Minikurz (disktrétní) teorie pravděpodobnosti I Veličiny X,Y,Z konečné množiny hodnot X,Y,Z pravděpodobnostní distribuce π(x,y,z) Σ π(x,y,z) = 1. (x,y,z) є X×Y×Z Marginální distribuce: π(x), π(y,z),…

Minikurz (disktrétní) teorie pravděpodobnosti I Příklad: π (r,w) L S N H .00 .05 D .10 .15 .60

Minikurz (disktrétní) teorie pravděpodobnosti I Příklad: π (r,w) L S N H .00 .05 D .10 .15 .60 π (r) .05 .10 .85

Minikurz (disktrétní) teorie pravděpodobnosti I Příklad: π (r,w) L S N H .00 .05 D .10 .15 .60 π (r) .05 .10 .85 π (w) .10 .20 .70

Minikurz (disktrétní) teorie pravděpodobnosti I Podmíněná pravděpodobnostní distribuce π (x|y) π (x|y) π (y) = π (x,y)

Minikurz (disktrétní) teorie pravděpodobnosti I Podmíněná pravděpodobnostní distribuce π (x|y) π (x|y) π (y) = π (x,y) Nezávislost X ╨ Y [π] π(x) · π(y) = π(x,y).

Minikurz (disktrétní) teorie pravděpodobnosti I Podmíněná pravděpodobnostní distribuce π (x|y) π (x|y) π (y) = π (x,y) Nezávislost X ╨ Y [π] π(x) · π(y) = π(x,y). Tvrzení: X ╨ Y [π] π(x|y) = π(x)

Minikurz (disktrétní) teorie pravděpodobnosti I Příklad: π (r,w) L S N H .00 .05 D .10 .15 .60

Minikurz (disktrétní) teorie pravděpodobnosti I Příklad: π (r,w) L S N H .00 .05 D .10 .15 .60 π (w) L S N .10 .20 .70

Minikurz (disktrétní) teorie pravděpodobnosti I Příklad: π (r,w) L S N H .00 .05 D .10 .15 .60 π (w) L S N .10 .20 .70 π (rIw) L S N H .00 .07 D .25 1 .75 .86

Minikurz (disktrétní) teorie pravděpodobnosti I Příklad: π (r,w) L S N H .00 .05 D .10 .15 .60 π (w) L S N .10 .20 .70 π (rIw) L S N H .00 .07 D .25 1 .75 .86

Večerní procházka ® π1 (w) L S N .10 .20 .70 π2 (rIw) L S N H .00 .07 D .25 1 .75 .86 ® W

Bayesovská sít’ se 2 uzly - veličinami Večerní procházka π1 (w) L S N .10 .20 .70 π2 (rIw) L S N H .00 .07 D .25 1 .75 .86 ® W Bayesovská sít’ se 2 uzly - veličinami қ(r,w) = π 2(r|w) π 1(w)

Bayesovská sít’ se 2 uzly - veličinami Večerní procházka π1 (r) H D N .05 .10 .85 π2 (wIr) L S N H .00 1 D .50 .12 .18 .70 ® W Bayesovská sít’ se 2 uzly - veličinami қ(r,w) = π2(w|r) π1(r)

Večerní procházka Bayesovská sít’ π (r,w) L S N H .00 .05 D .10 .15 π2 (wIr) L S N H .00 D .50 .12 .18

Večerní procházka R C S .xx Veličina B 3 hodnoty: Rain (R) Changeable (C) Sunny (S) pravděpodobnostní distribuce R C S .xx

Večerní procházka Bayesovská sít’ se 3 uzly - veličinami π2(rIb) π3(wIr) W Bayesovská sít’ se 3 uzly - veličinami қ (b,r,w) = π1(b) π2(r|b) π3(w|r)

Večerní procházka Bayesovská sít’ se 3 uzly - veličinami π2(rIb) π3(wIr) W W Bayesovská sít’ se 3 uzly - veličinami қ (b,r,w) = π1(b) π2(r|b) π3(w|r) Paměťové nároky 3 × 3 × 3 − 1 = 26

Večerní procházka Bayesovská sít’ se 3 uzly - veličinami π2(rIb) π3(wIr) W W Bayesovská sít’ se 3 uzly - veličinami қ (b,r,w) = π1(b) π2(r|b) π3(w|r) Paměťové nároky 3 × 3 × 3 − 1 = 26 2 + 6 + 6 = 14

Minikurz (disktrétní) teorie pravděpodobnosti II Podmíněná nezávislost pro distribuci π(x,y,z) X ╨ Y|Z [π] π (x,y,z) · π(z) = π(x,z) ·π(y,z)

Minikurz (disktrétní) teorie pravděpodobnosti II Podmíněná nezávislost pro distribuci π(x,y,z) X ╨ Y|Z [π] π (x,y,z) · π(z) = π(x,z) ·π(y,z) Pro striktně pozitivní distribuce X ╨ Y|Z [π] π(x,y|z) = π(x|z) · π(y|z)

Minikurz (disktrétní) teorie pravděpodobnosti II Podmíněná nezávislost pro distribuci π(x,y,z) X ╨ Y|Z [π] π (x,y,z) · π(z) = π(x,z) ·π(y,z) Pro striktně pozitivní distribuce X ╨ Y|Z [π] π(x,y|z) = π(x|z) · π(y|z) Tvrzení: X ╨ Y|Z [π] π(x|y,z) = π(x|z)

Minikurz (disktrétní) teorie pravděpodobnosti II Příklad “příprava na zkoušku” X - čas strávený přípravou na zkoušku Y - výsledek zkoušky (známka) Z - počet bodů z testu X ╨ Y |Z [π] nebot’ π(y|x,z) = π(y|z).

Minikurz (disktrétní) teorie pravděpodobnosti II Příklad “večerní procházka” қ (b,r,w) = π1(b) π2(r|b) π3(w|r)

Minikurz (disktrétní) teorie pravděpodobnosti II Příklad “večerní procházka” қ (b,r,w) = π1(b) π2(r|b) π3(w|r) қ (b,r) = қ (b) қ (r|b) қ (b,r,w) = қ (b,r) қ (w|b,r)

Minikurz (disktrétní) teorie pravděpodobnosti II Příklad “večerní procházka” қ (b,r,w) = π1(b) π2(r|b) π3(w|r) қ (b,r) = қ (b) қ (r|b) қ (b,r,w) = қ (b,r) қ (w|b,r) = қ (b) қ (r|b) қ (w|r,b)

Minikurz (disktrétní) teorie pravděpodobnosti II Příklad “večerní procházka” қ (b,r,w) = π1(b) π2(r|b) π3(w|r) қ (b,r) = қ (b) қ (r|b) қ (b,r,w) = қ (b,r) қ (w|b,r) = қ (b) қ (r|b) қ (w|r,b) қ (w|r,b) = π3(w|r) = қ (w|r) W ╨ B|R[қ ]

Minikurz (disktrétní) teorie pravděpodobnosti II Příklad “večerní procházka” қ (b,r,w) = π1(b) π2(r|b) π3(w|r) қ (b,r) = қ (b) қ (r|b) қ (b,r,w) = қ (b,r) қ (w|b,r) = қ (b) қ (r|b) қ (w|r,b) қ (w|r,b) = π3(w|r) = қ (w|r) W ╨ B|R[қ ] Pamět’ové nároky: 3 × 3 × 3 − 1 = 26 2 + 6 + 6 = 14

Minikurz (disktrétní) teorie pravděpodobnosti II vlastnosti podmíněné nezávislosti Mohou nastat situace: (i) W ╨ B | R [қ] & W ╨ B [қ], (ii) X ╨ Y | Z [π] & X ╨ Y [π], (iii) X ╨ Y | Z [π] & X ╨ Y [π], (iv) X ╨ Y | Z [π] & X ╨ Y [π].

Minikurz (disktrétní) teorie pravděpodobnosti II Příklad “sousedova procházka” X - televizní program Y - počasí Z - sousedova procházka X ╨ Y ale X ╨ Y |Z.

Minikurz (disktrétní) teorie pravděpodobnosti II vlastnosti podmíněné nezávislosti (Ne)závislostní struktura: Nezávislostní struktura pravděpodobnostní distribuce π (x1,x2,. . . ,xn) je jednoznačně určena všemi trojicemi (Xi,Xj,{Xℓ} ℓєM), pro které platí Xi ╨ Xj|{Xℓ}ℓєM [π]

Večerní procházka π1(b) π2(rIb) π3(wIr) B R W Nezávislostní struktura pravděpodobnostní distribuce: B ╨ W |R [қ ] B ╨ W B ╨ R |W [қ ] B ╨ R R ╨ W |B [қ ] R ╨ W

Večerní procházka Veličina T 2 hodnoty: Interesting (I) Uninteresting (U) pravděpodobnostní distribuce I U .xx

Večerní procházka T B R W π1(b) π2(r|b) π3(w|t,r) π4(t) Graf bayesovské sítě se 4 uzly – veličinami қ(t,b,r,w) = π1(b)π2(r|b) π3(w|t,r) π4(t) 2 × 3 × 3 × 3 − 1 = 53 1 + 2 + 6 + 12 = 21

Večerní procházka Jaká je nezávislostní struktura distribuce қ (t,b,r,w) = π1(b) π2(r|b) π3(w|t,r) π4(t)

Večerní procházka Jaká je nezávislostní struktura distribuce қ (t,b,r,w) = π1(b) π2(r|b) π3(w|t,r) π4(t) T ╨ B [қ ] T ╨ R|B [қ ] B ╨ W|T,R [қ ] T ╨ R [қ ] B ╨ T|R [қ ] B ╨ W|R [қ ] Nezávislostní struktura snižující počet parametrů z 53 na 21

Večerní procházka Y N .xx Veličina G 2 hodnoty: Yes (Y ) No (N) pravděpodobnostní distribuce Y N .xx

Večerní procházka G T B R π1(b) π2(r|b) π3(w|t,g,r) π4(g|b) π5(t) W Graf bayesovské sítě s 5 uzly – veličinami қ (t,g,b,r,w) = π1(b) π2(r|b) π3(w|t,g,r) π4(g|b) π5(t) 2 × 2 × 3 × 3 × 3 − 1 = 107 2 + 6 + + 1 + 3 = 36 24

Večerní procházka T G B D R W

Večerní procházka Y N .xx Pomocná veličina D 2 hodnoty: Yes (Y ) No (N) pravděpodobnostní distribuce Y N .xx

Večerní procházka T G B π1(b) π2(r|b) π3(w|d,r) π4(g|b) π5(t) π6(d|t,g) D R D Graf bayesovské sítě se 6 uzly – veličinami қ (t,g,b,d,r,w) = π1(b) π2(r|b) π3(w|d,r) π4(g|b) π5(t) π6(d|t,g) 2 × 2 × 3 × 2 × 3 × 3 − 1 = 215 2 + 6 + 12 + 3 + 1 + 4 = 28

Definice bayesovské sítě Bayesovská sít’ je uspořádaná dvojice 1. Acyklický orientovaný graf G = (V,E), jehož uzlům jsou jednoznačně přiřazeny veličiny {Xi}iєV

Definice bayesovské sítě Bayesovská sít’ je uspořádaná dvojice 1. Acyklický orientovaný graf G = (V,E), jehož uzlům jsou jednoznačně přiřazeny veličiny {Xi}iєV 2. Systém podmíněných pravděpodobnostních distribucí { πi(xi|(xℓ )ℓєpa(i))}iεV .

Definice bayesovské sítě Bayesovská sít’ je uspořádaná dvojice 1. Acyklický orientovaný graf G = (V,E), jehož uzlům jsou jednoznačně přiřazeny veličiny {Xi}iєV 2. Systém podmíněných pravděpodobnostních distribucí { πi(xi|(xℓ )ℓєpa(i))}iεV . Tato bayesovská sít’ reprezentuje pravděpodobnostní distribuci қ ((xℓ )ℓєV) =π πi(xi|(xℓ) ℓєpa(i) ) iєV

Bayesovská sít’ 1 2 3 4 5 6 7 8 Graf bayesovské sítě s 8 veličinami

Bayesovská sít’ 1 2 3 π1(x1) π2(x2) π3(x3) π4(x4|x1,x2) π5(x5|x2,x3) 6 7 8 Graf bayesovské sítě s 8 veličinami

Bayesovská sít’ 1 2 3 π1(x1) π2(x2) π3(x3) π4(x4|x1,x2) π5(x5|x2,x3) π6(x6|x4) π7(x7|x5) π8(x8|x6,x7) 4 5 6 7 8 Graf bayesovské sítě s 8 veličinami қ(x1,. . . x8) = π1(x1) π2(x2) π3(x3) π4(x4|x1,x2) . . . π8(x8|x6,x7)

Vlastnosti bayesovské sítě 1. қ ((xℓ )ℓєV) = πiєV πi(xi|(xℓ)ℓєpa(i)) je vždy pravděpodobnostní distribucí.

Vlastnosti bayesovské sítě 1. қ ((xℓ )ℓєV) = πiєV πi(xi|(xℓ)ℓєpa(i)) je vždy pravděpodobnostní distribucí. 2. Distribuce қ ((xℓ )ℓєV) je konsistentní se všemi zadanými pravděpodobnostními distribucemi: i є V (қ (xi|(xℓ )ℓєpa(i)) = πi(xi|(xℓ )ℓєpa(i))). A

Vlastnosti bayesovské sítě 1. қ ((xℓ )ℓєV) = πiєV πi(xi|(xℓ)ℓєpa(i)) je vždy pravděpodobnostní distribucí. 2. Distribuce қ ((xℓ )ℓєV) je konsistentní se všemi zadanými pravděpodobnostními distribucemi: i є V (қ (xi|(xℓ )ℓєpa(i)) = πi(xi|(xℓ )ℓєpa(i))). A 3. Nezávislostní struktura distribuce қ ((xℓ ) ℓ є pa(i)) obsahuje všechny podmíněné nezávislosti určené grafem G: Necht’ {1,2,3,. . . ,n} = V je uspořádání (očíslování) uzlů V takové, že rodiče jsou vždy před svými dětmi (i є pa(j)  i < j), potom pro všechna i = 2,3,. . . ,n. Xi ╨ (Xj){1,...,i−1}\pa(i)|(Xℓ )ℓ єpa(i).

Bayesovská sít’ X2 ╨ X1 X3 ╨ X1,X2 X4 ╨ X3|X1,X2 X5 ╨ X1,X4|X2,X3 uspořádání uzlů splňuje uvedenou podmínku,a proto X2 ╨ X1 X3 ╨ X1,X2 X4 ╨ X3|X1,X2 X5 ╨ X1,X4|X2,X3 X6 ╨ X1,X2,X3,X5|X4 X7 ╨ X1,X2,X3,X4,X6|X5 X8 ╨ X1,X2,X3,X4,X5|X6,X7 1 2 3 4 5 6 7 8 Graf bayesovské sítě s 8 veličinami қ (x1,. . . x8) = π(x1) π (x2) π(x3) π(x4|x1,x2) . . . π(x8|x6,x7)

d-separace 1. Cestou spojující uzly i a j budeme rozumět buď hranu spojující i a j (tedy bud’ (i → j) nebo (i ← j)), nebo zřetězení dvou cest: cesty spojující i a k neprocházející uzlem j s cestou spojující k a j neprocházející uzlem i. (Cesta tedy může obsahovat jednu hranu několikrát.)

Bayesovská sít’ 1 2 3 4 5 6 7 8 1 4 2 5 7

Bayesovská sít’ 1 2 3 4 5 6 7 8 1 4 2 5 7 2 4 6 8 7

Bayesovská sít’ 1 2 3 4 5 6 7 8 1 4 2 5 7 2 4 6 8 7 1 4 6 8 6 4 2 5 3

d-separace 1. Cestou spojující uzly i a j budeme rozumět bud’ hranu spojující i a j (tedy bud’ (i → j) nebo (i ← j)), nebo zřetězení dvou cest: cesty spojující i a k neprocházející uzlem j s cestou spojující k a j neprocházející uzlem i. (Cesta tedy může obsahovat jednu hranu několikrát.) U každého výskytu uzlu k na cestě spojující i a j nastává jedna z následujících tří možností: • uzel k je průchozí, jedná-li se o zřetězení nebo , • uzel je odstředný, jedná-li se o zřetězení , • uzel je dostředný, jedná-li se o zřetězení . k k k k

d-separace 1. Cestou spojující uzly i a j budeme rozumět bud’ hranu spojující i a j (tedy bud’ (i → j) nebo (i ← j)), nebo zřetězení dvou cest: cesty spojující i a k neprocházející uzlem j s cestou spojující k a j neprocházející uzlem i. (Cesta tedy může obsahovat jednu hranu několikrát.) U každého výskytu uzlu k na cestě spojující i a j nastává jedna z následujících tří možností: • uzel k je průchozí, jedná-li se o zřetězení nebo , • uzel je odstředný, jedná-li se o zřetězení , • uzel je dostředný, jedná-li se o zřetězení . k k k k 2. Necht’ M  V \{i,j}. Říkáme,že množina M blokuje cestu spojující uzly i a j, jestliže na uvažované cestě existuje uzel k є M, který je průchozí nebo odstředný, nebo na ní existuje uzel ℓ є M, který je dostředný.

Bayesovská sít’ 1 2 3 4 5 M = ø 6 7 8 1 4 2 5 7 2 4 6 8 7 1 4 6 8 6 4 2 5 3

Bayesovská sít’ 1 2 3 4 5 M = {4,5} 6 7 8 1 4 2 5 7 2 4 6 8 7 1 4 6 8 6 4 2 5 3

Bayesovská sít’ 1 2 3 4 5 M = {5,8} 6 7 8 1 4 2 5 7 2 4 6 8 7 1 4 6 8 6 4 2 5 3

d-separace Cestou spojující uzly i a j budeme rozumět bud’ hranu spojující i a j (tedy (i → j) nebo (i ← j)), nebo zřetězení dvou cest: cesty spojující i a k neprocházející uzlem j s cestou spojující k a j neprocházející uzlem i. (Cesta tedy může obsahovat jednu hranu několikrát.) U každého výskytu uzlu k na cestě spojující i a j nastává jedna z následujících tří možností: • uzel k je průchozí, jedná-li se o zřetězení nebo , • uzel je odstředný, jedná-li se o zřetězení , • uzel je dostředný, jedná-li se o zřetězení . k k k k 2. Necht’ M  V \{i,j}. Říkáme, že množina M blokuje cestu spojující uzly i a j, jestliže na uvažované cestě existuje uzel k є M, který je průchozí nebo odstředný,nebo na ní existuje uzel ℓ є M, který je dostředný. 3. Necht’ M  V \ {i,j}. Říkáme, že množina M d-separuje uzly i a j, jestliže blokuje všechny cesty spojující i a j.

Tvrzení o podmíněné nezávislosti v bayesovských sítích Jsou-li dva uzly i, j є V v grafu bayesovské sítě d-separovány množinou uzlů M  V, pak Xi ╨ Xj | {Xℓ }ℓ є M.

Bayesovská sít’ 1 2 3 4 5 4 5 Cesty spojující a 6 7 8 4 2 5 4 6 8 7 5

Bayesovská sít’ 1 2 3 4 5 1 2 Cesty spojující a 6 7 8 1 4 2 1 4 6 4 2

Bayesovská sít’ 1 2 3 4 5 1 5 Cesty spojující a 6 7 8 1 4 2 5 1 4 6 8

Otázka: Existují dvě bayesovské sítě s různými grafy, které mají stejnou závislostní strukturu?

(Souvislé) bayesovské sítě o třech uzlech π1(x1) π2(x2|x1) π3(x3|x1,x2) 1 2 3

(Souvislé) bayesovské sítě o třech uzlech 1 2 π1(x1) π2(x2|x1) π3(x3|x1,x2) π1(x2) π2(x3|x2) π3(x1|x2,x3) 3 1 2 3

(Souvislé) bayesovské sítě o třech uzlech 1 2 3 π1(x1) π2(x2|x1) π3(x3|x2) π1(x3) π2(x2|x3) π3(x1|x2) π1(x2) π2(x3|x2) π3(x1|x2) π1(x1) π2(x3) π3(x2|x1,x3) 1 2 3 1 2 3 1 2 3

Tvrzení o ekvivalenci struktur bayesovských sítí Dva acyklické orientované grafy definují stejnou nezávislostní strukturu, jestliže: 1. hrany spojují stejné dvojice uzlů; 2. mají stejné “imorality”.

Bayesovské sítě o třech uzlech a třech hranách 1 2 3 1 2 3

Bayesovské sítě o třech uzlech a dvou hranách 1 2 3 1 2 3 1 2 3 1 2 3

Další příklad ekvivalentních bayesovských sítí 1 2 1 2 3 4 3 4 5 6 7 5 6 7 8 9 8 9

Přednosti bayesovských sítí 1.Umí modelovat skutečně složité situace 3 4 X1 ╨ X2 X1 ╨ X2|X3 X1 ╨ X2|X3,X4 X1 ╨ X2|X3,X4,X5 X1 ╨ X2|X3,X4,X5,X6 X1 ╨ X2|X3,X4,X5,X6,X7 5 6 1 7 8 2 9 10 11 12

Přednosti bayesovských sítí 1.Umí modelovat skutečně složité situace 2. Obecný pravděpodobnostní model - zahrnuje některé další, jako speciální případ Naivní Bayes i, j є {2,3,. . . ,7}, i  j Xi ╨ Xi | X1 2 3 A 4 1 5 6 7

Přednosti bayesovských sítí 1. Umí modelovat skutečně složité situace 2. Obecný pravděpodobnostní model – zahrnuje některé další, jako speciální případ 3. Dostupný software umožňuje pracovat s poměrně velkými sítěmi HUGIN, NETICA

Problémy spojené s používáním bayesovských sítí většina je spojena s orientací hran:

Problémy spojené s používáním bayesovských sítí většina je spojena s orientací hran: Kauzální interpretace

Problémy spojené s používáním bayesovských sítí většina je spojena s orientací hran: Kauzální interpretace Nejednoznačnost grafu definujícího nezávislostní strukturu zvyšuje složitost při učení

Problémy spojené s používáním bayesovských sítí většina je spojena s orientací hran: Kauzální interpretace Nejednoznačnost grafu definujícího nezávislostní strukturu zvyšuje složitost při učení Problémy při výpočtech: výpočty se provádějí v jiném typu modelu; před prováděním výpočtů je třeba bayesovskou sít’ převést na rozložitelný model

Rozložitené modely Jiný typ grafického markovského modelu (definovaný neorientovaným grafem) Potřebujeme, umět číst podmíněné nezávislosti z neorientovaného grafu,

Definice separování Mějme neorientovaný graf G = (V,E), dva různé uzly i,j є V a množinu uzlů M  V \ {i,j}. Říkáme,že uzly i a j jsou separovány množinou M, jestliže každá cesta z i do j obsahuje alespoň jeden uzel z M. 1 2 3 4 5 6 7

Definice separování Mějme neorientovaný graf G = (V,E),dva různé uzly i,j є V a množinu uzlů M V \ {i,j}. Říkáme,že uzly i a j jsou separovány množinou M, jestliže každá cesta z i do j obsahuje alespoň jeden uzel z M. UI 1 2 3 a jsou separovány ø 1 7 4 5 6 7

Definice separování Mějme neorientovaný graf G = (V,E),dva různé uzly i,j є V a množinu uzlů M V \ {i,j}. Říkáme,že uzly i a j jsou separovány množinou M, jestliže každá cesta z i do j obsahuje alespoň jeden uzel z M. UI 1 2 3 a jsou separovány ø a jsou separovány 1 7 4 5 2 3 5 6 7

Definice separování Mějme neorientovaný graf G = (V,E),dva různé uzly i,j є V a množinu uzlů M V \ {i,j}. Říkáme,že uzly i a j jsou separovány množinou M, jestliže každá cesta z i do j obsahuje alespoň jeden uzel z M. UI 1 2 3 a jsou separovány ø a jsou separovány 1 7 4 5 2 3 5 6 7 5 6 1 4 7

Definice kliky Mějme neorientovaný graf G = (V,E). Klikou nazýváme každou maximální množinu jeho uzlů, ve které je každá dvojice spojena hranou. 1 2 3 4 5 6 7

Definice kliky Mějme neorientovaný graf G = (V,E). Klikou nazýváme každou maximální množinu jeho uzlů, ve které je každá dvojice spojena hranou. Seznam klik 1 1 2 3 2 4 5 3 5 4 5 4 6 6 7 5 7 6 7

Definice rozložitelného (triangulovaného) grafu Neorientovaný graf G = (V,E) nazýváme rozložitelný (triangulovaný) Jestliže: 1. neobsahuje cyklus délky větší než 3, který nemá tětivu 2. jeho kliky C1,C2,. . . ,Cm je možno uspořádat tak, že splňují RIP  i = 3,. . . ,m  k (1 ≤ k < i) (Ci ∩ (C1 U. . . U Ci−1)  Ck).

Definice rozložitelného (triangulovaného) grafu Neorientovaný graf G = (V,E) nazýváme rozložitelný (triangulovaný) Jestliže: 1. neobsahuje cyklus délky větší než 3, který nemá tětivu 2. jeho kliky C1,C2,. . . ,Cm je možno uspořádat tak, že splňují RIP  i = 3,. . . ,m  k (1 ≤ k < i) (Ci ∩ (C1 U. . . U Ci−1)  Ck). 1 2 3 Seznam klik: 1 2 4 5 4 5 3 5 4 6 6 7 5 7 6 7

Definice rozložitelného (triangulovaného) grafu Neorientovaný graf G = (V,E) nazýváme rozložitelný (triangulovaný) Jestliže: 1. neobsahuje cyklus délky větší než 3, který nemá tětivu 2. jeho kliky C1,C2,. . . ,Cm je možno uspořádat tak, že splňují RIP  i = 3,. . . ,m  k (1 ≤ k < i) (Ci ∩ (C1 U. . . U Ci−1)  Ck). 1 2 3 Seznam klik: 1 3 5 4 5 5 6 7 2 4 5 6 7 4 5 6

Definice rozložitelného (triangulovaného) grafu Neorientovaný graf G = (V,E) nazýváme rozložitelný (triangulovaný) Jestliže: 1. neobsahuje cyklus délky větší než 3, který nemá tětivu 2. jeho kliky C1,C2,. . . ,Cm je možno uspořádat tak, že splňují RIP  i = 3,. . . ,m  k (1 ≤ k < i) (Ci ∩ (C1 U. . . U Ci−1)  Ck). 1 2 3 Seznam klik: 4 5 6 3 5 4 5 2 4 5 1 6 7 5 6 7

Definice rozložitelného (triangulovaného) grafu Neorientovaný graf G = (V,E) nazýváme rozložitelný (triangulovaný) Jestliže: 1. neobsahuje cyklus délky větší než 3, který nemá tětivu 2. jeho kliky C1,C2,. . . ,Cm je možno uspořádat tak, že splňují RIP  i = 3,. . . ,m  k (1 ≤ k < i) (Ci ∩ (C1 U. . . U Ci−1)  Ck). 1 2 3 Seznam klik: 3 5 2 4 5 4 5 1 5 6 7 6 7 4 5 6

Tvrzení o jednoznačnosti rozložitelného modelu Necht’ C1,C2,. . . ,Cm jsou kliky rozložitelného grafu G = (V,E). Jsou-li π1((xi)iєC1), π2((xi)iєC2),. . . , πm((xi)iєCm) po dvojicích konsistentní pravděpodobnostní distribuce, pak existuje právě jedna distribuce қ ((xi)iєV), pro kterou platí: (i)  j = 1,. . . ,m қ ((xi)iєCj ) = πj((xi)iєCj ); (ii) jsou-li i a j v G separovány množinou M, pak Xi ╨ Xj|{Xk}kєM [қ].

Tvrzení o jednoznačnosti rozložitelného modelu Necht’ C1,C2,. . . ,Cm jsou kliky rozložitelného grafu G = (V,E). Jsou-li π1((xi)iєC1), π2((xi)iєC2),. . . , πm((xi)iєCm) po dvojicích konsistentní pravděpodobnostní distribuce, pak existuje právě jedna distribuce қ ((xi)iєV), pro kterou platí: (i)  j = 1,. . . ,m қ ((xi)iєCj ) = πj((xi)iєCj ); (ii) jsou-li i a j v G separovány množinou M, pak Xi ╨ Xj|{Xk}kєM [қ]. Jsou-li navíc kliky C1,C2,. . . ,Cm uspořádány tak, že splňují RIP, pak қ ((xi)iєV ) = πj=1,…,m πj((xi)iєCi\(C1U...UCi−1)|(xi)iєCi∩(C1U... UCi−1)).

Lokální výpočty dle Lauritzena a Spiegelhaltera Převedení bayesovské sítě na rozložitelný model moralizace triangularizace

Bayesovská sít’ 1 2 3 4 5 6 7 8

Moralizovaný graf 1 2 3 4 5 6 7 8

Triangularizovaný (rozložitelný) graf 1 2 3 4 5 6 7 8

Bayesovská sít’ rozložitelný graf 1 2 3 1 2 3 4 5 4 5 6 7 6 7 8 8

Bayesovská sít’ rozložitelný graf 1 2 3 1 2 3 4 5 4 5 6 7 6 7 8 8 Čím platíme za výpočty výhodnější tvar? Větší paměťové nároky: 1+1+1+4+4+2+2+4=19 7+7+7+7+7+7=42

Bayesovská sít’ rozložitelný graf 1 2 3 1 2 3 4 5 4 5 6 7 6 7 8 8 Čím platíme za výpočty výhodnější tvar? Větší paměťové nároky: 1+1+1+4+4+2+2+4=19 7+7+7+7+7+7=42 „ztráta“ řady podmíněných nezávislostí

Shrnutí

Shrnutí 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností

Shrnutí 2. Distribuce reprezentovaná sítí je součin 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí

Shrnutí 3. Tato distribuce má speciální závislostní 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem

4. Nezávislosti umíme zjistit pomocí d-separačního Shrnutí 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem 4. Nezávislosti umíme zjistit pomocí d-separačního pravidla

Shrnutí 5. Při konstrukci sítě je nutno udržet počet 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem 4. Nezávislosti umíme zjistit pomocí d-separačního pravidla 5. Při konstrukci sítě je nutno udržet počet rodičů jednotlivých uzlů “malý”

6. Za tím účelem můžeme zavést “umělé” uzly Shrnutí 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem 4. Nezávislosti umíme zjistit pomocí d-separačního pravidla 5. Při konstrukci sítě je nutno udržet počet rodičů jednotlivých uzlů “malý” 6. Za tím účelem můžeme zavést “umělé” uzly

7. Můžeme též otáčet hrany aniž bychom změnili Shrnutí 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem 4. Nezávislosti umíme zjistit pomocí d-separačního pravidla 5. Při konstrukci sítě je nutno udržet počet rodičů jednotlivých uzlů “malý” 6. Za tím účelem můžeme zavést “umělé” uzly 7. Můžeme též otáčet hrany aniž bychom změnili strukturu sítě

8. Výpočty provádíme pomocí vhodných programů Shrnutí 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem 4. Nezávislosti umíme zjistit pomocí d-separačního pravidla 5. Při konstrukci sítě je nutno udržet počet rodičů jednotlivých uzlů “malý” 6. Za tím účelem můžeme zavést “umělé” uzly 7. Můžeme též otáčet hrany aniž bychom změnili strukturu sítě 8. Výpočty provádíme pomocí vhodných programů (HUGIN, NETICA)

Shrnutí 9. Výpočty se neprovádí v bayesovské síti, 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem 4. Nezávislosti umíme zjistit pomocí d-separačního pravidla 5. Při konstrukci sítě je nutno udržet počet rodičů jednotlivých uzlů “malý” 6. Za tím účelem můžeme zavést “umělé” uzly 7. Můžeme též otáčet hrany aniž bychom změnili strukturu sítě 8. Výpočty provádíme pomocí vhodných programů (HUGIN,NETICA) 9. Výpočty se neprovádí v bayesovské síti, ale v rozložitelném modelu

Děkuji Vám za sledování této přednášky Shrnutí 1. Bayesovská sít’ je dvojice: acyklický graf a systém podmíněných pravděpodobností 2. Distribuce reprezentovaná sítí je součin zadaných podmíněných distribucí 3. Tato distribuce má speciální závislostní strukturu popsanou grafem 4. Nezávislosti umíme zjistit pomocí d-separačního pravidla 5. Při konstrukci sítě je nutno udržet počet rodičů jednotlivých uzlů “malý” 6. Za tím účelem můžeme zavést “umělé” uzly 7. Můžeme též otáčet hrany aniž bychom změnili strukturu sítě 8. Výpočty provádíme pomocí vhodných programů (HUGIN,NETICA) 9. Výpočty se neprovádí v bayesovské síti,ale v rozložitelném model Děkuji Vám za sledování této přednášky

Literatura doporučená k dalšímu studiu 1. Jensen, Finn V.: Introduction to Bayesian Networks. UCL Press, London,1996. 2. Jensen, Finn V.: Bayesian Networks and Decision Graphs. Springer Verlag,2001. 3. Lauritzen, Stephen L.: Graphical Models. Clarendon Press, Oxford, 1996. 4. Neapolitan, Richard E.: Learning Bayesian Networks. Prentince Hall, Upper Saddle River, NJ, 2003.