Strojové učení prof. Olga Štěpánková.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

LOGISTICKÉ SYSTÉMY 14/15.
Videotrénink interakcí
Stavový prostor. • Existují úlohy, pro které není k dispozici univerzální algoritmus řešení • různé hry • problém batohu, problém obchodního cestujícího.
HYPERTEXT PREPROCESSOR. PROGRAMOVÁNÍ. DEFINICE POJMŮ Problém Problém nevyřešený, nežádoucí stav obvykle vyžaduje nějaké řešení Neřešitelný problém Neřešitelný.
Základy informatiky přednášky Kódování.
Vypracoval: Ladislav Navrátil, EI-4 Umělá inteligence Zaměření Expertní systémy.
Induktivní logické programování
Strojové učení I (Mitchell93) učicí množina příkladů hledáme generalizaci učicí množiny ověřujeme na testovací množině pokrytí, přesnost, F-kriterium.
ADT Strom.
20. Metody zpracování digitálních dat dálkového průzkumu
Informatika pro ekonomy II přednáška 1
Základní číselné množiny
Adéla Masopustová Alena Seifrtová Lukáš Hůla
5. Přednáška funkce BRVKA Johann P.G.L. Dirichlet (1805 – 1859)
Řadicí algoritmy autor: Tadeáš Berkman.
Rozšíření dotazu a vývoj tématu v IR Jiří Dvorský Jan Martinovič Václav Snášel.
Fuzzy logika.
Popis časového vývoje Pohyb hmotného bodu je plně popsán závislostí polohy na čase. Otázkou je, jak zjistit vektorovou funkci času ~r (t), která pohyb.
Systémy pro podporu managementu 2
Informatika pro ekonomy II přednáška 10
Modelování a simulace MAS_02
Predikátová logika.
Interpretace výsledků modelových výpočtů
Artificial Intelligence (AI).  „Úloha patří do oblasti umělé inteligence, jestliže řešení, které najde člověk považujeme za projev jeho inteligence.
Dokumentace informačního systému
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ FAKULTA STROJNÍ ÚSTAV PŘÍSTROJOVÉ A ŘÍDICÍ TECHNIKY ODBOR AUTOMATICKÉHO ŘÍZENÍ A INŽENÝRSKÉ INFORMATIKY Aplikace objektově.
Inteligentní agenti. Agent vnímá své okolí prostřednictvím senzorů zasahuje do okolí prostřednictvím efektorů člověk, robot, softwarový agent Racionální.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Filtrace web stránek s využitím profilu uživatele Petr Doskočil
Umělá inteligence Minského definice: UI je věda o vytváření strojů nebo systémů, které budou při řešení určitého úkolu užívat takového postupu, který –
Vlny Přenos informace? HRW kap. 17, 18.
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Rozhodovací stromy.
Odhad metodou maximální věrohodnost
Databázové modelování
Teorie her pro manažery, redistribuční systémy Mikroekonomie magisterský kurz - VŠFS Jiří Mihola, Téma 6.
D S P V D I A G N O S T I C E A Ř Í Z E N Í AUTOR : Ing. Zdeněk Macháček PROJEKT : Digitální signálové procesory v diagnostice a řízení.
Rozpoznávání v řetězcích
Databázové systémy Informatika pro ekonomy, př. 18.
Využití ontologií při dobývání znalostí z databází Hana Češpivová.
Automatizovaná podpora výběru nástroje pro dobývání znalostí Jakub Štochl.
Mlhavost Fuzzy logika, fuzzy množiny, fuzzy čísla
Autor: ING. HANA MOTYČKOVÁ
Přehled metod umělé inteligence a její historie (bakalářská práce) Vedoucí práce: Ing. Ladislav Beránek, CSc., MBA Vypracoval: Michal Jelínek.
VÝUKOVÉ METODY Přehled.
Plánování trajektorie pro bezpilotní letoun za účelem sledování pozemních objektů pomocí inerciálně stabilizované kamerové platformy Michal Kreč Vedoucí.
Kvantitativní metody výzkumu v praxi
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Reprezentace znalostí
Univerzita třetího věku kurz Znalci Databáze 1.
11/2003Přednáška č. 41 Regulace výpočtu modelu Předmět: Modelování v řízení MR 11 (Počítačová podpora) Obor C, Modul M8 ZS, 2003, K126 EKO Předn./Cvič.:
Teorie her pro manažery, redistribuční systémy Mikroekonomie magisterský kurz - VŠFS Jiří Mihola, Téma 5.
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Chemický experiment. Školní a vědecký experiment Školní experiment: Dříve řešený problém Známý výsledek pro experimentátora Vyvození výsledku na základě.
Lineární funkce Rozdělení lineárních funkcí Popis jednotlivých funkcí.
Přenos informace? HRW2 kap. 16, 17 HRW kap. 17, 18.
Praha & EU: Investujeme do vaší budoucnosti Evropský sociální fond Gymnázium, Praha 10, Voděradská 2 Projekt OBZORY DIFERENCIÁLNÍ POČET VE FYZICE.
NÁZEV ŠKOLY:SOŠ Net Office, spol. s r.o. Orlová Lutyně
Inteligentní agenti.
Vytváření pracovních míst – jejich analýza a popis
Definiční obor a obor hodnot
Projekt Impuls / Seminář
Informatika pro ekonomy přednáška 8
Mgr. Helena Hubatková Selucká VIKBB35 Podpora čtenářství – podzim 2013
Modelování Transportních Procesů 2
Induktivní postupy ve výuce matematiky
Vlny Přenos informace? HRW2 kap. 16, 17 HRW kap. 17, 18.
Algoritmizace a datové struktury (14ASD)
Transkript prezentace:

Strojové učení prof. Olga Štěpánková

Úvod a motivace Jak vznikají soubory pravidel pro „expertní systém“? Můžeme nějak automatizovat jejich tvorbu? Naše stroje jsou nedokonalé: ·        potřebují údržbu ·        selhávají (hroutí se), ... Rádi bychom dostali varování předem. Konstruktér (tvůrce) předem zná – tuší, co jeho stroj potřebuje, ale co běžný uživatel? Můžeme běžného uživatele vybavit souborem jednoduchých instrukcí "co dělat, když"? ·        Jak by měly tyto instrukce vypadat? ·        Jak je můžeme vytvořit?

Získávání odpovídajících znalostí pro reálné UI aplikace je tak náročné, že mnohdy může být řešení "hrubou silou" (t.j. prohlédnutím všech možných alternativ) úspěšnější, např. koncovka hry v šachy. Obtíže při získávání znalostí? ·        Znalost v odborných publikacích je vyjádřená pomocí náročných abstraktních pojmů (iniciativa, dobře chráněný král,...). ·        V některých situacích či prostředích není člověk schopen popsat a zdůvodnit slovy své rozhodnutí. Přesto však jeho rozhodnutí „funguje“. ·        .... Není možné pojmy a strategie řešení předávat pomocí příkladů? Mohou se stroje učit z příkladů?

Typy učení ·   získávání dovedností - skill refinement (plavání, jízda na kole, ...) ·   získávání znalostí (hodnocením zkušeností) – knowledge acquisition zapamatování zkušeností - Rote Learning (hry jako šachy, dáma), mechanické učení - využívá např. heuristické hodnotící funkce stavu hry, která se postupně v průběhu hry upřesňuje v navštívených stavech tak, že se tyto rozvíjejí do omezené hloubky a jako hodnocení rozvíjeného stavu se používá hodnota získaná metodou MIN-MAX případové usuzování - Case-Based Reasoning: rozhodnutí vzniká jako modifikace rozhodnutí použitého dříve pro „velmi podobný případ“ – potřebuje bohatou zásobu již vyřešených případů přijímáním rad od rádce - Advice Taking, obtíž může být v "interpretaci" nebo "operacionalizaci" abstraktní rady – hledají se „podmínky použití“ analýzou rozdílů: „Winstonova brána“ – hypotéza se konfrontuje s klasifikovanými příklady a postupně se upravuje (pokud hypotéza pokývá negativní příklad => specializace, pokud hypotéza nepokrývá pozitivní příklad => zobecnění) učení z příkladů (s učitelem, hledání skrytého významu v datech, ...) - klasifikace (do známých tříd), vytváření vhodných konceptů ve formě hypotéz ·        ....  

Cíl induktivního strojového učení Na základě omezeného vzorku příkladů E+ a E-, charakterizovat (popsat) zamýšlenou skupinu objektů (koncept) tak, aby navržený popis co nejlépe odpovídal právě jen prvkům reprezentujícím koncept, tj. prvkům z E+ byl použitelný pro určení i objekty mimo E

Koncept a hypotéza Koncept = reálně existující třída objektů vymezená na známém definičním oboru (např. 3D vektory reálných čísel). Objekty klasifikujeme podle toho, zda ke konceptu patří nebo nepatří. Obvykle známe jen konečnou množinu příkladů prvků daného konceptu (pozitivní příklady), případně i množinu prvků, které ke konceptu nepatří (negativní příklady), t.j. trénovací množinu konceptu. Trénovací množina konceptu popisuje koncept implicitně (t.j. pomocí příkladů). Hypotéza = pokus o formální charakterizaci konceptu, např. formule ve výrokové logice (pravidla) nebo množina aritmetických výtazů, která má být splněna. Hypotéza je pokus o explicitní popis konceptu.

Koncept a hypotéza Koncept = reálně existující třída objektů vymezená na známém definičním oboru (např. 3D vektory reálných čísel). Objekty klasifikujeme podle toho, zda ke konceptu patří nebo nepatří. Obvykle známe jen konečnou množinu příkladů prvků daného konceptu (pozitivní příklady), případně i množinu prvků, které ke konceptu nepatří (negativní příklady), t.j. trénovací množinu konceptu. Trénovací množina konceptu popisuje koncept implicitně (t.j. pomocí příkladů). Hypotéza = pokus o formální charakterizaci konceptu, např. formule ve výrokové logice (pravidla) nebo množina aritmetických výtazů, která má být splněna. Hypotéza nabízí explicitní popis konceptu.

Které hypotézy hledáme? Hypotéza je        konsistentní, když nepokrývá žádný negativní příklad.        úplná, když pokrývá všechny pozitivní příklady. Hledáme konsistentní a úplnou hypotézu pro daná trénovací data. Trénovací data by měla mít stejnou distribuci jako všechna data o uvažované úloze. Jen to je zárukou toho, že hypotéza bude „většinou správně“ přiřazovat klasifikaci datům, které nebyla mezi trénovacími daty.

Konzistentní hypotéza úplná (complete) neúplná (incomplete)

Nekonzistentní hypotéza úplná (complete) neúplná (incomplete)

Prostor hypotéz pro daný koncept je tvořen pravidly, která jsou výsledkem učení z příkladů. Tento prostor je částečně uspořádaný a má maximální i minimální prvek: ·        Libovolný popis 1 konkrétního prvku z trénovací množiny do všech podrobností představuje nejspeciálnější hypotézu ·        Nejobecnější hypotéza (maximální prvek) pokrývá všechny možné (positivní i negativní) příklady   Operace v prostoru hypotéz: Specializace, Generalizace: Při hledání nejlepší hypotézy lze postupovat podobně jako při prohledávání stavového prostoru, t.j. shora dolů či sdola nahoru

Příklad 1 „počítačová hra“ Příklad 1 „počítačová hra“. Můžeme se naučit roboty rozlišit na základě krátké zkušenosti? přátelští nepřátelští

kravata ano ne Usmívá_se tělo ano ne 3úh. jiné přítel nepřítel nepřítel přítel

Jak zvolit "nejlepší" atribut? Rozdělíme-li množinu S na podmnožiny S1,S2, ...,Sn na základě hodnot diskrétního atributu at. Měření množství informace uvnitř Si def. pomocí entropie (Shanon)        H(Si) = -pi+ log pi+ - pi- log pi-,   kde pi+ je pravděpodobnost, že libovolný příklad v Si je pozitivní (pi+ se odhaduje jako odpovídající frekvence). Celková entropie H(S,at) tohoto systému je H(S,at) = åni=1 P(Si) H(Si), kde P(Si) je pravděpodobnost události Si, tj. poměr |Si| / |S|. Zvolíme atribut at s minimální entropií H(S,at).

Indukce rozhodovacího stromu z trénovcí množiny dáno: S ... trénovací množina (množina klasifikovaných příkladů) 1. Nalezni "nejlepší" atribut at (t.j. atribut, jehož hodnoty nejlépe diskriminují mezi pozitivní a neg. příklady) a tím ohodnoť kořen vytvářeného stromu. 2. Rozděl množinu S na podmnožiny S1,S2, ...,Sn podle hodnot atributu at a pro každou množinu příkladů Si vytvoř nový uzel jako následníka právě zpracovávaného uzlu (kořenu) 3. Pro každý nově vzniklý uzel s přiřazenou podmnožinou Si proveď: Jestliže všechny příklady v Si mají tutéž klasifikaci (všechny jsou pozitivní  nebo všechny jsou negativní), pak uzel ohodnocený Si je prohlášen za list vytvářeného rozhodovacího stromu (a tedy se už dále nevětví), jinak jdi na bod 1 s tím, že S : = Si.

mls.felk.cvut.cz/mldemo Popsaný algoritmus postupuje metodou TDIDT: Top-Down Induction of Decision Trees Označuje se často jako ID3 (indution of decision tree) - Quinlan konec 80tých let Jednoduché experimentální prostředí: mls.felk.cvut.cz/mldemo Linky k řadě systémů strojového učení http://labe.felk.cvut.cz/~zelezny/ml-res/

Příklad: Létání na simulátoru F16 Úkol: sestavit řídící systém pro ovládání leteckého simulátoru F16 tak, aby splnil předem definovaný plán letu daný takto: 1. vzlet a výstup do výšky 2000 stop 2. let v dané výšce směrem N do vzdálenosti 32000 stop od místa startu 3. zahnout vpravo v kurzu 330° 4. ve vzdálenosti 42000 stop od místa startu (ve směru S-N) provést obrat vlevo a zamířit zpět do místa startu, obrat je ukončen při kurzu mezi 140° a 180° 5 vyrovnat směr letu s přistávací dráhou, tolerance 5° pro kurz a 10° pro výchylku křídel oproti horizontu 6. klesat směrem k počátku přistávací dráhy 7. přistát Trénovací data: 3x30 letů (od 3 pilotů). Každý let popsán pomocí 1000 záznamů (poloha a stav letounu, pilotem provedený řídící zásah)

Záznam: Poloha a stav on_gound boolean: je letadlo na zemi? g_limit boolean: je překročen g limit letadla? wing_stall boolean: je letadlo stabilní? twist integer: 0°-360°, výchylka křídel vůči obzoru elevation integer: 0°-360°, výchylka trupu vůči obzoru azimuth integer: 0°-360°, směr letu roll_speed integer: 0°-360°, rychlost změny výchylky křídel [°/s] elev_speed integer: 0°-360°, rychlost změny výchylky trupu [°/s] azimuth_speedinteger: 0°-360°, rychlost změny kurzu [°/s] airspeed integer: rychlost letadla v uzlech climbspeed integer: rychlost změny výšky [stop/s]

Záznam: Poloha a stav + Řízení E/W distance real: vzdálenost ve směru východ-západ od místa startu N/S distance real: vzdálenost ve směru sever-jih od místa startu fuel integer: váha paliva v librách Řízení:   rollers real: nastavení ovladače horizontálního vychýlení elevator real: nastavení ovladače vertikálního vychýlení thrust integer: 0-100%, plyn flaps integer: 0°, 10° nebo 20°, nastavení křídlových lopatek Každá ze 7 fází letu vyžaduje vlastní typ řízení (jiné zásahy pilota): trénovací příklady rozděleny do 7 odpovídajících skupin. V každé skupině je zkonstruován zvlášť rozhodovací strom pro každý typ řídícího zásahu (rollers, elevator, thrust, flaps), t.j. 7 x 4 stromů

Příklad 2 „počítačová hra“. Hypotéza a volba jazyka přátelští nepřátelští