Indukce Definice: nalezení obecných zákonitostí z příkladů. Původ slova: Z latinského INDUCTIO. Původně řecké slovo EPAGWGH. Česky návod. Rozdělení: Úplná Neúplná Indukce je přirozenou složkou lidské inteligence. Většina neslovních testů inteligence testuje schopnost indukce.
Test 1 2 3 612 804 088 285 826 528 062 365 593 168 116 126 654 891 493 079 091 369 066 030 330 348 382 821 051 315 808 667 609 136 052 958 968 170 305 445 244 294 787 860 467 557 729 391 738 910 935 822 200 816 306 711 845 979 506 514 428 905 394 616 339 362 766 598 674 312 981 470 300 337 877 694 718 213 763 674 356 565 664 634 860 202 263 688 314 888 013 575 097 227 361 709 421 887 496 417 606 644 468 010 010 897 611 985 040 322 371 057 874 815 639 651 372 840 992 023 880 535 415 901 304 992 355 644 507 128 280 750 369 425 268 157 290 791 347 885 563 982 889 819 689 571 763 059 770 583 280 390 910 590 549 434 120 720 598 368 770 754 093 884 079 548 396 700 873 366 992 398 052 485 746 862 356 203 547 211 716 567 758 628 494 399 282 251 355 596 535 689 861 010 117 598 005 204 357 684 748 955 991 093 161 285 295 393 633 139 068 677 175 015 910 306 596 652 711 893 809 817 067 548 098 729 118 959 281 627 156 939 245 542 840 605 142 433 591 975 497 402 800 973 381 282 560 051 141 577 490 534 308 272 931 569 141 394 936 352 625 778 788 094 511 922 216 555 179 196 842 517 071 247 806 272 316 081 994 767 135 693 686 061 377 048 854 954 941 243 600 324 726 467 812 928 611 079 780 105 256 045 577 657 585 194 992 506 807 318 808 373 386 593 196 338 519 200 672 925 916 796 317 339 500 988 793 461 857 909 246 325 468 577 395 516 986 363 241 712 009 968 794 422 968 529 831 492 120 900 636 088 592 525 976 746 397 137 394 744 041 244 436 986 885 445 921 115 643 740 568 362 136 556 837 994 874 893 427 089 446 808 000 794 480 570 596 233 392 132 787 004 291 512 097 635 251 107 747 240 355 624 411 587 275 948 690 542 586 396 237 742 809 042 412 080 217 504 207 741 726 927 754 821 553 545 281 674 074 814 384 915 418 119 911 694 123 746 385 322 619 436 416 440 343 026 541 605 976 930 006 494 291 480 271 821 078 564 819 498 828 816 879 327 699 972 282 813 054 721 848 893 147 903 612 951 821 256 554 206 803 460 911 394 120 373 839 539 987 673 957 213 547 813 674 854 167 099 391 226 353 200 890 475 747 326 246 224 615 799 938 028 696 833 057 506 497 132 798 324 493 425 369 004 638 208 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 ?
Řešení 1! 2!! 3!!! 4!!!! 5!!!!! …
Historie Politik: rozdělit množinu na dvě části tak, aby platilo: Obě části jsou přibližně stejně velké. Nejméně jedna část obsahuje příklady jednoho druhu. (nevyřčené pravidlo)
Je živočich suchozemský? Je živočich samosnubný? Historie Je živočich stádní? NE ANO Není člověk Je živočich suchozemský? NE ANO Není člověk Je živočich chodící? NE ANO Není člověk Je živočich bezrohý? NE ANO Není člověk Je živočich samosnubný? NE ANO Není člověk Má živočich 2 nohy? Klasifikace oškubaného kohouta: člověk NE ANO Není člověk Je člověk + má živočich široké nehty
Indukce jako filtrace Schéma Zdroj znalostí Úloha poruchy přesnost Testovací množina Trénovací množina Mez přetrénování přesnost složitost
Hladový algoritmus
Konstrukce rozhodovacích stromů TDIDT CLS Tycho de Brahe x Johannes Kepler
Algoritmus ID3 Vybereme náhodně podmnožinu z trénovací množiny (tzv. okno) Aplikuje CLS algoritmus Projde všechny příklady z příkladů, které nejsou v okně, a najde výjimky Když existují výjimky, pak vybere některé z nich a přidá je do okna a jde na krok 2. Jinak konec a strom je hotov
Prohledávání stavového prostoru ? A B C
Entropie Míra překvapení z výsledku náhodného pokusu. Požadavky na míru: Závisí pouze na pravděpodobnosti výsledku. S rostoucí pravděpodobností míra nejistoty klesá. Spojitá funkce. Nejistota předpovědi dvou nezávislých pokusů se sčítá. Neboli H(p1.p2) = H(p1) + H(p2) Jediný možný výsledek: H(p) = c . log(p), c < 0 Používaná míra: H(p) = -log2(p) [bit] EJ = - pi . log2(pi) [bit]
Kritérium výběru otázky Otázka 1. možnost odpovědi 2. možnost odpovědi N-tá. možnost odpovědi … J1 J2 JN Žádáme minimum kriteriální funkce Upozornění: Existují i jiná kritéria výběru otázky
Indukční systém - příklad Rozpoznávání druhu ovoce
Skutečná znalost požitá při konstrukci trénovací množiny Tvar Kulatý Hruškovitý Podlouhlý Kužel Velikost Hruška Okurka Velikost Velká Malá Malá Střední Pevnost Borůvka Malina Jahoda Měkké Pevné Rajče Jablko
Obr. Barva Velikost Tvar Pevnost Třída Červená Velká Kulatý Měkké Rajče Malá Kužel Malina Modrá Borůvka Zelená Střední Podlouhlý Pevné Okurka Hruškovitý Hruška Žlutá Jablko Jahoda
Minimum Tvar ? Je uzel list? Není! Musí být nalezena optimální otázka Minimum
Minimum Tvar Kulatý Hruškovitý Podlouhlý Kužel Barva ? ? ? ? Je uzel list? Není! Musí být nalezena optimální otázka Minimum
Minimum Tvar Kulatý Hruškovitý Podlouhlý Kužel Barva ? ? ? Červená Modrá Zelená Je uzel list? Pevnost ? ? ? Není! Musí být nalezena optimální otázka Minimum
Rajče Tvar Kulatý Hruškovitý Podlouhlý Kužel Barva ? ? ? Červená Modrá Zelená Je uzel list? Pevnost ? ? Je! Musí být vybráno rozhodnutí Měkké Pevné Rajče Rajče ? ?
Znalost odhadnutá pomocí trénovací množiny Tvar Kulatý Hruškovitý Podlouhlý Kužel Barva Hruška Okurka Velikost Malá Střední Červená Modrá Zelená Malina Jahoda Pevnost Borůvka Jablko Měkké Pevné Rajče Jablko
Odhadnutá znalost Rozdíly Skutečná znalost Počet pravidel = 8
Indukční systémy - příklad Aproximace funkce
Schéma Báze znalostí R1: xa1;b1 y = c1 R2: xa2;b2 y = c2 ... Rn: xan;bn y = cn x y Porucha k.sin(w.x) e N(0;0,1)
Kritérium optimální otázky: Kritérium ukončení: Kritérium optimální otázky: Výběr rozhodnutí: -3,02 -0,29 2,05 1,04 0,29 2,00 -0,01 2,29 0,34 2,68 3,27
Kritérium ukončení: Kritérium optimální otázky: Výběr rozhodnutí:
Indukční systémy - příklad Klasifikace obrazu
Klasifikace: voda x země Expertní systém [ X Y ] Klasifikace w Pravildo px: IF faktx AND f(x,y,qx) > 0 THEN fakt_důsledekx
Klasifikace obrazu Přesnost: 98,39 % Počet pravidel: 961
Příklad – aproximace funkce
Indukční systémy - příklad Klasifikace slova
Literatura Platón: Politikos Berka: Dobývání znalostí z databází Mařík a kol.: Umělá inteligence 1.