2. cvičení 20.10.2015 1.1.2019.

Slides:



Advertisements
Podobné prezentace
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová II. Vzorce v Excelu Tipy pro práci s Wordem.
Advertisements

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Nalezení nejkratší vzdálenosti mezi uzly dopravní sítě Předmět: Teorie dopravy - cvičení.
Školení MS Word 2007 pro začátečníky RNDr. Milan Zmátlo MěÚ Třebíč, říjen 2011 Vzdělávání v eGON centru Třebíč Tento.
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Školení MS Excel 2007 pro začátečníky RNDr. Milan Zmátlo MěÚ Třebíč, listopad-prosinec 2010 Vzdělávání v eGON centru.
Pořízení dat Databázové funkce Řazení Filtrování Souhrny Kontingenční tabulky Kontingenční grafy.
Inf Tabulkový procesor - funkce. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT.
Zlepšování podmínek pro výuku technických oborů a řemesel Švehlovy střední školy polytechnické Prostějov registrační číslo : CZ.1.07/1.1.26/
Experimentální metody oboru – Pokročilá tenzometrie – Měření vnitřního pnutí Další využití tenzometrie Měření vnitřního pnutí © doc. Ing. Zdeněk Folta,
NÁZEV ŠKOLY: Masarykova základní škola a mateřská škola Melč, okres Opava, příspěvková organizace ČÍSLO PROJEKTU:CZ.1.07/1.4.00/ AUTOR:Mgr. Vladimír.
Úvod do programování 9. hodina RNDr. Jan Lánský, Ph.D. Katedra informatiky a matematiky Fakulta ekonomických studií Vysoká škola finanční a správní 2015.
Výpočetní technika VY_32_INOVACE_12_16_Excel. Excel Tabulkový procesor pro vytváření tabulek a grafů Pochází z kancelářského balíku Microsoft Office Nejčastěji.
Základní škola a Mateřská škola, Liberec, Barvířská 38/6, příspěvková organizace Název : VY_32_inovace_07 Informatika - MS Excel – Vkládání vzorců Autor:
Základní škola T. G. Masaryka a Mateřská škola Poříčany, okr. Kolín VY_32_INOVACE_M_11 Obrázkové řady, logika Zpracovala: Mgr. Květoslava Štikovcová Číslo.
Definice: Funkce f na množině D(f)  R je předpis, který každému číslu z množiny D(f) přiřazuje právě jedno reálné číslo. Jinak: Nechť A, B jsou neprázdné.
Microsoft Excel verze 2010 Mgr. Přemysl Kejzlar.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J
Microsoft Office Excel – práce s tabulkami a analýzy
Základy MS Excel Vytvoření tabulky.
VÝRAZY Matematické zápisy obsahující čísla (konstanty), písmena (proměnné) a početní operace ČÍSELNÉ S PROMĚNNOU √25 2.(4-7.8) 3x+7 4a3- 2a.
Mocniny, odmocniny, úpravy algebraických výrazů
ŠKOLA: Městská střední odborná škola, Klobouky u Brna,
Lineární funkce - příklady
STATISTICKÉ METODY V GEOGRAFII
Název: Trojúhelník Autor:Fyrbachová
Průvodní list Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT   Vzdělávací materiál: Prezentace – zápis pro žáky Určen pro: 2. ročník oboru.
2. cvičení
Excel – tabulkový procesor
NÁZEV ŠKOLY: ZŠ J. E. Purkyně Libochovice
Výpočty trojúhelníků v hodinách analytické geometrie
Inf Tabulkový procesor - formátování
Databáze MS ACCESS 2010.
Procvičení vzorců a funkcí v rámci jednoho i více listů
Maďarská metoda Kirill Šustov Michal Bednář Stanislav Běloch
Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice,
Obchodní akademie, Střední odborná škola a Jazyková škola s právem státní jazykové zkoušky, Hradec Králové Autor: Mgr. Lubomíra Moravcová Název materiálu:
3. cvičení
Parametry polohy Modus Medián
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
Rozšířené modely časových řad
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J
Název školy: Základní škola a mateřská škola Dolní Bojanovice, okres Hodonín příspěvková organizace Číslo projektu: CZ.1.07/1.4.00/ Označení materiálu:
Stavební fakulta ČVUT, B407
BIBS Informatika pro ekonomy přednáška 2
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Průvodní list Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT   Vzdělávací materiál: Prezentace – zápis pro žáky Určen pro: 2. ročník oboru.
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
DIGITÁLNÍ UČEBNÍ MATERIÁL
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Konstrukce trojúhelníku
Základní statistické pojmy
VY_32_INOVACE_VJ36.
Teorie chyb a vyrovnávací počet 1
Tabulkový procesor Síť buněk, do kterych lze vkládat údaje – číselné, textové, datové i logické. Jeho podstatou jsou vzorce pomocí kterých zpracováváme.
KOMBINACE BEZ OPAKOVÁNÍ
Průvodní list Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT   Vzdělávací materiál: Prezentace – zápis pro žáky Určen pro: 2. ročník oboru.
Dynamické programování Úloha batohu neomezená
Lineární funkce a její vlastnosti
Informatika – Základní operace s buňkami
Více náhodných veličin
K-mapa: úvod a sestavení
… jak přesně počítat s nepřesnými čísly
Grafy kvadratických funkcí
Seminář o stavebním spoření
Algoritmizace a datové struktury (14ASD)
Teorie chyb a vyrovnávací počet 2
Slovní úlohy o společné práci − 3
Tečné a normálové zrychlení
Konstrukce trojúhelníku
Transkript prezentace:

2. cvičení 20.10.2015 1.1.2019

Obsah Úvod Principy asociace ve vícerozměrném prostoru Euklidovská vzdálenost, Manhattan distance Odvodit asociační matici 5x5 Pythagorova věta (excel, R) Soubory z předchozího příkladu, ale oříznuté jen na dvě proměnné Pomocí makra v excelu horní trojúhelníkovou matici zlinearizovat a vykreslit do histogramu Soubor s množstvím bodů (opět např. města) Odvodit asociační matici nxn vzdušnou čarou Odvodit asociační matici nxn po silnici Ukázat opět xy graf a komentář, že jde o značně obtížnější problém Horní trohúhelníkové matice zlinerizovat a dát do xy grafu proti sobe 1.1.2019

Úvod do vícerozměrných metod I. Vícerozměrné metody: Název vícerozměrné vychází z typu vstupních dat, tato data jsou tvořena jednotlivými objekty (i.e. klienti) a každý z nich je charakterizován svými parametry (věk, příjem atd.) a každý z těchto parametrů můžeme považovat za jeden rozměr objektu. Maticová algebra: Základem práce s daty a výpočtů vícerozměrných metod je maticová algebra, matice tvoří jak vstupní, tak výstupní data a probíhají na nich výpočty. NxP matice: N objektů s p parametry pak vytváří tzv. NxP matici, která je prvním typem vstupu dat do vícerozměrných analýz. Asociační matice: Na základě těchto matic jsou počítány matice asociační na nichž pak probíhají další výpočty, jde o čtvercové matice obsahující informace o podobnosti nebo rozdílnosti (tzv. metriky) buď objektů (Q mode analýza) nebo parametrů (R mode analýza).Měřítko podobnosti se liší podle použité metody a typu dat, některé metody umožňují použití uživatelských metrik. 1.1.2019

Úvod do vícerozměrných metod II. SHLUKOVÁ ANALÝZA ORDINAČNÍ METODY vytváření shluků objektů na základě jejich podobnosti identifikace typů objektů zjednodušení vícerozměrného problému do menšího počtu rozměrů principem je tvorba nových rozměrů, které lépe vyčerpávají variabilitu dat 1.1.2019

Vstupní matice vícerozměrných analýz NxP MATICE ASOCIAČNÍ MATICE Hodnoty parametrů pro jednotlivé objekty Korelace, kovariance, vzdálenost, podobnost 1.1.2019

Asociace ve vícerozměrném prostoru Data Vícerozměrný prostor Asociační matice 1.1.2019

Příklad výpočtu asociační matice Asociační matice euklidovských vzdáleností mezi rostlinami 1.1.2019

Vzdálenosti měst ČR 1.1.2019

=3*log(A1) Vzorce v Excelu vpisují se do buněk sešitu vzorce jsou vždy uvozeny = (lze též + -) aritmetické operátory + zabudované funkce Excelu pro „sčítání“ nečíselných položek se používá & výpočet je založen buď na číselných konstantách nebo odkazech na buňky konstanta zabudovaný vzorec Excelu =3*log(A1) uvození vzorce odkaz na buňku

$A$1 Vzorce v Excelu – odkazy na buňku – styl A1 Relativní odkazy A1 = buňka 1. řádku sloupci A A1:B6 = blok buněk – levý horní roh je v 1. řádku, sloupec A, pravý dolní na řádku 6, sloupec B relativní odkaz se při automatickém vyplnění buněk vzorcem posune Absolutní odkaz – odkaz na buňku je pevně dán, při kopírování nebo automatickém vyplnění se nemění, lze uzamknout jak řádky, tak sloupce samostatně uzamčení řádku $A$1 uzamčení sloupce

Maticové vzorce v Excelu výpočty z matic dat zadávání je ukončeno stiskem CTRL+SHIFT+ENTER Vzorec je založen na těchto dvou maticích dat {=SUMA(A17:A23*B17:B23)} Násobení řádků matic Celkové sečtení Nezbytné pro operace s maticemi.

Měření vzdálenosti objektů Minkowski (power distance) Euklidovská vzdálenost Vážená euklidovská vzdálenost - celé číslo =1 Manhattan (city block) = 2 Euklidovská vzdálenost Chebychev i,j – označení objektů dij – vzdálenost objektů i a j p – počet parametrů k – k-tý parametr wk – váha parametru k

Měření podobnosti objektů Binární koeficienty podobnosti Objekt 1 Objekt 2 1 a b c d a, b, c, d = počet případů, kdy souhlasí binární charakteristika objektu 1 a 2 a+b+c+d=p Symetrické binární koficienty - není rozdíl mezi případem 1-1 a 0-0 Hamman, Yule coefficient, Pearson’s  (phi) a další koeficienty Simple matching coefficient

Asymetrické binární koeficienty – odstranění double zero Jaccard`s coefficient Sorensen`s coefficient Řada dalších koeficientů dávajících různou váhu jednotlivým kombinacím parametrů

Kvantitativní koeficienty Obdoby binárních koeficientů pro více parametrů než 0/1 Simple matching coefficient pro více parametrů p=počet parametrů Gowerův koeficient Zahrnutí podobnosti podle různých typů parametrů – binární, kvalitativní a semikvantitativní i kvantitativní (odlišný výpočet pro jednotlivé typy). Celkový součet podobností je podělen počtem parametrů. Může zahrnovat podmínku nepočítat s chybějícími parametry – Kronecker`s delta. Více informací a další měření vzdáleností a podobností najdete v knize LEGENDRE, P. & LEGENDRE, L. (1998). Numerical ecology. Elseviere Science BV, Amsterodam.