Určování geografického původu hudby Petr Palko Mária Běhalová Jan Hakl Václav Steiger.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

MALUJEME ZÁKLADNÍ VZDĚLÁVÁNÍ, INFORMAČNÍ
Rekonstrukce povrchu objektů z řezů Obhajoba rigorózní práce 25. června 2003 Radek Sviták
Mechanika s Inventorem
SMS brána Eurotel Jednoduché OCR pomocí neuronových sítí Marek Kukačka
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
Je to metoda využívající principů týmové práce, která zvyšuje účinnost tvůrčího myšlení cílem je získat co nejvíce nápadů k řešenému problému, které budou.
Filtr významnosti jako framework pro prezentační vrstvu
Komprese barev Jakub Gemrot Ondřej Burkert. Popis problému Běžné obrázky mají 16,7 mil. barev Běžné obrázky mají 16,7 mil. barev Problém: Jak je rozumně.
OvzdusiSQL Kvasar, spol. s r. o.. Obsah Opravy Novinky Nastavení programu Nastavení pro IT Export hlášení ISPOP Karta měření Karta emise Možnosti importů.
Dlouhodobá maturitní práce studentů Tomáše Kurce & Jana Kuželky
Příprava plánu měření pro lopatku plynové turbíny
Teorie psychodiagnostiky a psychometrie
STÁTNÍ ÚZEMÍ je prostor, který je tvořen pevninským územím, geologickým podkladem, teritoriálními vodami, vzdušným prostorem i územími velvyslanectví,
KEG Použití vzorů při vyhledávání na webu Václav Snášel.
Informační a komunikační technologie 8. ročník Multimédia – nastavení počítače Bohumil Bareš.
KOMPETENČNÍ MODEL DŮLEŽITÝ PRVEK ŘÍZENÍ LIDÍ
Plán testů Tým FelPay. Testování a kvalita obecně Přispívá ke správné funkci systému Přispívá ke správné funkci systému Snižuje finanční a časové ztráty.
Cyklické kódy Přednáška 6. Perfektní kód A.Opravuje největší množství chyb B.Má nejvíce kódových slov C.Má nejlepší poměr počet chyb/délka kódu.
Název projektu : Objevujeme svět kolem nás Reg. číslo projektu: CZ.1.07/1.4.00/
Problematika lavin Lavinu lze definovat jako každý náhlý a rychlý sesuv sněhové hmoty na dráze delší jak 50m. Sesuvy na kratší vzdálenosti se nazývají.
DIGITALIZACE Datové formáty. Nekomprimované formáty původní algoritmy záznamu datových souborů umožnily pouze jejich převod do digitální podoby:  formát.
Tvorba grafu funkce Použití freewarových programů: MathGv Funkce
Lineární regresní analýza
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Kartografie Zeměpisné souřadnice, GPS Typy kartografických zobrazení
TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií Tento materiál vznikl v rámci projektu ESF CZ.1.07/2.2.00/
Multimédia Multimediální prezentace Ročník: 8 Předmět: Informační a komunikační technologie Učitel: Vojtěch Novotný Téma: Multimédia 1 Ověřeno ve výuce:
Bc. Ivana Řezníková ČVUT Fakulta stavební Praha 6 Thákurova 7
Problémy s češtinou České znaky se standardně nepovažují za alfanumerické znaky (\w) Vadí to při třídění vyhodnocování regulárních výrazů Je třeba použít.
POLOHA, ROZLOHA A LIDNATOST
Integrovaný regionální knihovní systém 3. generace Ing. Petr Štefan, Kp-sys s.r.o. Pardubice.
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK 4. Mapování a redukce dimenze 1. část – úvod + mapování vektorových sad.
Projektový cyklus, analýza SWOT
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Marketingový průzkum Milan Mrázek Matematika & Business
Afrika – poloha, rozloha
Datové formáty Název školyGymnázium Zlín - Lesní čtvrť Číslo projektuCZ.1.07/1.5.00/ Název projektuRozvoj žákovských kompetencí.
GIS systémy a ArcGIS Engine
Multimédia Žlutířová Eva.
(řešení pomocí diskriminantu)
Cenová mapa podnájmů v Praze Ondřej Kmoch Tomáš Kohan
Neuronové sítě.
Číslo projektu: CZ.1.07/1.4.00/ Název DUM: Programy pro multimédia Číslo DUM: III/2/VT/2/2/33 Vzdělávací předmět: Výpočetní technika Tematická oblast:
MS PowerPoint Pokročilé efekty a práce s multimédii.
Uvedení autoři, není-li uvedeno jinak, jsou autory tohoto výukového materiálu a všech jeho částí. Tento projekt je spolufinancován ESF a státním rozpočtem.
Ovládací panely Šablona 32 VY_32_INOVACE_1_7_Windows-ovládací panely.
Inf Ztrátová a bezztrátová komprese zvuku. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
VY __III/2__ INOVACE __237. Autor DUMAlena Kopřivová Datum (období) vzniku DUM Ročník a typ školy6. ročník základní školy praktické ŠVP„Učíme.
ANALYTICKÁ KARTOGRAFIE OpenJUMP – základní nástroje export vybraných prvků do nové vrstvy –Replicate Selected Items – Replicate to new Layer.
Číslo projektu OP VK Název projektu Moderní škola Název školy Soukromá střední škola podnikání a managementu, o.p.s. Předmět Zeměpis (klíčová.
Jako jedna z částí úkolu Podpora gramotnosti, který řeší VÚP v Praze. Matematická gramotnost RNDr. Eva Zelendová.
Inf Formáty zvukových souborů a videosouborů. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
Informační a komunikační technologie 11. WIN - pracovní plocha Autor : RNDr. Zdeněk Bláha.
Rastrová grafika Základní termíny – Formáty rastrové grafiky.
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Název školy: ZŠ NETVOŘICE, OKRES BENEŠOV
Výukový materiál zpracován v rámci projektu
Název školy: Základní škola Městec Králové Autor: Mgr. Petr Novák
Amerika – Austrálie – Evropa Asie –Afrika - Antarktida
Číslo projektu: CZ.1.07/1.4.00/ Název DUM: Programy pro multimédia
Inf Formáty grafických souborů
František Pavlík Tvorba DMT z dat laserového scanování (DMR 4G a DMR 5G) v prostředí ArcGIS Výzkumný ústav vodohospodářský T. G. Masaryka, v.v.i.
Neuronové sítě.
POLOHA ČESKÉ REPUBLIKY
TVORBA VIDEA Pinnacle Studio Michal Přidálek 3ma
zpracovaný v rámci projektu
STÁTNÍ ÚZEMÍ je prostor, který je tvořen pevninským územím, geologickým podkladem, teritoriálními vodami, vzdušným prostorem i územími velvyslanectví,
Neuronové sítě.
Škola Katolické gymnázium Třebíč, Otmarova 22, Třebíč Název projektu
Transkript prezentace:

Určování geografického původu hudby Petr Palko Mária Běhalová Jan Hakl Václav Steiger

O čem budeme mluvit? I. Formulace problému II.Řešení problému III.Diskuze výsledků

I. Formulace problému Nalezení geografické polohy vzniku skladby Použití neuronové sítě Výstup: srozumitelný, GIS Dvojí data: Naučení sítě na datasetu Použití sítě nad daty získanými svépomocí

II. Řešení problému Toolchain: Python: learn.py Pybrain Dataset 1059*68 feat. Neural net.xml Python: use.py Pybrain Basemap Matplotlib.pyplot Traditional song (Youtube) VLC media player convert stream stream -> wav Marsyas bextract wav -> weka features file Python : prep.py Weka feat.file -> dataset-like file MAPA

II.Řešení problému Dataset Získán z lidových písní z 33 zemí světa Každá popsána 68 features + lat,lon hlavního města státu Zastoupení zemí:

Řešení problému: learn.py Pythonovský program, síť pomocí Pybrain Regresní přístup – aproximujeme bod na mapě, neurčujeme pravděpodobnost zařazení do státu Při vývoji testováno na trénovacím datasetu, po dosažení nejlepších výsledků předělání dle toolchain „Nejvhodnější“ konfigurace sítě = 68, 68, 32, 2 Learning rate = 0.08, Epoch = 100 „Zvláštně“ vypadající učící křivky, síť nelze přeučit (chyba nad 100 epoch fluktuuje a nezačne stoupat ani nad 2000 epoch) = problém povahy datasetu Metoda trainUntilConvergence() - sama si dělí data a provádí cross-validaci - ve snaze síť přeučit nahrazena hloupější metodou train() - žádné pozorovatelné změny v performance Naučená síť vyexportována

Řešení problému: learn.py

Řešení problému VLC VLC media player umí krom přehrávání souborů mnoho dalšího, např. otevřít síťový stream a uložit ho na lokální disk v libovolném formátu Elegantní řešení, VLC umí přímo *.wav nepotřebujeme internetové mp3 convertery

Řešení problému marsyas – peklo na zemi Framework napsaný v C++, podpora pro širokou škálu operací se zvukem Program bextract – umí extrahovat různé features ze zvukových souborů Největší kámen ůrazu celého projektu

V popisu datasetu není řečeno, jaké features obsahuje, pouze že jsou dosaženy defaultním nastavením bextract (nakonec nalezen paper, který to zhruba popisuje) Autoři datasetu používali marsyas 0.22, který defaultně generuje 68 features / track Marsyas 0.22 není nikde online dostupný ve funkční podobě (nelze přeložit) Dostupný je marsyas 0.5, jehož bextract který má ůplně jiné ovládácí rozhraní, vrací defaultně 116 features linuxová verze navíc vrací samé nuly Win32 verzi nelze vůbec spustit Win64 verze jediná funguje a nevrací nesmysly, nereaguje ale na přepínače volby extrakce – nelze vypnout extrakci nechtěných features Řešení problému marsyas – peklo na zemi

Řešení problému prep.py Nutnost vyřadit z dat nechtěné features, protože bextract nereaguje na přepínače, navíc pořadí dat je také jinak a původní pořadí neznáme Otázka – bude vůbec originální dataset použitelný? Pythonovský program,měl parsovat výstupní weka file z bextractu a tvořit výstupní data ve stejném formátu jako originální dataset

Řešení problému use.py Pythonovský program generující výsledky, knihovny: pybrain Načtení neuronové sítě a aktivace na vlastních datech basemap Vykreslení mapy světa a přepočet výsledků neuronové sítě (severní délky a jižní šířky) na souřadnice této mapy Matplotlib.pyplot Samotné kreslení bodů na mapu

Řešení problému use.py - mapa Mapa světa, světadíly bíle na šedém moři, vykresleny hranice států Mercatorova mapová projekce nedochází k deformaci – zmenšení plochy severní evropy, severní ameriky, nejnázornější zobrazení Přijdeme o antarktidu, na které stejně (v datasetu) nikdo hudbu nedělá

Překážka Bextract z Marsyas 0.5 nejen že nevrací správný počet hodnot, ale ani správné pořadí hodnot Význam features z Marsyas 0.5 je znám, je obsažen ve výstupním weka souboru Význam features z datasetu (Marsyas 0.22) znám není – v popisu datasetu chybí, v paperu je uveden, ale evidentně ne ve správném pořadí (např MFCC z vlastních dat a to, co má být dle pořadí MFCC z datasetu jsou na první pohled zcela jiná data) Dokonce nesedí ani počty typů features – dle paperu je v datasetu 32 MFCC features/ track, Marsyas 0.5 jich extrahuje 12*4 = 48

Diskuze výsledků Vzhledem k výše uvedenému není dataset ve spojení s daty získanými svépomocí použitelný Pro prověření funkce neuronové sítě byla tedy zvolena náhradní varianta – výběr testovacích dat z původního datasetu Testovací data zvolena: ze země s nejvíce vzorky – Indie Ze země s výrazně nižším počtem vzorků - Japonsko

Diskuze výsledku – Indie

Diskuze výsledku – Japonsko

Hodnocení Mínusy Nepodařilo se dosáhnout původně zamýšlené funkcionality – vliv nepředpokladatelné nekompatibility výstupu programu bextract Neuronová síť nefunguje uspokojivě pro většinu zemí v datasetu (málo dat) Plusy Neuronová síť je po naučení schopná s uspokojivou přesností určit polohu hudby – má-li dost dat pro danou oblast (Indie) Výkon našeho řešení je lepší než výkon řešení autorů původního datasetu – ti s použitím k-NN a celé řady postprocessingových operací s využitím dalších externích dat dosáhli nejlepší chyby cca 1500km, naše řešení má v Indii nejmenší chybu cca 500km

Co příště udělat lépe Nespoléhat na frameworky a postavit si vlastní dataset (Marsyas 0.5, >100 vzorků na zemi) Použít více vzorků – síť funguje uspokojivě v Indii se 116 vzorky, už méně uspokojivě funguje v japonsku se 17 vzorky Více features – podle tvaru křivky učení není síť schopná v datech najít příliš silné souvislosti, více dat by mohlo pomoct, ale Výstižnější features – používat např. chromatické ukazatele je spíše na škodu, síť pak bere v ůvahu tóninu skladby, což je většinou (kromě vsi Těrchová na Slovensku, kde hrají všechno v D dur) nepodstatná, až rušivá informace