Automatické rozpoznávání zpěvů ptáků

Slides:



Advertisements
Podobné prezentace
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ ÚSTAV GEODÉZIE
Advertisements

Analýza experimentu pro robustní návrh
Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
kvantitativních znaků
Automatické titulkování živých pořadů České televize – současný stav a výhled do budoucna Luděk Müller Katedra kybernetiky, Fakulta aplikovaných.
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Automatická fonetická segmentace pomocí UNS Registr - 36 neuronových sítí MLNN (pro každou českou hlásku jedna UNS) Trénovací množina: databáze promluv.
Odhady parametrů základního souboru
Hodnocení způsobilosti měřících systémů
Jiří Gazárek, Martin Havlíček Analýza nezávislých komponent (ICA) v datech fMRI, a ICA necitlivá ke zpoždění.
Kalmanuv filtr pro zpracování signálů a navigaci
Cvičení 6 – 25. října 2010 Heteroskedasticita
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
Metody psychologie PhDr. Eva Tomešová, PhD.. Jak psychologové dospějí k závěrům o neznámém?  Používají VĚDECKOU METODU: IDENTIFIKACE VĚDECKÉ OTÁZKY FORMULACE.
M e c h a n i k a Václav Havel, katedra obecné fyziky ZČU v plzni.
Semestrální práce Analýza zpoždění signálů v 2-kanálové databázi řeči pomocí vzájemné korelace A2M99CZS Václav Dajčar, Roman VondráčekPraha, 2010.
Diplomová práce Autorka: Ing. et Ing. Zuzana Hynoušová
Analytické metody výzkumu
Mgr. Alena Lukáčová, Ph.D., Dr. Ján Šugár, CSc.
Odhad genetických parametrů
Pravděpodobnost a statistika opakování základních pojmů
Jemný úvod do detekce klíčových slov Honza Černocký Fakulta informačních technologií VUT v Brně ZRE poslední přednes,
kvantitativních znaků
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
Richard Lipka Katedra informatiky a výpočetní techniky Fakulta aplikovaných věd Západočeská univerzita, Plzeň 1.
K ARL L UDWIG VON B ERTALANFFY. L UDWIG VON B ERTALANFFY *19. září 1901 v Atzgersdorfu (u Vídně) †12. června 1972 v Buffalu - rakouský biolog a filosof,
VII. Neutronová interferometrie II. cvičení KOTLÁŘSKÁ 7. DUBNA 2010 F4110 Kvantová fyzika atomárních soustav letní semestr
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Speech – a micro-intro Honza Černocký BUT
Detekce hran.
Dokumentace informačního systému
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Distribuce dat experimentu ATLAS Jiří Chudoba.
Úvod do managementu 1. seminář
Lineární regrese.
Informativnost příznaků v závislosti na tvaru frekvenčního spektra v úloze rozpoznávání řečníka Ivan Pirner Obhajoba bakalářské práce.
Realtime identifikace osob podle hlasu
Tab 1. Procesní parametry
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Princip maximální entropie
Dolce: Databáze lokálních konformací DNA
Experimentální fyzika I. 2
ZKUŠEBNICTVÍ A KONTROLA JAKOSTI 01. Experimentální zkoušení KDE? V laboratoři In-situ (na stavbách) CO? Modely konstrukčních částí Menší konstrukční části.
AKD VII.
Martin Rod, Pavel Obdržálek Cesta k vědě prezentace Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Navigace a mapování pomocí GPS
Model lidského zraku pro hodnocení kvality obrazu
14. června 2004Michal Ševčenko Architektura softwarového systému DYNAST Michal Ševčenko VIC ČVUT.
Petr Junek Laboratoř DPZ, Katedra mapování a kartografie
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
Mgr. Michal LOUTHAN Katedra geoinformatiky, UP Olomouc
Klasifikace a rozpoznávání
Klasifikace a rozpoznávání Lineární klasifikátory.
IV..
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
Základní informace o předmětu1. Přednášející: RNDr. Martin Hála, CSc. katedra matematiky, B105, Další informace a soubory ke stažení.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Testování biometrického systému založeného na dynamice podpisu
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
4. cvičení
Úvod do praktické fyziky
Projekt - K620 Řízení a modelování silniční dopravy
Telematika (K620TM) Druhotné využití dat systému dálničních mýtných bran * + pattern recognition * z projektu COST OC194 Inteligentní dopravní systémy.
METODOLOGIE MAGISTERSKÉ PRÁCE
Klasifikace a rozpoznávání
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Statistika a výpočetní technika
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
Základy statistiky.
Transkript prezentace:

Automatické rozpoznávání zpěvů ptáků Ladislav Ptáček, UFY, březen 2014

Osnova • Automatické rozpoznávání lidské řeči a automatická identifikace ptáků Teoretický základ Provádění experimentů Identifikace ptáků Kroužkování Budníček menší Použitá data Příklad dosažených výsledků Závěr

Automatické rozpoznávání lidské řeči • Využití Identifikace osob Převod řeči na text Komunikace se strojem (ovládání PC, Call Centra, navigace) • Překážky Charakter lidské řeči Každý mluvčí je originál Nářečí, vady řeči, spisovně/nespisovně Vliv prostoru Hluk okolí

Automatické rozpoznávání lidské řeči • Typy úloh Rozpoznávání Speaker recognition (SR) Identifikace SI Verifikace SV Množina Uzavřená / Otevřená Obsah promluvy Závislé / Nezávislé Speech dependent/independent

Automatické rozpoznávání Teoretický základ • Postup získání vzorků z řeči/ze zpěvu

Automatické rozpoznávání Teoretický základ • Výpočet cepstrálních koeficientů • Výpočet dalších koeficientů (energie, korelace, atd.) -> vznik modelu • Proces rozpoznávání je porovnáváním modelů

Automatické rozpoznávání Teorie, Feature vector

Automatické rozpoznávání Teoretický základ • Model UBM Modeluje pozadí (hluk, ostatní ptáci, telefonní linka, atd.) • Model GMM Modeluje cílového řečníka (Target Bird) • Porovnávání Jsou porovnávány modely neznámého řečníka a GMM a UBM Na základě jejich porovnání resp. jejich vzájemné vzdálenosti doje k rozhodnutí: Accept x Reject

Automatické rozpoznávání Metody • Rozpoznávání ptáků: Metody Parametry MFCCs → klasifikace GMM Parametry MFCC a PLP → klasifikace HMM s využitím HTK Parametry MFCC → klasifikátor ANN, s využitím NN Toolboxu v Matlabu Naše práci kombinují Neupravená data (raw records) Záznamy napříč časovým obdobím (roky a delší) GMM-UBM (Universal Background Model)

Automatické rozpoznávání Metody • GMM - Gaussovské směsi (Gaussian Mixture Models) D..rozměr vektoru příznaků x (feature vector), M..počet Gaussiánů μy..vektor D x 1 Σy .. kovarianční matice D x D wS …váha pravděpodobnosti λS..model řečníka S UBM – Universal Background Model

Automatické rozpoznávání Metody, State of the Art • JFA – Joint Factor Analysis Nalezení korelací řečník resp. kanál → snížení rozměru supervektoru. GMM supervektor lze vyjádřit jako součet dvou supervektorů: S…řečník, C..kanál i-Vector – Identity vector Oddělení dat kanál x řečník - využité v JFA - je úspěšné pouze částečně. Velké množství dat → není nutné je oddělit, dostaneme výsledky jako JFA m..supervektor, nezávislý na řečníkovi ani na kanálu T..Total variability matrix, získaná EM z velkého množství dat s velkou variabilitou w..i-Vector, záleží jak na řečníkovi tak na kanálu.

Automatické rozpoznávání Experimenty, třídění nahrávek Nahrávky jsou rozděleny do několika sad Příprava dat katalogizace (700 minut nahrávek) třídění (eliminace nevhodných nahrávek, atd.) Nastavení konfiguračních souborů Training UBM Testování Spouštění testů 1 až 4 současně Vyhodnocení dat Matlab, EER

Automatické rozpoznávání Experimenty, postup • Jednotlivé kroky experimentů s vyznačením využitých sad nahrávek

Automatické rozpoznávání Experimenty, procesní diagram • Speaker / Bird verification system

Automatické rozpoznávání Experimenty, chyby rozpoznání • Při verifikaci mohou nastat dva druhy chyb: FA…False Acceptance FR…False Rejection

Automatické rozpoznávání ptáků Typy úloh • Rozpoznávání ptáků: Typ úloh Identifikace jedince (v rámci jednoho druhu) → Speaker Identification Rozpoznání druhu (zpěv/zvuk) → Language Identification Rozpoznání specifického zvuku → Speech recognition task (SV, SI) Optimalizace metod pro řeč → využití v ornitologii

Zpěvy ptáků Databáze • Databáze nahrávek zvuků ptáků Komerční (např. Cornell Lab, Audio CD) Nekomerční (např. xeno-canto.org) • U nás AV ČR Amatérské databáze Vlastní databáze PřF

Ptáci Zpěv a sluch Hlasový trakt

Ptáci Sluch • vrabec o pěnkava

Ptáci Přenos zpěvu postředím Lidská řeč x Ptačí zpěv • Přenos na velké vzdálenosti Ozvěna Posun fází. Větší vliv na zvuky s konstantní f než na modulované Odrazy od země, interference

Kroužkování • Sledování, rozpoznávání a identifikace jedinců v ornitologii • Kroužkování (1773, H. C. Mortensen) U nás 1910 Kurt Loos a dr. K. Richter Propagují Ing. Otta Kadlec, Hrabě B.K.Kinský ad. European Union for Bird Ringing (EURING) Spektrogram Novější metody Telemetrie, analýza stabilních izotopů z peří, radarové sledování

Kroužkování

Kroužkování

Ptáci Budníček menší, kroužkování

Ptáci Budníček menší Budníček menší (CZ), Phylloscopus collybita (LAT), Chiffchaff (EN) Zpěv v lese Hluk v lese Zpěv město Zpěv → Fráze → Slabika → Elementy

Ptáci Budníček menší, spektrogram • Budníček, jeden zpěv (single song), délka 5 s.

Ptáci Budníček menší, spektrogram • Budníček, reálná nahrávka, hluk pozadí Zpěv → Fráze → Slabika → Elementy

Automatické rozpoznávání Experimenty, použitá data, 2011

Automatické rozpoznávání Experimenty, příklad vyhodnocení • Příklad vyhodnocení výsledků Graf znázorňující EER Graf znázorňující závislost úspěšnosti na míře FA a FR (Equal Error Rate) svislá čára znázorňuje nastavení Treshold

Automatické rozpoznávání Experimenty, dosažené výsledky • Příklad dosažených výsledků Budníček menší foto: Wikipedia

Automatické rozpoznávání Experimenty, dosažené výsledky • Příklad dosažených výsledků Rypoši Foto Klaus Rudloff , www.biolib.cz

Automatické rozpoznávání Současnost, směřování ZČU, Fakulta aplikovaných věd, katedra kybernetiky KKY Příklady aplikací: Titulkování, převod řeči na text Poslanecká sněmovna ČR Televizní vysílání Znaková řeč Další využití Lékaři Polici Soudnictví Mobilní telefony (Google, Siri) …další využití? …budoucnost?

Závěr Děkuji vám za pozornost Ing. Ladislav Ptáček Ústav fyziky a biofyziky Laboratoř elektroniky a akustiky Přírodovědecká fakulta Branišovská 31, 370 05 České Budějovice Telefon: +420 38 777 6268