Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího
Zpracování řeči Zpracování řeči se dělí na: Rozpoznávání řeči Co bylo řečeno? Rozpoznávání mluvčích Kdo to řekl? Ostatní rozpoznávání Nebyl řečník opilý? Rozpoznávání mluvčích se dělí na: Identifikaci Řekni mi, kdo mluvil? Verifikaci Mluvčí tvrdí, že je A. Je to pravda?
Biometrický Bezpečnostní Systém BBS požaduje ověření nebo zjištění totožnosti na základě biometrických vlastností. BBS požaduje ověření nebo zjištění totožnosti na základě biometrických vlastností. Otisk prstu, hlas, styl chůze, dynamika a styl psaní (podpisu), pach … Dva možné přístupy Dva možné přístupy Identifikační Verifikační
BBS – Identifikační přístup Sejmutí biometrických údajů Zpracování a porovnání s údaji se všech dostupných uživatelů Vyhodnocení = uživatel v databázi BYL nalezen NEBYL nalezen BBS
BBS – Verifikační přístup BBS Sejmutí biometrických údajů a dotaz na identitu Zpracování a porovnání s údaji uživatele, za kterého se neznámý vydává Vyhodnocení = neznámý JE tím, za koho se vydává NENÍ tím, za koho se vydává = ?
Výhody a nevýhody obou přístupů Identifikační přístup Identifikační přístup Pohodlnější pro uživatele Náročný na kvalitu algoritmů Malá chyba pozitivně identifikuje nepřítele Výpočetně náročný Přístup do DB, množství výpočtů Verifikační přístup Verifikační přístup Mnohem nižší výpočetní nároky Vše provádíme pouze jednou Méně pohodlné Musíme zadat 1 údaj navíc (identitu, přihlašovací jméno)
Cíle disertační práce Zpracování řečového signálu Zpracování řečového signálu Rozlišení řečových a neřečových rámců = detekce hlasové aktivity ( Voice Activity Detection - VAD ) Extrakce příznaků závislých na mluvčím Extrakce příznaků závislých na mluvčím Získání příznaků použitelných k rozpoznání mluvčích ( Speaker Dependent Frequency Cepstrum Coefficients – SDFCC ) Návrh Biometrického Bezpečnostního Systému Návrh Biometrického Bezpečnostního Systému Návrh začlenění technologie rozpoznání mluvčího do komplexního BBS Návrh postupu generování unikátního vektoru pro kryptografické účely
VAD – detekce hlasové aktivity Postup: Postup: Použití neuronové sítě BP Aplikace součtu velikostí frekvencí ve spektru Experimenty: Experimenty: Porovnání s běžně používanými příznaky Test vlivu topologie BPN na úspěšnost VAD Výsledky: Výsledky: Méně rozsáhlé sítě dosahují lepších výsledků Chyba kolem 1% při použití kombinace hodnoty počtu průchodů nulou a součtu velikostí frekvencí
Příznaky závislé na mluvčím Výpočet dlouhodobého LPC spektra Generování jedinečné banky filtrů pro každého uživatele Výpočet kepstrálních koeficientů (postup stejný jako u MFCC) Výsledek = SDFCC (Speaker Dependent Frequency Cepstrum Coefficients)
Proces rozpoznání mluvčích Záznam Předzpracování Extrakce přáznaků Unikátní vektor + Test hlaso- vého hesla Délkavektoru: 64 bitů Klasifikace dynamických příznaků HMM Výběr příznaků (pro každý rámec) – MFCC, SDFCC, a mnohé další Statistické příznaky Záznam řečového signálu vzorkovací frekvence Hz vzorkovací frekvence Hz přesnost 16 bitů přesnost 16 bitů 1.Preemfáze 2.Rozdělení na rámce 3.Násobení oknem 4.Vypuštění neřečových rámců Příznaky z 1 rámce Dynamické příznaky Dynamické příznaky Identifikační nebo verifikační přístup
SDFCC – Experimenty a výsledky Experimenty: Experimenty: Verifikace a Identifikace (HMM-GM) Test verifikačního a identifikačního přístupu ověřování Použití SDFCC (různé tvary filtrů) a běžných příznaků Test vlivu počtu stavů HMM na kvalitu rozpoznání Výsledky: Výsledky: Menší počet stavů vykazuje často lepší výsledky Verifikace: EER = 3.9% (3 stavy) Identifikace: EER = 5.0% (3 stavy)
Biometrický Bezpečnostní Systém Teoretický návrh BBS Teoretický návrh BBS Single BSS - běžné Multi BSS – rozšíří se Rozpoznání mluvčího Rozpoznání otisku prstu Rozpoznání duhovky Finální Rozhodnutí Přijat / Zamítnut Multi-Biometric Security System Kryptografie Kryptografie Generování unikátního vektoru Využití dlouhodobého LPC spektra a kvantizace
BBS – Experimenty a výsledky Experimenty: Experimenty: Test unikátnosti vektorů (FAR, FRR) Test vlastností algoritmu - tolerance Výsledky: Výsledky: FAR < 4.0% (maximální tolerance) FRR < 85.0% (minimální tolerance)
Závěr Zpracování řečového signálu Zpracování řečového signálu VAD (Voice Activity Detection) – chyba ~ 1% Příznaky pro rozpoznávání mluvčích Příznaky pro rozpoznávání mluvčích SDFCC (Speaker Dependent Frequency Cepstrum Coefficients) chyba ~ 3.5% (verifikace), ~ 5% (identifikace) Biometrický Bezpečnostní systém Biometrický Bezpečnostní systém Návrh multi-biometrického bezpečnostního systému Postup pro generování unikátního vektoru