Analýza variability srdečního rytmu Autor: Ondřej Mašek Vedoucí práce: Ing. Václav Chudáček
Zadání diplomové práce Seznamte se s problematikou analýzy variability srdečního rytmu Navrhněte několik možných metod analýzy variability srdečního rytmu Na základě dat z 1.LF UK, případně MIT databáze vyhodnoťte a porovnejte navržené metody
Cíle práce Najít příznaky HRV analýzy, které by mohly identifikovat pacienty s fibrilací síní Vytvořit toolbox s grafickým rozhraním pro výpočet výsledků HRV analýzy
Úvod Okolo 0,5 % dospělé populace je postiženo fibrilací síní 4 % lidí nad 60 let Více než 10 % lidí nad 70 let Ulehčení práce doktorů
Fibrilace síní
Použité metody Celkem 19 metod Získal jsem 26 příznaků 15 lineárních metod NN50, pNN50, RMSSD, SDNN, SDSD, SDANN, SDNNind, střední hodnota RR, střední hodnota HR, CV, II, STV, LTI, Delta, Delta total 4 nelineární metody Poincaré plot (PcPSD1, PCPSD2, PcPSD12, PcPS) DFA – DFAshort, DFAlong Entropie – Shannonova entropie, aproximativní entropie, sample entropie Fraktální dimenze – Kapacitní dimenze, Sevcikova dimenze
Data Použita data z MIT databáze 1. databáze MIT-BIH AF obsahuje EKG subjektů s fibrilací síní 10 hodinové záznamy 25 subjektů – náhodně vybráno 10 2. databáze MIT-BIH NSR obsahuje EKG subjektů s normální srdeční činností 20 hodinové záznamy 18 subjektů – náhodně vybráno 10
Předzpracování Detekce R vrcholů pomocí Pan Tompkins algoritmu Výpočet RR intervalů Odstranění artefaktů – vyhlazení řady RR intervalů Převzorkování RR intervalů na 4 Hz Segmentace dat na 5, 10, 20 a 30 minutové segmenty
Výsledky Nejlepší pětiminutová segmentace 1190 segmentů s fibrilaci síní 2390 segmentů s normálním srdečním rytmem Použit Mann-Whitney U-test pro posouzení příznaků 24 příznaků signifikantních a pouze 2 nesignifikantní na hladině významnosti p<0,05 Nejlepší příznaky DFAlong a PcPSD12 DFAlong 1,46 ± 0,18 – pro segmenty s fibrilaci síní 1,61 ± 0,14 – pro segmenty s normálním srdečním rytmem PcPSD12 0,17 ± 0,07 – pro segmenty s fibrilaci síní 0,12 ± 0,04 – pro segmenty s normálním srdečním rytmem
Výsledky klasifikace Byla vyzkoušena klasifikace dat do dvou tříd v prostředí WEKA fibrilace síní normální srdeční činnost Na základě signifikantních příznaků pomocí rozhodovacího stromu a desetinásobné křížové validace 92,0 % sensitivita 92,1 % specificita
Grafické rozhraní toolboxu
Grafické rozhraní toolboxu
Závěr Nejlepší pětiminutová segmentace 24 signifikantních příznaků Nesignifikantní pouze dva příznaky CV a Delta Lze klasifikovat data obsahující fibrilaci síní od dat s normálním srdečním rytmem s 92,0% sensitivitou a 92,1% specificitou
Děkuji za pozornost
Jak student rozdělil data na tréninkovou a testovací množinu? Použil jsem desetinásobnou křížovou validaci 1/10 testovací data V testovacích datech stejný poměr dat z obou tříd Zbytek tréninková data
Rád bych viděl tabulku s výsledky sensitivity, specificity a přesnosti pro každý signál zvlášť. Data jsem bral z globálního pohledu – jako data s fibrilací síní a data s normálním srdečním rytmem Bylo by možné díky tomu zjistit, zda se nějaký signál daného subjektu statisticky neliší – ovlivnění výsledků Příklad výsledků pro 5 signálů
Student se odkazuje na referenci [7] a [15], je nutné uvést, jakou metodou a jakých výsledků autoři dosáhli [7] – Nonlinear HRV Analysis May Predict Atrial Fibrilation, 2006 Článek se zabývá zhodnocením příznaků, které by mohly být použity k identifikaci fibrilace síní Lineární metody SDNN, RMSSD, NN50, pNN50 Nelineární metody Poincaré plot (PcPSD1, PcPSD2, PcPSD12, pPD2, mPD2) Metody ve frekvenční oblasti HF, LF, LF/HF Příznaky pPD2 a mPD2 z Poincaré plot byly jediné signifikantní na hladině významnosti p<0,05 – mohly by být použity pro klasifikaci V porovnání s mými výsledky jsem dosáhl signifikantnosti i u některých příznaků lineárních metod a všech nelineárních metod
[15] Three Different Algorithm for Identifying Patients Suffering from Atrial Fibrillation during Atrial Fibrillation Free Phases of the ECG, 2007 Algoritmus 1 – SDSD a Poincaré plot Algoritmus 2 – spektrum s použitím FFT Algoritmus 3 – pNN200 a Histogram rozdílů RR intervalů Dosáhl jsem podobných výsledků 92,0 % sensitivita 92,1 % specificita
Z každé databáze jsem náhodně vybral 10 záznamů str.33: Student vybral z MIT-AF a MIT-NSR databází 10 záznamů. Jaká byla motivace pro výběr uvedených záznamů v sekci 4.2? "Šikovným" výběrem záznamů lze docílit dobrých výsledků. Navrhuji pracovat vždy s kompletní databází, kdy je zaručeno, že metodu otestujeme i na "nehezkých" signálech (malý odstup šumu od užitečného signálu, krátká doba trvání AF, atd.) Z každé databáze jsem náhodně vybral 10 záznamů Segmentací jsem získal dostatečný počet dat pro statistické vyhodnocení 1190 segmentů s fibrilaci síní 2390 segmentů s normálním srdečním rytmem
Souhlasím, že jde o důležitou část navržené metodologie str 33: Postrádám vyhodnocení detekce R bodů pomocí Pan-Tompkinse QRS detektoru, např. pomocí přesnosti detekce a falešně negativních detekcí, opět pro každý jednotlivý signál. Detekce R bodů je nejkritičtější částí navržené metodologie Souhlasím, že jde o důležitou část navržené metodologie Nešlo spočítat přesnost detekce, neboť anotace databází neobsahovaly informace o přesném umístění R vrcholů Volbou jiné databáze s lepší anotací by bylo vhodné vyhodnotit přesnost detekce
Většina článků používá tyto parametry Proč student vybral parametry pro aproximativní entropii m=2, r=0.2? Bylo by užitečné provést evaluaci této míry pro různé hodnoty parametrů. Většina článků používá tyto parametry Přímo autor entropie S. Pincus doporučuje tyto parametry Přibližně pro parametr r=0,2 nabývá entropie maxima