Kvantitativní analýza cestopisů Karla Čapka Denisa Zajícová
Cestopis Žánr s velkou formální flexibilitou Znepokojivě heterogenní žánr Umělecký experiment
Žánr cestopisu? Aspekty určující žánr cestopisu? Pouze téma? (cestování) Společné stylometrické charakteristiky?
Kvantitativní analýza Kvantifikace a matematická formalizace pro testování hypotéz Experiment Strojové zpracování dat Zpracování velkého množství textů Intersubjektivita
Nástroje QUITA Nástroj pro výpočet MATTR Quantitative Index text Analyzer Sekundární tematická koncentrace (STC) Aktivita textu (Q) Průměrná délka tokenu (ATL) Vzdálenosti sloves (VD) Moving average type-token ratio Slovní bohatství
Cestopisy Karla Čapka Italské listy (1923) Anglické listy (1924) Cestopisy napsané za autorova života Cestopis sestavený po autorově smrti Italské listy (1923) Anglické listy (1924) Výlet do Španěl (1930) Obrázky z Holandska (1932) Cesta na sever (1936) Obrázky z domova (1953)
Materiál (korpus) Texty pěti cestopisů Karla Čapka www stránky Městské knihovny v Praze Projekt „E-knihy klasiků“ 1 kapitola = 1text Nelemmatizované texty
Zkoumané textové vlastnosti Aktivita textu Q Sekundární tematická koncentrace textu STC Vzdálenosti sloves VD Průměrná délka tokenu ATL Slovní bohatství měřené metodou MATTR
Způsoby výzkumu Srovnání dvojic cestopisů (knih) Srovnání kapitol mezi sebou Srovnání kapitol v rámci jednotlivých knih Srovnání všech kapitol všech cestopisů
Způsoby výzkumu Srovnání dvojic cestopisů (knih) Srovnání kapitol mezi sebou Srovnání kapitol v rámci jednotlivých knih Srovnání všech kapitol všech cestopisů (pouze STC a Q)
STC Počet rozdílů (všechny cestopisy) 15252 Počet signifikantních rozdílů 3820 Procento signifikantních rozdílů 25,05 %
Q Počet rozdílů (všechny cestopisy) 15252 Počet signifikantních rozdílů 2226 Procento signifikantních rozdílů 14,59 %
Děkuji za pozornost.