Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

A teď si to zkuste sami rdaqwi bc dwefewq riwgdh, aegebjckbmn rkcobcoq bcocw sc bsc rkqhdsgc bqa q hcjw kdfswcmwc sgejkge bocwcge, tcf ai rkdrwdisqwd adfmca,

Podobné prezentace


Prezentace na téma: "A teď si to zkuste sami rdaqwi bc dwefewq riwgdh, aegebjckbmn rkcobcoq bcocw sc bsc rkqhdsgc bqa q hcjw kdfswcmwc sgejkge bocwcge, tcf ai rkdrwdisqwd adfmca,"— Transkript prezentace:

1 A teď si to zkuste sami rdaqwi bc dwefewq riwgdh, aegebjckbmn rkcobcoq bcocw sc bsc rkqhdsgc bqa q hcjw kdfswcmwc sgejkge bocwcge, tcf ai rkdrwdisqwd adfmca, qgef dn s gc fqgchuqwd bcdcacgbe banbwirwgdi bjdri. hcmqw gq jcwcFdgqj rkcfeocgjq tebjc sfoqwcgc fcac, gcjkrcwesc rkcaejqw, mon jcg fqjkqhcgn huwqr mdgchgc fqsdwq, q irdkgc bc bgqfew rdjwqhej gcrketcagc sfrdaegmn gq swcmwn, igqsgn q ddjefgn ocg. gq geh tegcud if ai s uwqsc rkqmjehmn gcfdnsqwd aebjd. Text je v češtině v abecedě s 26 znaky (bez diakritiky) Nejčastější znaky v obecném českém textu: E 10,13%; A 8,99%; O 8,39%; I 6,92%; N 6,64%; S 5,74%; R 5,33%

2 Výskyt znaků v textu abcdefghijklmnopqrstuvwxyz 1417492622173411 1713010119034181744028000 3,84,6 13, 37,16,04,69,23,0 4,63,50,02,73,02,40,09,24,94,61,0 0,07,60,0

3 Nejčastější znaky c frekvence 13,39% g a q 9,29% c se nikdy nevyskytuje samostatně ani na začátku slova ---- Hypotéza c odpovídá E q tvoří samostatné slovo, nebo druhé písmeno ve dvoupísmených slovech – Hypotéza q odpovídá A g se často vyskytuje na začátku slov (je to souhláska). Tvoří dvoupísmená slova s e a s a – Hypotéza g odpovídá N

4 Teď to vypadá takto rdaAwi bE dwefewA riwNdh, aeNebjEkbmn rkEobEoA bEoEw sE bsE rkAhdsNE bAa A hEjw kdfswEmwE sNejkNe boEwENe, tEf ai rkdrwdisAwd adfmEa, ANef dn s NE fANEhuAwd bEdEaENbe banbwirwNdi bjdri. hEmAw NA jEwEFdNAj rkEfeoENjA tebjE sfoAwENE fEaE, NEjkrEwesE rkEaejAw, mon jEN fAjkAhENn huwAr mdNEhNE fAsdwA, A irdkNE bE bNAfew rdjwAhej NErketEaNE sfrdaeNmn NA swEmwn, iNAsNn A ddjefNn oEN. NA Neh teNEud if ai s uwAsE rkAmjehmn NEfdnsAwd aebjd. Další časté znaky jsou e a w. Vyskytují se často vedle sebe – právě jeden z nich je samohláska. E je často v okolí N – je to samohláska, praděpodobně I

5 rdaAwi bE dwIfIwA riwNdh, aINIbjEkbmn rkEobEoA bEoEw sE bsE rkAhdsNE bAa A hEjw kdfswEmwE sNIjkNI boEwENI, tEf ai kdrwdisAwd adfmEa, ANIf dn s NE fANEhuAwd bEdEaENbI banbwirwNdi bjdri. hEmAw NA jEwEFdNAj rkEfIoENjA tIbjE sfoAwENE fEaE, NEjkrEwIsE rkEaIjAw, mon jEN fAjkAhENn uwAr mdNEhNE fAsdwA, A irdkNE bE bNAfIw rdjwAhIj NErkItEaNE sfrdaINmn NA swEmwn, iNAsNn A ddjIfNn oEN. NA NIh tINEud if ai s uwAsE rkAmjIhmn NEfdnsAwd aIbjd. Patrné je slovo ANIZ, tedy f odpovídá Z S tvoří samostatné slovo, dvoupísmené slovo s písmenem E – je to v

6 rdaAwi bE dwIZIwA riwNdh, aINIbjEkbmn rkEobEoA bEoEw VE bVE rkAhdVNE bAa A hEjw kdZVwEmwE VNIjkNI boEwENI, tEZ ai kdrwdiVAwd adZmEa, ANIZ dn V NE ZANEhuAwd bEdEaENbI banbwirwNdi bjdri. hEmAw NA jEwEFdNAj rkEZIoENjA tIbjE VZoAwENE ZEaE, NEjkrEwIVE rkEaIjAw, mon jEN ZAjkAhENn uwAr mdNEhNE ZAVdwA, A irdkNE bE bNAZIw rdjwAhIj NErkItEaNE VZrdaINmn NA VwEmwn, iNAVNn A ddjIZNn oEN. NA NIh tINEud iZ ai V uwAVE rkAmjIhmn NEZdnVAwd aIbjd. Na vyznačeném místě se rýsuje spojení VE SVE PRACOVNE, tedy b je S, r je P, k je r, h je C, d je O

7 POaAwi SE OwIZIwA PiwNOC, aINISjERSmn rREoSEoA SEoEw VE SVE PRACOVNE SAa A CEjw ROZVwEmwE VNIjRNI SoEwENI, tEZ ai ROPwOiVAwO aOZmEa, ANIZ On V NE ZANECuAwO SEOEaENSI SanSwiPwNOi SjOPi. CEmAw NA jEwEFONAj PREZIoENjA tISjE VZoAwENE ZEaE, NEjRPEwIVE PREaIjAw, mon jEN ZAjRACENn uwAP mONECNE ZAVOwA, A iPORNE SE SNAZIw POjwACIj NEPRItEaNE VZPOaINmn NA VwEmwn, iNAVNn A OOjIZNn oEN. NA NIC tINEuO iZ ai V uwAVE PRAmjICmn NEZOnVAwO aISjO. Nyní již lze domyslet snadno i ostatní písmena, Slovo POMALU: a je M, w je L, I je U Slovo MINISTERSKY: m je K, n je Y Slovo PREDSEDA: r je P, o je D Slovo VNITRNI: j je T Slovo JINEHO: t je J, u je H

8 POMALU SE OLIZILA PULNOC, MINISTERSKY PREDSEDA SEDEL VE SVE PRACOVNE SAM A CETL ROZVLEKLE VNITRNI SDELENI, JEZ MU ROPLOUVALO MOZKEM, ANIZ OY V NE ZANECHALO SEOEMENSI SMYSLUPLNOU STOPU. CEKAL NA TELEFONAT PREZIDENTA JISTE VZDALENE ZEME, NETRPELIVE PREMITAL, KDY TEN ZATRACENY HLAP KONECNE ZAVOLA, A UPORNE SE SNAZIL POTLACIT NEPRIJEMNE VZPOMINKY NA VLEKLY, UNAVNY A OOTIZNY DEN. NA NIC JINEHO UZ MU V HLAVE PRAKTICKY NEZOYVALO MISTO. Zbývá opravit chyby, omylem bylo písmeno B šifrováno jako písmeno O a v jednom místě textu chybí C.

9 POMALU SE BLIZILA PULNOC, MINISTERSKY PREDSEDA SEDEL VE SVE PRACOVNE SAM A CETL ROZVLEKLE VNITRNI SDELENI, JEZ MU ROPLOUVALO MOZKEM, ANIZ BY V NE ZANECHALO SEBEMENSI SMYSLUPLNOU STOPU. CEKAL NA TELEFONAT PREZIDENTA JISTE VZDALENE ZEME, NETRPELIVE PREMITAL, KDY TEN ZATRACENY CHLAP KONECNE ZAVOLA, A UPORNE SE SNAZIL POTLACIT NEPRIJEMNE VZPOMINKY NA VLEKLY, UNAVNY A OBTIZNY DEN. NA NIC JINEHO UZ MU V HLAVE PRAKTICKY NEZBYVALO MISTO. Výsledkem je začátek českého překladu knihy Harry Potter a princ dvojí krve

10 Index koincidence Metoda, která umožní zjistit bez dešifrování textu, zda byl text zašifrován monoalfabetickou šifrou, a popřípadě v jakém jazyce byl text napsán.

11 Statistika výskytu znaků v češtině

12 Po použití Cézarovské šifry

13 Po použití monoalfabetické šifry

14 Graf vypadá pořád stejně Jen sloupce jsou přeházené Jak to vyjádřit číselně? Nabízí se rozptyl veličiny, tedy průměrná odchylka od střední hodnoty

15 Rozptyl Var (X) = E (X - E(X)) 2

16 Pro výskyt znaků v textu n*Var (p) = ∑(p(i)-1/n) 2 = = ∑p(i) 2 - ∑2*p(i)/n + ∑1/n 2 = = ∑p(i) 2 - 2/n + 1/n = = ∑p(i) 2 - 1/n -= -=

17 Index koincidence IC(T) = ∑p(i) 2 = n*var(T)+1/n Vždy větší nebo roven 1/n = 1/26 = 0,03846. Blízký hodnotě 0,03846 je pro náhodně generovaný text se stejnou hustotou výskytu jednotlivých znaků. Čím větší, tím více nerovnoměrný je výskyt písmen. Je zachován při monoalfabetické šifře.

18 Indexy koincidence vybraných jazyků Čeština 0,0577 Slovenština 0,0581 Angličtina 0,0676 Francouzština 0,0801 Němčina 0,0824 Italština 0,0754 Španělština 0,0769 Ruština 0,0470 Náhodný text 0,0385

19 Úkol Najděte texty v češtině (26 znaků), „odborné počítačové“ češtině angličtině a ještě alespoň jenom jazyce a spočítejte jejich indexy koincidence. Zašifrujte tyto texty monoalfabetickou šifrou a ověřte, že se jejich index koincidence nemění.


Stáhnout ppt "A teď si to zkuste sami rdaqwi bc dwefewq riwgdh, aegebjckbmn rkcobcoq bcocw sc bsc rkqhdsgc bqa q hcjw kdfswcmwc sgejkge bocwcge, tcf ai rkdrwdisqwd adfmca,"

Podobné prezentace


Reklamy Google