Potřebují informatici umět komunikovat?

Slides:



Advertisements
Podobné prezentace
Název projektu : Objevujeme svět kolem nás Reg. číslo projektu: CZ.1.07/1.4.00/
Advertisements

Pavel Kurfürst - Ústav cizích jazyků LF Univerzita Palackého v Olomouci, ČR
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu „Učíme moderně“ Registrační číslo projektu:
Autor:Ing. Pavel Brož Předmět/vzdělávací oblast:Informační a komunikační technologie Tematická oblast:Práce se standardním aplikačním programovým vybavením.
Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.
JAZYKOVĚDA, JAZYKOVÁ KULTURA, ŘEČ A JAZYK
Čeština pro cizince a azylanty – B1 (učebnice, cvičebnice, metodika)
Autor:Ing. Pavel Brož Předmět/vzdělávací oblast:Informační a komunikační technologie Tematická oblast:Práce se standardním aplikačním programovým vybavením.
Modernizace studijních opor Představení LMS Moodle
SOFTWARE operační systémy
Anglický jazyk Michaela Hrdličková, 251 PT1 – Provozní technika 1. ročník „Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem.
Umělá inteligence. Dva přístupy Technický – formální systémy, modely, konkrétní aplikace Filosofický – definice inteligence, vztah k mysli, vědomí a navíc.
Příprava odborného textu pro výuku PAVEL KURFÜRST Ústav cizích jazyků LF UP Konference Cizí jazyky na Univerzitě Palackého Olomouc, 20. dubna 2006.
Vybrané výukové metody pro finanční vzdělávání Roman Hašek, Vladimíra Petrášková Pedagogická fakulta JU České Budějovice.
Využití Free a Open Source licencí ve školství CZ / /0308 PROJEKT: Má shrnout typy jednotlivých licencí a osvětlit jejich podstatu, rozdíly.
INFORMATIKA - PC 6. Ročník Zpracoval: Mgr. Tomáš Rajnoha vyučující informatiky a komunikační technologie 1.
Tvorba webových aplikací
ŠTĚPÁN LÍSKOVEC, 4.A Prezentace. Principy úspěšné prezentace Vhodný styl pro příslušnou prezentaci S posluchači je nutné aktivně komunikovat Přednášející.
Označení materiálu: VY_32_INOVACE_HLAVE_CESKYJAZYK1_19
STRUKTURA OSNOVY KURZU
INFORMATIKA 8 Zásady pro úpravy textů III2 – I8- 14.
Radek Pavlíček, duben 2010 Aktuální trendy v přístupnosti.
Učte se anglicky 4krát rychleji Úvod Dr. Arkady Zilberman *US Patent 6,341,958.
Systémy pro podporu managementu 2
Specifika zpracování vzdělávacích obsahů vyučovacích předmětů: Čtení – globální a analyticko–syntetická metoda – vzhledem k vícečetnému postižení bylo.
Setkání koordinátorů ICT Brno 23. ledna Úvod  Konečně!! Norma respektuje použití knižního písma, nepodporuje primárně strojopis  Příprava trvala.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Číslo projektuCZ.1.07/1.5.00/ Název projektuEU peníze středním školám Masarykova OA Jičín Název školyMASARYKOVA OBCHODNÍ AKADEMIE, 17. listopadu.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Internet ale velmi výrazně slouží i pro komunikaci, přičemž jednoznačně nejpoužívanějším komunikačním prvkem je . Význam slova lze přeložit.
DIACHRONIE A KORPUSY (DČNK) Úvod do korpusové lingvistiky 10.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
Animace a eLearning Petr Korviny SCO 2006, Brno. Úvod Animace Animace Výhody (názornost, vhodnost nasazení pro výuku počítačových programů a dovedností,
Databázové modelování
JEDEN CÍL, SPOLEČNÁ CESTA Ministerstvo vnitra České republiky e-Learning na Portálu veřejné správy Renata Brožková, Jiří Průša Ministerstvo informatiky.
Zápočtová práce na POPJ Tvorba slovníku a pravidel do PC-Kimmo SLOVESA Vojtěch Holub.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Vzdělávací moduly  systém prakticky zaměřeného vzdělávání  postihuje široké spektrum dovedností potřebných k úspěšnému předkládání a řízení projektů.
B ORIS L EHEČKA, ODDĚLENÍ VÝVOJE JAZYKA ÚJČ AV ČR, V. V. I. DALIBORIS. CZ P RAŽSKÉ JARO V O STRAVĚ, 24. BŘEZNA 2015 Nástroje pro badatele (nejen)
Psaní a editace textu Jindřich Terč.
Počítačová gramotnost a její zvyšování pomocí e-learningu Martin Voslář Počítačová škola Gopas, a.s.
Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorIng. Ivana Brhelová Název šablonyIII/2.
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
14. Informace vládnou sv ě tu Úloha ICT p ř i ř ízení podniku rb.
VÝUKOVÝ MATERIÁL ZPRACOVÁN V RÁMCI PROJEKTU EU PENÍZE ŠKOLÁM Registrační číslo projektu: CZ.1.07/1.4.00/ Šablona:III/2č. materiálu: VY_32_INOVACE_221.
Typografie a zpracování textů
Kontrola pravopisu Daniel Zeman Počítačové zpracování češtiny.
Umělá inteligence Robin Horniak. Definice Umělá inteligence (Artificial Intelligence), zkráceně UI (AI) věda, která se zabývá tím, jak přinutit stroje.
Úvod do studia Základní informace o předmětu Robert Zbíral Maxim Tomoszek.
Využití neuronových sítí IVTH – Informační technologie ve vodním hospodářství Vypracoval: Jiří Vacek Z-92.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
6. FORMÁLNÍ ÚPRAVA ODBORNÝCH TEXTŮ Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Elektronická pošta, zkráceně (zkráceně také mail) je způsob odesílání, doručování a přijímání zpráv přes elektronické komunikační systémy.
Informatika – Textový procesor Word 2010 Jméno autora Ing. Ladislav Novák Datum vytvoření leden 2011 Ročník 3. Vzdělávací oblast obor tematický okruh Informační.
Den s románskou filologií FF JČU České Budějovice doc. PhDr. Jan Radimský, Ph.D.
Psát není tak složité, aneb pojďte s námi tvořit Metodický portál.
SOFTWAROVÁ PODPORA PRO VYTVÁŘENÍ FUZZY MODELŮ Knihovna fuzzy procedur Ing. Petr Želasko, VŠB-TU Ostrava.
Komunikace a jazyková správnost (pravopis)?
Klára Osolsobě, Hana Žižková
Ostravská univerzita (1991 → )
Textový editor Lada Juráňová.
Jištění kvality technologických procesů
Komunikace a jazyková správnost
Daniel Zeman Počítačové zpracování češtiny Kontrola pravopisu Daniel Zeman
Projekt byl řešen v rámci projektu FRVŠ 2839/2010 F1 d.
Kapitoly z fonetiky a fonologie českého jazyka
SOFTWARE II Aplikační software.
Informatika textový editor - WORD
Umělá inteligence a autorské právo z pohledu práva na svobodu projevu
KURZY ČESKÉHO JAZYKA pro tzv. STÁŽISTY a POSTGRADUANTY
Transkript prezentace:

Potřebují informatici umět komunikovat? Předmět Základy odborného stylu (VB000) K. Pala, Centrum ZPJ FI MU jaro 2015

Pozitivní komunikace Výchozí axiom: nelze nekomunikovat Naše civilizace stojí na komunikaci – je to základ pro vědu, techniku, kulturu, veškeré znalosti lidstva Musí splňovat jisté standardy, aby byla efektivní Pro komunikaci potřebujeme vhodná pravidla, normy Většina lidské komunikace probíhá v přirozeném jazyce Má dvě základní podoby: mluvenou a psanou Která podoba je prvotní? Potřeba norem pro přechod od mluvené podoby k psané

Mluvený a psaný jazyk Mluvený jazyk je primární (cca 5000 jazyků světa) Psaný jazyk je až sekundární – je to paměť lidstva Komunikace v přirozeném jaz. vyžaduje přiřazení zvuků jazyka (hlásek) psaným znakům (písmenům) Úplná reprezentace zvuků v jednotlivých jazycích – International Phonetic Alphabet (IPA) Reprezentace zvuků – různé pravopisné systémy Jsou základem veškeré civilizace a kultury obecně Abecední písma – latinka, cyrilice a mnohá další Ideografická písma (logografická) – čínština, cca 50 tis. znaků (základ 9-12 tis. znaků) Slabičná písma – japonština, korejština

Přiřazení zvuků znakům Kolik hlásek (fonémů) má čeština? Kolik písmen má čeština? Kolik hlásek (fonémů) je v angličtině? Kolik písmen je v angličtině? 40-42: 36 (piš, jak slyšíš) 40-44: 26 Uvedená čísla naznačují povahu daného pravopisného systému – fonetický (čeština) vs. historický (angličtina) Spřežkové a diakritické systémy (v češtině)

Funkce pravopisných systémů Zaznamenávací – aby se to dobře psalo Vybavovací – aby se to dobře četlo Která funkce je důležitější? Vyváženost? Posílíme-li jednu funkci, oslabíme druhou a naopak Jaká je situace v praxi? Historické systémy (typicky angličtina, 14. stol.) Fonetické systémy (čeština, slovenština) Který systém je obtížnější k naučení? Spřežkové systémy – stará čeština, dnes zčásti i polština Lze získat přes milion liber za úspěšnou reformu anglického pravopisu? (nadace Bernarda Shawa, 1910) Pravopisné systémy jsou velmi konzervativní

Pravopisné chyby Jazyková správnost a gramotnost – podmínka úspěšné komunikace a profesionální úspěšnosti obecně Pravopis není gramatika (popis struktury jazyka) V čem se nejvíc chybuje? (styl, interpunkce) Typy pravopisných chyb Překlepy (prgram, studiijní, …) Morfologické chyby – koncovky (hloupejma) Syntaktické chyby – shoda (psaní y/i), vazby (valence) Styl a stylistické chyby – provedení nařízení Typografické chyby – mezery, pomlčky, spojovníky, uvozovky, fonty, jednopísmenové předložky na konci řádků Spisovnost : nespisovnost, formálnost : neformálnost

Opravování chyb v textech Snahou je, aby v našich textech bylo málo chyb Lidé – korektoři nejsou dokonalí Softwarové nástroje odhalující chyby (překlepy) v textech: různé typy korektorů Kde je lze najít? – v produktech, jako jsou Microsoft Office (Word), Open Office aj. Co dovedou? Mohou být chytřejší než uživatel? Opravují jednotlivá slova v textu obsahující chyby jako (chitrí, právda, mluvým, …) Korektory překlepů opravují jen jednotlivá slova, slovní spojení (v kontextu) šikovná student nikoli

Pravopisné korektory Jak jsou tyto nástroje konstruovány? Hrubá síla nebo inteligence? Kolik slov má čeština? Kolik slovních tvarů? PSJČ – cca 250 000 základních tvarů slov Slovních tvarů v češtině je kolem 60 milionů Morfologická analýza a morfologický analyzátor – může sloužit jako korektor překlepů Pro češtinu – morf. analyzátor majka, cca 400 000 českých kmenů (ukázka v nástroji DebDict, vytvořen v Centru ZPJ, používá jej firma Seznam)

Gramatické korektory Dovedou opravovat slovní spojení v kontextu, např. studentk šel do školi když pršeló. Na rozdíl od korektoru překlepů gram. korektor podtrhává zeleně a opravy jen doporučuje Chyby v gramatické shodě a vazbách Upozorňují také na chyby v interpunkci Povaha české interpunkce je syntaktická Gramatický korektor k dispozici jen v české verzi Wordu (Oliva, Květoň, Petkevič) Aplikace Grammaticon od Lingey – kvalita?

Gramatické korektory Co umí nástroj Grammaticon (od firmy Lingea) – falešné hlášky Co gramatické korektory nedovedou? Nakolik se na ně lze spolehnout? Evaluační parametry: přesnost a pokrytí Přesnost (úspěšnost) se dnes pohybuje do 70 %, jde o velmi těžkou úlohu Principy fungování gramatických korektorů? Automatická syntaktická analýza – parsery (Set), Plus další vhodná heuristická pravidla

Nebojme se pravidel českého pravopisu Knižní podoba Pravidel českého pravopisu Internetová jazyková příručka – ÚJČ a FI MU Má dvě části – slovníkovou a normativní Slovníková část pokrývá cca 60 000 čes. slov Běží na serveru Centra ZPJ, denně více než 30 tis. přístupů (ukázka) Příručka obsahuje automatickou morfologii a je nově doplněna o dva normativní slovníky Používá se ve standardně nejen ve školách

Pravidla českého pravopisu Je český pravopis obtížný? Kombinace fonetického a historického principu, fonetický převažuje V čem se nejvíc chybuje? Stylistické chyby – cca 23 %, jde tu o formulaci myšlenek, ta je nesnadná Interpunkční chyby – asi 20 % Ostatní – překlepy, y/i, velká písmena, tvary mne/mě, typografické chyby aj. Reformy českého pravopisu

Současný stav I Poslední reforma čes. pravop. proběhla v r. 1993 Pokus o tzv. demokratizaci pravopisu? Úprava psaní slov cizího původu (kurs/kurz) Ref. vedla k malé pravopisné válce (filos/zofie) Výsledek: špinavý kompromis (fonetizace) (ne)úspěšnost reformy si lze ověřit na datech – dnes na velkých souborech textů – korpusech Jaký je tedy současný stav? – je vidět, že norma je rozkolísaná – nejhorší možný výsledek

Současný stav II Korpusy (CzTenTen12) to potvrzují kurs: 65,360 vs. kurz: 581,913, feminismus: 11,895 vs. feminizmus: 332 Rozkolísanost standardů je obecně nežádoucí, komplikuje plynulost komunikace, reforma?? Bezbolestná úprava by byla ú/ů Za problém se pokládají velká písmena, volnost je značná Pokud jde o y/i, situace pro úpravu není zralá Případná inspirace slovenštinou Komunizmus: 3804 vs. komunismus: 107148, socializmus:  5,079 vs. socialismus: 91,734

Vyhlídky a perspektivy Institucí, která se stará o jazykovou kulturu v ČR, je Ústav pro jazyk český AV ČR Komunikuje s veřejností prostřednictvím Jazykové poradny (a nyní též IJP) Jejich aktuální přístup k problematice českého pravopisu je spíše liberální Lze očekávat nějaké reformy? Pro absolventy FI je potřebné, aby se v čes. prav. standardně orientovali a psali bez chyb

Další nástroje pro práci s jazykem Elektronické slovníky české – nástroj DebDict Vícejazyčné slovníky – např. produkty firmy Lingea Google Translator České překladače: Eurotran, PC Translator – málo kvalitní Problematika strojového překladu Morfologické a syntaktické analyzátory Dialogové systémy Porozumění přirozenému jazyku (extrakce inf.) Porozumění příběhům a zprávám, MUC, adresa: http://www-nlpir.nist.gov/related_projects/muc/proceedings/muc_7_toc.html

Počítače a PJ Komunikace mezi člověkem a počítačem je dnes primárně jednocestná Její kvalita ve skutečnosti závisí na tom, jak dobře uživatel zná programové vybavení svého počítače (jeho OS) Počítače s námi zatím nedovedou komunikovat Potřeba dvoucestnosti – zde se dostáváme k umělé inteligenci – její součástí je mj. zpracování PJ (modelování funkcí lidského mozku) Doplnit adresu Loebnerovy ceny: http://www.loebner.net/Prizef/loebner-prize.html

Počítače a PJ 2 Reprezentace znalostí o světě, inference (logika), zvládnutí PJ (gramatika) – tři součásti Dialogové systémy je musí obsahovat Turingův test, Eliza, chatboty, každoroční soutěž o Loebnerovu cenu, roboty Zpracování mluvené řeči – diktovací systémy Dovedou přepisovat zvuky na znaky – pro češtinu: Newton Technologies, Dictate 4 U těchto systémů zatím nejde o porozumění PJ

Mgr. Jiří Materna, Seznam Vysokou školu jste neproseděl pouze u počítače, ale zahrál jste si například i ve fakultním divadle. Jaké to bylo, když se informatici pustili do divadla? Celá řada lidí si myslí, že divadlo na fakultě informatiky nemá co dělat, ale já jsem přesvědčený o opaku. Problémem českého školství je obrovská pasivita studentů a jejich neschopnost prezentovat své myšlenky na veřejnosti. Je to dáno především tím, že k tomu nejsou vedeni již od útlého věku. Často se stává, že si studenti sedají co nejdále od katedry a vůbec se nezapojují do diskuse, protože mají obavy, aby se neztrapnili. Později třeba něco prezentují na odborné konferenci, kuňkají, a přestože mají obsahově silné téma, nedokáží jej prodat. Sám jsem od přírody introvert a účinkování v divadle před lidmi nacpanou posluchárnou mi v tomhle hrozně pomohlo.