Ing. David Pejčoch přednáška č. 1 Zpracování informací a znalostí úvodní cvičení pondělí 18:00 – 19:30, pátek 14.30 – 16.00 Ing. David Pejčoch přednáška č. 1
Představení lektora Ing. David Pejčoch Raiffeisenbank, a.s. project manager Generali pojišťovna, a.s. vedoucí skupiny CRM Kooperativa pojišťovna a.s., VIG analytik pro data mining - specialista pojistný matematik samostatný programátor – analytik ČPP a.s., VIG disponent VŠE Praha doktorand oboru Aplikovaná informatika zaměření na řízení datové kvality vyučující předmětů Zpracování informací a znalostí, Řízení datové kvality Business Institut Data management Knowledge management Audit informačních systémů Webové technologie
Osnova 1. cvičení Průběh kurzu Požadavky na absolvování kurzu Zadání úkolu č. 1 Rozdělení do týmů
Kontakt, konzultační hodiny Základní informace o kurzu: www.pejcoch.com, stránky kurzu v sekci Výuka a lektorská činnost Kontakt: david@pejcoch.com Konzultační hodiny: po dohodě s vyučujícím (emailem nebo osobně na cvičení)
Zpracování informací a znalostí Cíle: seznámení s vybranými metodami ukládání a vyhledávání informací získávání a zpracování formalizovaných znalostí poukázat na vzájemné souvislosti naznačit předpokládaný vývoj Zásady: řešení praktických úkolů na cvičení seznámení se základy související teorie přednášky odborníků z praxe možnost zapojení do souvisejícího výzkumu na KIZI (KEG) 5 5
Gant kurzu 4IZ210 – LS 2011/2012 I. II. III. IV. V. VI. VII. VIII. IX. XI. XII. XIII. XIV. CV1: Organizace cvičení, podmínky úspěšného zakončení, ... CV2: Informační zdroje, vyhledávání na internetu, SWOT CV3: Citační etika, citační normy, formální úprava práce a prezentace CV4: Sémantické anotování Gant kurzu 4IZ210 – LS 2011/2012 Úkol 1a: CI studie Úkol 1b: Příprava oponentury CV5: Obhajoba CI studie CV6: Úvod do značkovacích jazyků, HTML, XML a jeho klony, úvod do CSS Úkol 1c: Anotace CI studie pomocí ATOM CV7: Regulární výrazy – teorie a praktické využití (např. Data Quality) CV8: Spojení regulárních výrazů a XML Úkol 2a: Produktový katalog CV9:Úvod do DZD, metody, úlohy, trendy Úkol 2b: Regulární výrazy CV10: DZD nástroje, vizualizace znalostí CV11: Použití nástroje Lisp Miner CV12: Společná práce na úkolu č. 3 CV13: Společná práce na úkolu č. 3 Úkol 3: Aplikace procedury ASSOC v nástroji Lisp Miner
Náplň cvičení – proč sem chodit? Rozšiřující výklad k tématům probíraným na přednáškách Příklady z praxe Společná práce na úkolech Procvičování příkladů, se kterými se lze setkat u zkoušky Průběžné testy (regulární výrazy, rozhodovací stromy) !!!!! Ze zkušeností je vhodné komunikovat s ostatními členy týmu osobně – na každém cvičení bude ponechán prostor pro „týmové porady“ V případě sporů mezi členy týmu ohledně míry zapojení jednotlivců je posuzována docházka 7 7
Klasifikace dat podle míry strukturovanosti Nestrukturovaná data Semistrukturovaná data Strukturovaná TXT dokumenty Audio Video Grafika tok bytů <?xml version=„1.0“?> <osoba> <jmeno> David Veliký </jmeno> <tel>2191 4264</tel> <email> mujmail@mailbox.cz </email> </osoba> Databáze
Literatura ke studiu Aktuální výukové materiály, viz pejcoch.com, sekce vyuka Prezentace, zadání úkolů, doplňující materiály Skripta prof. Raucha Materiály z přednášek SKLENÁK, V. a kol. Data, informace, znalosti a Internet. Praha: C. H. Beck 2001. ISBN 80-7179-409-0. Typ Autor Název Místo vydání Nakladatel Rok ISBN Z RAUCH, J. Metody zpracování informací. [Část] 2, Ukládání a vyhledávání Praha Vysoká škola ekonomická 1996 80-7079-870-X D BABKA, M. Kde a jak hledat informace o firmách Management Press 1994 80-85603-56-X BERKA, P. Dobývání znalostí z databází Academia 2003 80-200-1062-9 Poklady z přednášek
Bodování úkolů ze cvičení Úkoly na cvičení Č. Úkol Klasifikačních jednotek 1 Analýza konkurenčního prostředí 0 – 19 (minimum 10) (včetně prezentace) 2 Oponentura 0 – 6 (minimum 3) 3 Regulární výrazy a XML 0 – 14 (minimum 7) z toho 2 za individuální úkol 4 Dobývání znalostí z databází 0 – 21 (minimum 11) z toho 2 za individuální úkol Celkem 0 – 60
počet KJ ze cvičení + počet KJ z testu Určení známky Určení celkových bodů pro hodnocení Celkový počet klasifikačních jednotek (KJ) Bodů pro hodnocení ze cvičení z testu 30 a více 20 a více počet KJ ze cvičení + počet KJ z testu 0 až 19 0 až 29
počet bodů pro hodnocení celkem Výsledná známka určení známky počet bodů pro hodnocení celkem známka 90 – 100 1 75 – 89 2 60 – 74 3 50 – 59 4+
Důležité organizační pokyny k úkolům Pokud není uvedeno jinak, odevzdávají se všechny úkoly přes ISIS CI studii musí odprezentovat celý tým (posun termínu lze dohodnout) Úkoly jsou týmové => pokud se tým nedohodne jinak, nepodílení se na výsledku = bodová penalizace jednotlivce V rámci ISISu budou pro každý úkol otevřeny odevzdávárny Stačí, když do odevzdávárny uloží úkol jeden zástupce týmu Pro spolupráci v rámci týmu je vhodné použít Groupware nástroje (např. Dropbox)
Zadání úkolu č. 1: přiřazení firem Firma Pátek 14:30-16:00 SB 108 D. Pejčoch (100 %) 20 CHODOS CHODOV s.r.o. Výroba a opravy jiných účelových strojů j.n. ALTECH, spol. s r.o. Výroba a opravy zvedacích a manipulačních zařízení ROTAS STROJÍRNY spol. s r.o. TOSHULIN, a.s. Výroba a opravy ostatních kovoobráběcích strojů LEGIOS a.s. Výroba a opravy železničních a tramvajových lokomotiv a vozového parku
Zadání úkolu Základní referenční a ekonomické údaje: zařazení činností podle kódu NACE (firma může být zařazena ve více kategoriích), možno použít aplikaci ČSÚ na adrese http://apl.czso.cz/iSMS/cislist.jsp?frodina=1 Nabízené produkty, pro každý produkt: uváděný název, uváděnou charakteristiku (popis) zařazení dle HS kódu - pomocí aplikace ČSÚ na adrese http://apl.czso.cz/iSMS/cisdet.jsp?kodcis=5574 Související firmy / organizace (stačí název, IČ a webová stránka): konkurenti, odběratelé, (zákazníci, prodejci), dodavatelé, vlastníci / investoři, poskytovatelé úvěrů, poskytovatelé různých dotací, dlužníci, věřitelé, partneři (výzkum, vývoj, subdodávky), Související osoby: (jména a případně kontaktní údaje) vlastníci, statutární orgány, management, klíčoví experti (vývoj, výroba, podpora), obchodníci (nákupčí, prodejci), klíčové kontaktní osoby
Zadání úkolu Související události (pojmenování, čas, místo): úspěchy (ocenění, získání zakázek), neúspěchy (aféry, problémy, ztráty zakázek), účast na akcích (výstavy, výběrová řízení), fúze, akvizice, získání úvěrů, dotací Projekty: realizace zakázek, vývoj produktů, státní podpora - granty/dotace Související „pravidla“: závazné předpisy / zákony (regulace), získané certifikace (ISO, bezpečnost, ….) Nejméně tři studie týkající se technologií souvisejících s danou firmou, použijte zdroje Proquest, JSTOR, Google Scholar, Web of Knowledge. U každé studie uveďte hlavní myšlenky. Stručná SWOT analýza pro danou firmu s důrazem na získané informace Příležitosti - řešené potřeby zákazníků / trhu, Hrozby - vlivy sociální, technologické, ekonomické, environmentální, politické Silné stránky / výhody – majetek, know-how, patenty Slabé stránky / nevýhody - závislost na zdrojích (suroviny, produkty, lidé)
Informační zdroje komerční a dostupné na VŠE: ANOPRESS IT, CreditInfo – Firemní monitor, ProQuest, JSTOR, Web of Knowledge dostupné na adrese http://www.vse.cz/zdroje/ patenty a duševního vlastnictví, viz http://www.upv.cz a zejména http://www.upv.cz/cs/sluzby-uradu/databaze-on-line.html; CENIA – informační systémy České informační agentury životního prostředí, http://www.cenia.cz/__C12571B20041E945.nsf/$pid/CENMSFVGSU09 Informační Systém o Veřejných Zakázkách, viz http://www.isvzus.cz/ TED (Tenders Electronic Daily), informační systém o veřejných zakázkách EU, který obsahuje především zakázky většího rozsahu http://ted.europa.eu/TED/main/HomePage.do Administrativní registr ekonomických subjektů, http://wwwinfo.mfcr.cz/ares/ares.html.cz Oficiální server českého soudnictví http://www.justice.cz – obchodní rejstřík, insolvenční rejstřík Google Scholar a případně další informační zdroje dle vlastní úvahy.
Formální / obsahové náležitosti Bude vypracována ve Wordu a předána v elektronické formě. Název bude „Analýza konkurenčního prostředí pro název firmy.“ Bude mít titulní list, číslované stránky a obsah. Bude mít úvod, ve kterém bude sděleno, o čem studie je a jakou má strukturu, co je v jednotlivých kapitolách. Každému z výše uvedených bodů A1) až A9) bude odpovídat jedna kapitola. Může se ale stát, že se k některému bodu nepodaří získat žádné relevantní informace. V tom případě popište způsob, jak jste hledali (informační zdroj + formulované dotazy). Pokud bude některá kapitola obsahovat příliš různorodé informace nebo bude příliš dlouhá, bude rozčleněna na vhodné odstavce. Studie bude obsahovat seznam nalezených pramenů (články, studie, webové stránky) a v textu citace na ně. Bude použita funkce MS Word 2007 a vyšší pro správu pramenů, citační styl zvolte ISO 690 – číselná reference. Pokud bude při vypracování použit článek nalezený v nějakém zdroji (např. v ProQuestu), tak bude citován tento článek, ne celý zdroj (tedy ne ProQuest).
Popis informačních zdrojů Pro vyhledávače dokumentů – např. ANOPRESS IT, ProQuest, JSTOR, Web of Knowledge, Google Scholar tematický rozsah dostupnost (placený, volně dostupný), uveďte, zda jsou dostupné primární prameny které z dále uvedených prostředků pro vyhledávání jsou k dispozici podporované booleovské operátory pravostranné a levostranné rozšíření proximitní operátory omezení retrospektivy seznam dalších prostředků případná specifika zdroje seznam pramenů, které byly nalezeny přes tento zdroj.
Popis informačních zdrojů Pro ostatní použité např. Justice.cz typ poskytovaných informací možnosti vyhledávání seznam informací, které byly nalezeny přes tento zdroj
Požadované výstupy úkolu č. 1 Informační studie ve formátu MS Word Prezentace k informační studii shrnující základní fakta ve formátu MS Power Point Oponentura k informační studii jiného týmu ve formátu MS Word Prémiový úkol za 3 body: anotace pomocí nástroje FreeMind
Rozdělte se do týmů … +