SAS a jeho výhody oproti Excelu 3MA381 Zuzana Urbanová Prezentace o SASu a jeho výhodách oproti Excelu.
Obsah Základní informace o SASu Porovnání SASu a Excelu Návaznost SASu a Excelu Shrnutí Zdroje Obsah. 18.9.2018 3MA381
Základní informace o SASu =statistical analysis system Integrovaný systém softwarových produktů pro manipulaci s daty, jejich analýzu a prezentaci Ve firmách: Databázový systém Nástroj pro analýzu a obchodní využití dat Statistická analýza dat Modulární software Obsahuje vlastní programovací jazyk SAS je zkratka pro „statistical analysis system“. Jedná se o integrovaný systém softwarových produktů pro manipulaci s daty, jejich analýzu a prezentaci. Ve firmách se užívá jako databázový systém, nástroj pro analýzu a obchodní využití dat a jako nástroj pro statistickou analýzu dat. Jedná se o tzv. modulární software, zákazník může využívat jen ty části, které potřebuje. SAS obsahuje vlastní programovací jazyk. 18.9.2018 3MA381
SAS produkty Base SAS - manipulace s daty a příprava výstupu SAS/STAT - provádí základní statistickou analýzu SAS/GRAPH - grafická prezentace dat SAS/ETS - provádí analýzu časových řad a ekonometrickou analýzu SAS/AF - vývoj interaktivních aplikací SAS enterprise guide - nadstavba všeho, uživatelsky jednodušší Zde jsou příklady jednotlivých produktů SASu. Chceme-li např. používat nějaké statistické procesy a funkce, musíme se nejdříve připojit na příslušnou „knihovnu“. Relativní novinkou je produkt SAS enterprise guide. Enterprise guide má vestavěnu většinu obvykle využívaných funkcí a operací. Pro jejich provedení není nutné psát celou proceduru, ale stačí pouze poklepat na příslušné tlačítko a v dialogovém okně nastavit parametry. 18.9.2018 3MA381
Uživatelé Komerční banka Česká pojišťovna ČPP Česká spořitelna KOOPERATIVA ČSOB Leasing T-Mobile ČEZ Český statistický úřad … VŠE Praha Univerzita Karlova v Praze ČZU Praha VŠB-TU Ostrava UP Olomouc Mendelova zemědělská a lesnická univerzita v Brně VUT Brno MU Brno Univerzita obrany Rychlá ukázka uživatelů SASu v ČR. 18.9.2018 3MA381
Excel Není to statistický program Omezené množství funkcí Omezený počet řádků Je velice nepřesný Předdefinované různé finanční funkce- ne úplně ideálně Je pomalejší, často padá Levnější, jednodušší, názornější, přístupnější Excel vůbec nebyl vytvořen jako statistický program, ale jako „lepší kalkulačka“. Měl uživateli usnadnit jednoduché numerické výpočty. Má tedy jen omezené množství funkcí. Statistické funkce má jen jako jakousi nadstavbu a z těch složitějších umí jen ty základní (např. chí kvadrát, t-test). Má jen omezený počet řádků, které může načíst (cca 66000)- to je v praxi málo a je velice nepřesný (při obtížnějších výpočtech). Dochází zde totiž k velkému zaokrouhlování, díky čemuž pak vznikají značné chyby a matematické nepřesnosti. Má předdefinované různé finanční funkce, např. pro výpočty úroků, anuitních plateb apod. Tyto funkce jsou ale jasně definované, takže pokud by došlo k nějaké byť jen malé změně (např. jeden měsíc by byla větší splátka), neodkáže si s i s tím poradit, celý proces se naruší. Excel je daleko pomalejší než SAS, pracuje stále s celým souborem-se všemi daty najednou, často padá. K výhodám Excelu patří to, že je mnohem levnější, uživatelsky jednodušší a názornější a školení uživatelů je přístupnější. 18.9.2018 3MA381
SAS SAS načítá po řádcích-> pracuje rychle Uložené procedury lze spustit pro nová data SAS také zaokrouhluje (ale méně) Lepší grafická stránka (přesnější grafy) Jednodušší propojovaní tabulek Schopnost číst data přímo z ftp a http serverů Velice drahý (i vyškolení) SAS načítá po řádcích, nepracuje tedy se všemi daty najednou jako Excel. To umožňuje rychlou práci i s obrovským množstvím dat. Je-li projekt hotový, uložené procedury můžeme jednoduše spustit i pro nová data. V Excelu bychom to museli dělat ručně. SAS také zaokrouhluje, ale většinou až na konci procesu a ne tolik jako Excel, výsledky jsou pak tedy matematicky daleko přesnější. Navíc je SAS daleko přesnější i po stránce grafické. Oproti Excelu je zde mnohem jednodušší např. propojování tabulek, Excel tento proces nemá jako základní funkci a propojení tabulek lze provést jen složitě. Další výhodou je, že dokáže číst data přímo z ftp a http serverů, tzn. není potřeba mít data uložená přímo v počítači, ale můžeme je „tahat“ po síti např. z nějaké centrální podnikové databáze. Nevýhodou SASu je to, že je velice drahý, drahý je pak i proces proškolování zaměstnanců (uživatelů), protože práce se SASem je poněkud složitější. 18.9.2018 3MA381
Ukázka práce v SASu Ukázka práce v SASu. Načítání dat z externího souboru, zadání požadavku na vzhled a uspořádání dat, kód run. Dále požadavek na tisk. Vidíme také výstup dané operace. 18.9.2018 3MA381
Návaznost SASu na Excel Soubor formátu xls-> importovat do systému a uložit ho do knihovny SAS Možno importovat pouze jeden list ze souboru (první list) Vhodné importovaný soubor předem připravit Zajímavost: datum z Excelu se převede jako počet dní od 1.1.1960, čas jako počet sekund od půlnoci Chceme-li pracovat v SASu se souborem formátu XLS, musíme tento soubor do SASu importovat a uložit ho do knihovny. Velkou nevýhodou je, že je možno importovat vždy jen jeden list ze sešitu Excelu, automaticky je to ten první. Je tedy vhodné si vždy data v Excelu předem připravit a co nejvíce zjednodušit jeho strukturu, protože následná úprava v SASu by pak mohla být obtížná. Zajímavostí je, že importujeme-li do SASu nějakým způsobem formát data (např. tabulka se jmény a daty narození), převede se toto datum v SASu jako počet dnů od 1.1.1960. Podobně pak čas se převede na počet sekund od půlnoci. 18.9.2018 3MA381
Excel toho umí méně a méně kvalitně Shrnutí SAS umí vše co Excel Excel toho umí méně a méně kvalitně V triviálním shrnutí lze říct: SAS umí vše co Excel, Excel toho umí méně a méně kvalitně. 18.9.2018 3MA381
Zdroje Libor Šlik: Porovnání statistických balíků SPSS a SASů; Česká zemědělská univerzita v Praze Diane E. Brown: Guide to SAS/DB2 ; Intertext Publications Učební materiály UP Olomouc Použité zdroje. 18.9.2018 3MA381
Děkuji za pozornost! 18.9.2018 3MA381