- Ukončenie: Skúška
Vyučujúci
Zaradený v študijných programoch
Výsledky vzdelávania
Študenti nadobudnú v prípade úspešného zvládnutia predmetu najmä nasledovné vedomosti:
- základné vedomosti v oblasti programovania v SQL,
- základné vedomosti o spracovaní a vizualizácii dát a o štatistických analýzach v jazyku R,
- základné vedomosti o spracovaní a vizualizácii dát a o štatistických analýzach v jazyku Python.
Študenti nadobudnú v prípade úspešného zvládnutia predmetu najmä nasledovné zručnosti:
- schopnosť využívať základné nástroje k spracovaniu, vizualizácii a analýze dát v jazyku R
a Python,
- schopnosť využívať základné nástroje SQL pri práci s databázami.
Študenti nadobudnú v prípade úspešného zvládnutia predmetu najmä nasledovné kompetencie:
- praktické zručnosti a kompetencie s aplikáciou metód slúžiacich na analýzu dát a riešenie ekonomických problémov pre podporu rozhodovanie na reálnych dátach prevažne v ma-loobchode.
Pri výučbe sa bude klásť dôraz na spoluprácu s praxou.
Študent by teda v prípade úspešného zvládnutia predmetu mal vedieť analyzovať údaje pomocou rôznych nástrojov, riešiť problémy využitím rôznych techník modelovania, dizajnovať analytickú infraštruktúru, vytvárať sofistikované analytické modely s cieľom získania komplexných výstupov z dát za účelom informovania klienta a uľahčenie jeho obchodného rozhodovania.
Stručná osnova predmetu
Úvod do SQL. Základné štruktúry. Základné príkazy (Select, Where, Order By, ...). Typy dát. Kľúče. Spájanie dát (Join, Inner Join, Union,...). Efektívne písanie kódu v SQL. Window Function.
Praktická analýza dát v jazyku R. Knižnice. Premenné. Polia. Data Frames. Funkcie. For cyklus. If.
Praktická analýza dát v jazyku Python.
Praktická štatistická analýza dát v jazyku R a Python zahrňujúca základy opisnej štatistiky, induktívnej štatistiky, regresnej analýzy, analýzy časových radov a vizualizácie v uvedených oblastiach Praktické analýzy dát v jazyku R a Python budú realizované na reálnych údajoch.
Odporúčaná literatúra
BEAULIEU, A. Learning SQL: Generate, Manipulate, and Retrieve Data. O'Reilly, 2020.
ALBERT, J. – RIZZO, M. R by Example. New York : Springer, 2012.
DE LAFAYE MICHEAUX, P. – DROUILHET, R. – LIQUET, B. The R Software. Fundamentals
of Programming and Statistical Analysis. New York : Springer, 2013.
UNPINGCO, J. Python for Probability, Statistics, and Machine Learning. Second Edition. Cham:
Springer Nature Switzerland AG, 2016.
Wickham. H. – Grolemund, G. R for Data Science – visualize, model, transform, tidy and import
data, O'Reilly, 2017.
Sylabus predmetu
1. Ako vyzerá skutočná databáza a ako vyzerajú skladované reálne dáta? (Úvod do SQL. Základné štruktúry. Základné príkazy (Select, Where, Order By, ...). Typy dát. Kľúče.) 2. Ako extrahovať potrebné dáta z databázy pre ďalšiu analýzu? (Spájanie dát (Join, Inner Join, Union, ...) 3. Ako ušetriť hodiny pri náročných databázach pri sťahovaní a analyzovaní dát cez SQL? (Efektívne písanie kódu v SQL. Window Function.) 4. Sumarizácia vedomostí (Precvičovanie predchádzajúcich úloh. Indexovanie.) 5. Ako používať R-ko, jeden z dátovými analytikmi najpoužívanejších jazykov? (Úvod do R. Knižnice Premenné. Polia. Data Frames. Funkcie. For cyklus. If.) 6. Ako vykonať úvodnú deskriptívnu a exploratívnu analýzu dátového súboru? (Základné štatistické ukazovatele (stredná hodnota, rozptyl, kvantily). Grafy (histogram, boxplot).) Aká je hodnota priemerného košíka? Koľko produktov obsahuje? Má prevádzka nejakých veľkonákupcov? 7. Ako si overiť a otestovať hypotézy v R-ku (časť 1)? (Štatistická indukcia. Testovanie štatistických hypotéz. Parametrické testy.) Je priemerná výška nákupu v prevádzke rovnaká v regiónoch? 8. Ako si overiť a otestovať hypotézy v R-ku (časť 2)? (Štatistická indukcia. Testovanie štatistických hypotéz. Neparametrické testy.) 9. Ako zistím základné vzťahy a súvislosti medzi premennými dátového súboru? (Korelačná a asociačná analýza. Kovariancia. Korelácia a korelačné koeficienty. Chi-kvadrát test, miery asociácie) Keď zákazník platí bodmi, nakupuje za viac peňazí? Čím viac bodov má zákazník na vernostnej karte, tým nakupuje drahšie výrobky? 10. Ako zistím vzťah medzi dvomi/ viacerými nezávislými/ závislými skupinami dátového súboru? (F-test, t-test a ANOVA – parametrická/neparametrická.) Obsahujú košíky zákazníkov s vernostnou kartou drahšie výrobky ako košíky zákazníkov bez vernostnej karty? Zákazníci s vyššou úrovňou vernostnej karty nakupujú viac ako zákazníci s nižšou úrovňou? 11. Ako odhalím zložitejšie vzťahy v dátach a vytvorím predikciu? (Regresné modely - lineárne/ logistické. Jednoduchý a viacnásobný lineárny/ logistický model. Metóda najmenších štvorcov.) Od čoho všetkého závisí výška nákupu zákazníka? 12. Ako identifikujem trend v dátach? (Analýza časových radov. Rozklad časového radu na zložky. Určovanie trendu.) 13. Ako využiť nadobudnuté vedomosti v čoraz častejšie používanom jazyku Python?
Podmienky na absolvovanie predmetu
aktívna účasť na cvičeniach počas semestra (10%),
vypracovanie projektu (30%)
písomná skúška (60%).
Pracovné zaťaženie študenta
účasť na cvičeniach 26 h,
príprava na cvičenia 13 h,
vypracovanie projektu 13 h,
príprava na skúšku 26 h
Spolu 78 hodín.
Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu
slovenský
Dátum schválenia: 11.03.2024
Dátum poslednej zmeny: 08.11.2023
Dátum schválenia: 11.03.2024
Dátum poslednej zmeny: 08.11.2023