Dátová analýza a vizualizácia

Vyučujúci

Zaradený v študijných programoch

Výsledky vzdelávania

Výsledky vzdelávania:
Študenti nadobudnú v prípade úspešného zvládnutia predmetu najmä nasledovné vedomosti:
- základné vedomosti o spracovaní a vizualizácii dát v R,
- základné vedomosti v oblasti programovania v R,
- základné vedomosti o tvorbe projektov v R,
- základné vedomosti o možnostiach práce s veľkými databázami pomocou využitia programu R.
Študenti nadobudnú v prípade úspešného zvládnutia predmetu najmä nasledovné zručnosti:
- schopnosť využívať základné nástroje k spracovaniu, vizualizácii a analýze dát v R,
- ovládanie programu R a RStudia.
 
Študenti nadobudnú v prípade úspešného zvládnutia predmetu najmä nasledovné kompetencie:
- praktické zručnosti a kompetencie s aplikáciou metód slúžiacich ku analýze dát a riešenia ekonomických,
ale aj iných problémov.

Stručná osnova predmetu

Stručná osnova predmetu:
Cieľom tohto predmetu je poskytnúť vedomosti v oblasti analýzy dát v softvéri R a nástrojov na ich
aplikáciu pri riešení konkrétnych empirických problémov. Dôraz sa kladie na problematiku spracovania,
selekcie, modelovania a vizualizácie dát. Tento kurz tiež obsahuje základné informácie o možnostiach
práce s veľkými databázami využitím programu R.
1. Matematické operácie v R, logické operátory a operátory porovnávania, typy dát v R, definovanie
premenných a vektorov, indexovanie vektorov a operácie s vektormi, zoznamy.
2. Tvorba matíc, operácie s maticami, indexovanie matíc, tvorba tabuľkových štruktúr pomocou
dátových rámcov (data frames), selekcia a indexovanie dátových rámcov a operácie s dátovými
rámcami, import a export dát.
3. Základy programovania v R, podmienka if else, funkcia ifelse, využitie cyklov – for, while, tvorba
vlastných funkcií.
4. Základné informácie o skupine knižníc tidyverse určenej k importovaniu, manipulácii dát,
modelovaniu a vizualizácii.
5. Manipulácia s dátami, výber premenných, filtrovanie premenných, výpočet sumárných štatistík.
6. Príprava a čistenie dát k dátovej analýze, zoskupenie dát podľa konkrétnych premenných, práca
s kategorickými dátami, práca s časovými formátmi.
7. Práca s tabuľkovými štruktúrami, práca s relačnými dátami, spájanie dát z viacerých tabuliek na
základe kľúčov, filtrovanie využitím viacerých tabuliek.
8. Využitie knižnice ggplot2 k tvorbe rôznych typov grafov (stĺpcový graf, koláčový graf, čiarový
graf, histogram, bodový graf, Boxplot…) a nastavenie vybraných parametrov jednotlivých grafov.
9. Využitie vizualizácie a transformácie dát k systematickej analýze údajov. Kroky
prieskumnej/exploratívnej analýzy údajov.
10. Práca s nástrojom Markdown R slúžiacemu k spájaniu textu, kódu a výsledkov.
11. Využitie interaktívnych a dynamických grafických nástrojov dátovej analýzy. Zobrazovanie
viacdimenzionálnych dát.
12. Pripojenie cez prostredie R k SQL databáze a práca s ňou. Práca s veľkými databázami a pripojenie
k iným typom databáz.
13. Formulácia a zodpovedanie výskumnej otázky pomocou konštrukcie regresného modelu a jeho
testovania.

Odporúčaná literatúra

Odporúčaná literatúra:
1. WICKHAM, Hadley; ÇETINKAYA-RUNDEL, Mine; GROLEMUND, Garrett. R for data
science. " O'Reilly Media, Inc.", 2023. https://r4ds.hadley.nz/
2. WILKINSON, Leland. ggplot2: elegant graphics for data analysis by WICKHAM, H. 2011.
3. SIEVERT, Carson. Interactive web-based data visualization with R, plotly, and shiny.
Chapman and Hall/CRC, 2020.
4. J. Bryan – STAT545. https://stat545.com/
5. P. L. de Micheaux, R. Drouilhet, B. Liquet (2013). The R Software – Fundamentals of
Programming and Statistical Analysis, Springer.

Podmienky na absolvovanie predmetu

Podmienky na absolvovanie predmetu:
10 % aktívna účasť
30% zadania a projekt
60 % záverečná skúška

Pracovné zaťaženie študenta

Pracovné zaťaženie študenta (v hodinách):
Celkové: pracovná záťaž 6 kreditov x 26 h = 156 h.
Samostatne zaťaženie pre jednotlivé vzdelávacie činnosti
Účasť na seminároch: 26 hodín
Účasť na prednáškach: 26 hodín
príprava na semináre: 13 hodín
príprava na zadania: 26 hodín
Spracovanie semestrálneho projektu: 39 hodín
Príprava na skúšku: 26 hodín

Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu

Slovenský jazyk

Dátum schválenia: 04.03.2025

Dátum poslednej zmeny: 21.10.2024

Dátum schválenia: 04.03.2025

Dátum poslednej zmeny: 21.10.2024