Aplikovaná dátová analýza (v anglickom jazyku)

Zaradený v študijných programoch

aplikovaná ekonómia v anglickom jazyku

Výsledky vzdelávania

Cieľom predmetu je naučiť študentov vedomosti a zručnosti o moderných metódach aplikovanej
dátovej analýzy, štatistického učenia, vrátane používania softvéru R, na vykonávanie empirického
ekonomického výskumu a navrhovanie výskumných dizajnov a metódy pre riešenie ekonomických
problémov.
Po absolvovaní predmetu by mali študenti získať:
a.) vedomosti o moderných metódach výskumu a vizualizácie údajov, lineárnej regresie a
všeobecnej dátovej analýzy a štatistického učenia.
b.) zručnosti v práci s údajmi, ktoré budú schopní využiť vo vlastnom empirickom výskume.
Súčasne získajú pokročilé zručnosti pre používanie moderných softvérov (R) v empirickom
ekonomickom výskume, budú schopní písať vlastné funkcie, používať funkcie na vizualizáciu
údajov a empiricky odhadovať pokročilejšie metódy štatistického učenia.
c.) kompetentnosť navrhnúť výskumný dizajn pre zadaný ekonomický problém a uskutočniť
analýzu dát. Budú kompetentní ďalej rozvíjať svoje vedomosti dátovej analýzy a v používaní
moderných softvérov, búdu rozumieť empirickým článkom z aplikovanej dátovej analýzy a budú
ich schopní použiť v nových kontextoch.

Stručná osnova predmetu

1. Úvod do programovacieho jazyka R a anatómia funkcií
2. Základné matematické a štatistické koncepty v štatistickom učení, notácia a typy premenných
3. Úvod do typov údajov, ich načítanie, čistenie, spájanie
4. Vizualizácia kategorických premenných
5. Vizualizácia numerických údajov
6. Sumarizácia vzťahu dvoch (kategorických a numerických) premenných - lineárny a nelineárny
vzťah, bodový graf, korelácia a kvantilový graf
7. Randomizácia a náhodné kontrolované experimenty, neskreslenosť a konzistencia odhadu
8. Štandardné chyby a intervaly spoľahlivosti, analýza a testovanie hypotéz, parametre vs.
hyperparametre, klasifikácia vs. regresia
9. Fundamentálne algoritmy I.: lineárna regresia
10. Fundamentálne algoritmy II.: logistická regresia, rozhodovanie stromy, stroje s podpornými
vektormi, k-najbližšie okolia
11. Anatómia štatistického učenia, minimalizácia gradientu, základné úpravy premenných a výber
algoritmu, under- vs overfitting
12. Úprava vysvetľujúcich premenných (kódovanie, normalizácia, spracovanie chýbajúcich
údajov), regularizácia a výber premenných modelu a vyhodnocovanie kvality modelu
13. Pokročilé metódy štatistického učenia

Odporúčaná literatúra

Základná literatúra:
Hadley, W. , Çentikaya-Rundel, H., a Garrett ,G., 2022. R for data science. O’Reilly Media, Inc.
Burkov, A. The Hundred-Page Machine Learning Book. GitHub.
Odporúčaná literatúra:
James, G., Witten, D., Hastie, T. a Tibshirani, R., 2013. An Introduction to Statistical Learning: with Applications in R. New York: Springer.
Imai, K., 2018 Quantitative social science: An Introduction. Princeton University Press.

Podmienky na absolvovanie predmetu

20 % - aktivita na seminároch
20 % - zadania
60 % - záverečná skúška

Pracovné zaťaženie študenta

Celkové pracovné zaťaženie študent: 78 h
účasť na seminároch 26 h,
príprava na semináre 13 h,
spracovanie zadaní 13 h,
príprava na skúšku 26 h

Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu

Anglický jazyk

Dátum schválenia: 04.03.2025

Dátum poslednej zmeny: 15.03.2026

Dátum schválenia: 04.03.2025

Dátum poslednej zmeny: 15.03.2026