Aplikovaná dátová analýza

Vyučujúci

Zaradený v študijných programoch

Výsledky vzdelávania

Cieľom predmetu je naučiť študentov vedomosti a zručnosti o moderných metódach aplikovanej dátovej analýzy, štatistického učenia, vrátane používania softvéru R, na vykonávanie empirického ekonomického výskumu a navrhovanie výskumných dizajnov a metódy pre riešenie ekonomických problémov.
Po absolvovaní predmetu by mali študenti získať:
a.) vedomosti o moderných metódach výskumu a vizualizácie údajov, lineárnej regresie a všeobecnej dátovej analýzy a štatistického učenia.
b.) zručnosti v práci s údajmi, ktoré budú schopní využiť vo vlastnom empirickom výskume. Súčasne získajú pokročilé zručnosti pre používanie moderných softvérov (R) v empirickom ekonomickom výskume, budú schopní písať vlastné funkcie, používať funkcie na vizualizáciu údajov a empiricky odhadovať pokročilejšie metódy štatistického učenia.
c.) kompetentnosť navrhnúť výskumný dizajn pre zadaný ekonomický problém a uskutočniť analýzu dát. Budú kompetentní ďalej rozvíjať svoje vedomosti dátovej analýzy a v používaní moderných softvérov, búdu rozumieť empirickým článkom z aplikovanej dátovej analýzy a budú ich schopní použiť v nových kontextoch.

Stručná osnova predmetu

1. Úvod do programovacieho jazyka R a anatómia funkcií
2. Základné matematické a štatistické koncepty v štatistickom učení, notácia a typy premenných
3. Úvod do typov údajov, ich načítanie, čistenie, spájanie
4. Vizualizácia kategorických premenných
5. Vizualizácia numerických údajov
6. Sumarizácia vzťahu dvoch (kategorických a numerických) premenných - lineárny a nelineárny vzťah, bodový graf, korelácia a kvantilový graf
7. Randomizácia a náhodné kontrolované experimenty, neskreslenosť a konzistencia odhadu
8. Štandardné chyby a intervaly spoľahlivosti, analýza a testovanie hypotéz, parametre vs. hyperparametre, klasifikácia vs. regresia
9. Fundamentálne algoritmy I.: lineárna regresia
10. Fundamentálne algoritmy II.: logistická regresia, rozhodovanie stromy, stroje s podpornými vektormi, k-najbližšie okolia
11. Anatómia štatistického učenia, minimalizácia gradientu, základné úpravy premenných a výber algoritmu, under- vs overfitting
12. Úprava vysvetľujúcich premenných (kódovanie, normalizácia, spracovanie chýbajúcich údajov), regularizácia a výber premenných modelu a vyhodnocovanie kvality modelu
13. Pokročilé metódy štatistického učenia

Odporúčaná literatúra

Povinná literatúra:
Hadley, W. , Çentikaya-Rundel, H., a Garrett ,G., 2022. R for data science. O’Reilly Media, Inc.
Burkov, A. The Hundred-Page Machine Learning Book. GitHub.
Odporúčaná literatúra:
James, G., Witten, D., Hastie, T. a Tibshirani, R., 2013. An Introduction to Statistical Learning: with Applications in R. New York: Springer.
Imai, K., 2018 Quantitative social science: An Introduction. Princeton University Press.

Podmienky na absolvovanie predmetu

20 % - aktivita na seminároch
20 % - zadania
60 % - záverečná skúška

Pracovné zaťaženie študenta

Celkové pracovné zaťaženie študenta: 156 h
účasť na prednáškach 26 h,
účasť na seminároch 26 h,
príprava na semináre 26h,
spracovanie zadaní 26h,
príprava na skúšku 52h

Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu

slovenský jazyk, anglický jazyk

Dátum schválenia: 12.03.2024

Dátum poslednej zmeny: 21.05.2024

Dátum schválenia: 12.03.2024

Dátum poslednej zmeny: 21.05.2024