Exploratívna analýza dát
- Kredity: 3
- Ukončenie: Skúška
- Rozsah: 2C
- Semester: zimný
- Ročník: 1
- Národohospodárska fakulta
Vyučujúci
Zaradený v študijných programoch
Výsledky vzdelávania
Vedomosti – Absolventi predmetu sa naučia upravovať údaje do podoby vhodnej pre exploratívnu analýzu. Spoznajú základné techniky grafickej reprezentácie údajov a naučia sa používať princípy grafickej prezentácie údajov. Zároveň sa spoznajú najčastejšie chyby spojené s vizuálnou prezentáciou dát.
Zručnosti - Absolvovaním predmetu si študent zlepší analytické a prezentačné schopnosti prostredníctvom vizualizácie údajov.
Kompetencie – Absolventi predmetu budú schopní vedieť spracovať údaje do vhodnej pre analýzu a identifikovať vhodnú techniku vizualizácie na presvedčivé prezentovanie trendov, štruktúry resp. extrémnych hodnôt v údajoch verejnosti. Tieto kompetencie budú slúžiť na lepšie rozhodovanie sa na úrovni firiem ale aj vo verejných úradoch.
Stručná osnova predmetu
Predmet je zameraný na praktické zručnosti v oblasti analýzy údajov prostredníctvom ich vizualizácie a efektívnej komunikácie výsledkov verejnosti.
Predmet je organizovaný v troch častiach. V prvej časti sa študenti naučia upravovať údaje do podoby vhodnej pre analýzu (napr. usporiadanie údajov, čistenie údajov, pivotovanie údajov). V druhej časti sa naučia princípy a získajú praktické zručnosti vizualizácie distribúcie údajov (distribúcia údajov prostredníctvom histogramu, box plot grafu, mapy) a vzťahov medzi údajmi (napr. scatter plot, scatter plot matrix, bubble chart, paralel coordinate plot). Všetky zručnosti budú vysvetlené na praktických príkladoch v špecializovanom softvéri. V poslednej časti študenti sa študenti naučia princípy grafickej prezentácie a ako sa vyhnúť najčastejším chybám.
1. Príprava údajov pre analýzu. Dátové formáty. Typy údajov.
2. Zoznámenie sa s prostredím Geoda. Exploratívna dátová analýza. Linking a brushing údajov.
3. Transformácie údajov v Geoda
4. Analýza a vizualizácia distribúcie údajov (histogram, boxplot)
5. Analýza a vizualizácia distribúcie priestorových údajov (mapa, kartogram)
6. Konzultácie k študentským projektom
7. Analýza a vizualizácia vzťahov medzi údajmi (scatterplot, 3D scatterplot)
8. Analýza a vizualizácia vzťahov medzi údajmi (scatterplot matrix a úvod do regresie)
9. Analýza a vizualizácia vzťahov medzi údajmi (buble chart, conditional plot, paralel coordinate plot)
10. Analýza a vizualizácia časových radov (averages chart, úvod do Diff in Diff analýzy)
11. Klastrová analýza (hierarchické klastrovanie)
12. Prezentácia študentských projektov
13. Prezentácia študentských projektov
Odporúčaná literatúra
1. L. Anselin (2024a). An Introduction to Spatial Data Science with GeoDa. Volume 1: Exploring Spatial Data. CRC/Chapman&Hall, Boca Raton, FL. Online version.
2. L. Anselin (2024b). An Introduction to Spatial Data Science with GeoDa. Volume 2: Clustering Spatial Data. CRC/Chapman&Hall, Boca Raton, FL. Online version.
Podmienky na absolvovanie predmetu
40 % kvalita spracovania priebežných zadaní
60 % kvalita záverečného projektu
Pracovné zaťaženie študenta
Pracovné zaťaženie študenta 78 hodín
(účasť na cvičeniach 26 h, spracovanie priebežných zadaní 13 h, spracovanie záverečného projektu 43 h)
Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu
slovenský, anglický
Dátum schválenia: 11.03.2025
Dátum poslednej zmeny: 08.03.2025
Dátum schválenia: 11.03.2025
Dátum poslednej zmeny: 08.03.2025