Data mining

Vyučujúci

Zaradený v študijných programoch

Výsledky vzdelávania

Študenti získajú:
− poznatky o základných pojmoch, princípoch, metódach a postupoch používaných v hĺbkovej analýze údajov,
− poznatky o jednotlivých etapách procesu získavania informácií z databáz,
− poznatky o teoretických princípoch modelov v hĺbkovej analýze údajov.
− zručnosti
− Študenti budú schopní realizovať jednotlivé kroky procesu získavania znalostí z databáz s využitím profesionálneho softvéru SAS Enterprise Miner.
− Študenti sa naučia adekvátne aplikovať postupy a metódy hĺbkovej analýzy údajov a interpretovať z nich plynúce výsledky.
Kompetencie
− Študenti budú schopní používať získané vedomosti a zručnosti pri riešení úloh hĺbkovej analýzy dát v praxi.

Stručná osnova predmetu

Proces dolovania dát poskytuje rámec na extrakciu netriviálnych informácií z dát. S nástupom masívneho úložiska, zvýšeného zhromažďovania údajov a pokročilých počítačových paradigiem sa údaje, ktoré máme k dispozícii zväčšujú. Na získanie poznatkov z týchto masívnych dátových zdrojov musíme okrem jednoduchého štatistického spracovania použiť pokročilé prístupy, ako sú napríklad algoritmy na dolovanie dát. Štúdium predmetu umožňuje pochopiť zmysel a možnosti procesu dolovania informácií z dát.

Odporúčaná literatúra

1. TEREK, M., HORNÍKOVÁ, A., LABUDOVÁ, V. Hĺbková analýza údajov. Bratislava: Iura Edition, 2010. ISBN 978-80-8078-336-5
2. BERKA, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9
3. PETR, P. Data Mining: Díl I. Pardubice: Univerzita Pardubice, 2008, 139 s. ISBN 978-80-7395-098-9
4. SKALSKÁ, H. Data mining a klasifikační modely. Hradec Králové: Gaudeamus, 2010. ISBN 978-80-7435-088-7
5. LABUDOVÁ, V. Hĺbková analýza údajov s programom SAS Enterprise Miner (praktikum). Bratislava: Ekonóm, 2012. ISBN 978-80-225-3402-4
6. LABUDOVÁ, V. Rozhodovacie stromy ako prediktívna modelovacia technika. Slovenská štatistika a demografia: vedecký časopis. Roč. 27, č. 3 (2017), s. 60-76. Bratislava: Štatistický úrad Slovenskej republiky. ISSN 1210-1095
7. KANTARDZIC, M. Data Mining. Concepts, Models, Methods and Algorithms. USA, J. Wiley and Sons, 2003. ISBN 0-471-22852-4
8. GUIDICI, P. Applied Data Mining. New York, J. Wiley and Sons, 2004. ISBN 0-470-84679-8
9. LAROSE, D. T. Discovering Knowledge in Data. An Introduction to Data Mining. USA: Wiley 2005. ISBN 978-0-471-66657-8
10. LAROSE, D. T. Data Mining. Methods and Models. USA: Wiley 2006. ISBN 0-471-66656-4

Sylabus predmetu

1. Získavanie poznatkov z databáz a hĺbková analýza údajov. Proces hĺbkovej analýzy údajov. 2. Ciele, úlohy a korene hĺbkovej analýzy údajov. Aplikačné oblasti hĺbkovej analýzy údajov. Big dáta a hĺbková analýza údajov. 3. Metodiky hĺbkovej analýzy údajov. Nástroje na hĺbkovú analýzu dát. 4. Databázy. Príprava a úprava údajov (čistenie, transformácia, klasifikácia). 5. Príprava a úprava údajov (identifikácia odľahlých údajov, redukcia údajov). 6. Rozhodovacie stromy (klasifikačné a regresné stromy). 7. Generovanie klasifikačného stromu (Shannonova entropia, Giniho index). Prerezávanie rozhodovacích stromov. Generovanie rozhodovacích pravidiel. 8. Logistická regresia. Bodové odhady parametrov modelu, pomeru šancí a ich interpretácia. 9. Induktívne úsudky o parametroch modelu logistickej regresie, pomeru šancí. Štatistická významnosť regresie. 10. Umelé neurónové siete a ich architektúra. 11. Asociačné pravidlá. 12. Hodnotenie modelov. Kritériá hodnotenia kvality modelu. 13. Zhrnutie učiva.

Podmienky na absolvovanie predmetu

priebežné hodnotenie (40%):
− priebežná písomná práca (20 %)
− vypracovanie seminárnej práce (20 %)
skúška (60%):
− teoretická časť (20 %)
− praktická časť (40 %)

Pracovné zaťaženie študenta

Pracovné zaťaženie študenta (v hodinách): 156 h
účasť na prednáškach: 26 h,
účasť na cvičeniach: 26 h,
príprava na cvičenia: 26 h,
príprava na priebežnú písomku: 26 h,
spracovanie seminárnej práce: 22 h,
príprava na skúšku: 30 h

Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu

Slovenský jazyk

Dátum schválenia: 11.03.2024

Dátum poslednej zmeny: 30.03.2022

Dátum schválenia: 11.03.2024

Dátum poslednej zmeny: 30.03.2022