Dátová ekonomika a Big data

Vyučujúci

Zaradený v študijných programoch

Výsledky vzdelávania

Cieľom predmetu je poskytnúť študentom znalosti z oblasti dátovej ekonomiky. Predmet sa zaoberá analýzou a spracovaním veľkých dátových setov (Big data). Študenti by sa mali oboznámiť so tvorbou, štruktúrou a riadením dátových skladov, pochopiť prístupy k získavaniu znalostí z údajov ako aj rozšírené znalosti týkajúce sa neurónových sietí.
Vedomosti:
Absolvent získa vedomosti týkajúce sa tvorby dátových skladov pre Big data a ich riadenia. Taktiež získa vedomosti týkajúce sa čistenia, transformovania, modelovania a vyhodnocovania veľkých dátových setov (Big data) (informácií, údajov) s cieľom identifikovania trendov a odhaľovania, interpretácii a zdieľania významných vzorcov v údajoch. Bude poznať netriviálne modely a nástroje strojového učenia sa a tvorby neurónových sietí.
Kompetentnosti:
Absolvent bude ovládať zákonitosti práce s databázami a údajmi, techniky ich spracovania a vyhodnocovania. Absolvent bude schopný vytvárať a riadiť dátový sklad ako aj využívať sofistikované techniky dolovania dát a objavovania znalostí pre analýzu týchto údajov.
Zručnosti:
Absolvent bude schopných analyzovať veľké množstvo údajov z podnikových procesov využitím štatistických, databázových a dataminingových nástrojov. Bude poznať techniky detekcie vzorov, klasifikácie, asociácie a predikcie a vedieť vybrať vhodné postupy pre tvorbu a validáciu neurónových sietí.

Stručná osnova predmetu

Big data
Veľké dáta, komplexnosť veľkých dát, architektúry spracovania veľkých dát, technológie veľkých dát, obchodná hodnota veľkých dát, dátový sklad, manažment dátového skladu, riadenie workflow v dátovom sklade,
Dolovanie dát
Formáty údajov a súborov (štruktúrované, neštruktúrované atď.), SQL a databázy, spracovanie textu (parsing, tokenizing, stemming, atď.), Reprezentácia dát (reprezentácia vektorov funkcií atď.) Potreba dataminingu, Predspracovanie údajov: redukcia dimenzií, analýza chýbajúcich hodnôt, normalizácia a štandardizácia, detekcia šumu a odľahlých hodnôt. Techniky detekcie vzorov, klasifikácie, asociácie a predikcie.
Strojové učenie
Základné pojmy neurónových sietí, charakteristiky neurónových sietí, terminológia, aplikácia neurónových sietí. Strojové učenie s učiteľom, strojové učenie bez učiteľa, učenie formou odmeňovania. Objavovanie znalostí, umelá inteligencia, pravidlá učenia, učenie korekcie chýb, učenie založené na pamäti, hebbovské učenie, kompetitívne učenie, Boltzmannovo učenie, jednovrstvový perceptrón, viacvrstvový perceptrón, spätná propagácia, rekurentné siete, zjednodušovanie sietí, adaptívne siete, Neurónové siete založené na rozhodovaní, hierarchické neurónové siete, pravdepodobnostné neurónové siete, siete s radiálnou bázou, porovnanie sietí RBF a viacvrstvového perceptronu. Klasifikácia lineárne oddeliteľných vzorov, Boltzmannov stroj, Helmholtzov stroj, Podporné vektorové stroje, Samo organizujúci sa migračný algoritmus, genetické algoritmy, predikčné systémy.
Odporúčaný software
R Studio, IBM SPSS Modeler.

Odporúčaná literatúra

1. TKÁČ, Michal - VERNER, Robert. Artificial neural networks in business: two decades of research. In Applied soft computing. - Amsterdam: Elsevier Science Publishers B.V. ISSN 1872-9681, 2016, vol. 38, pp. 788-804.
2. TKÁČ, Michal - VERNER, Robert - DANISHJOO, Enayat. Modern computation methods for business applications. Reviewers: Adrian Olaru, Jozef Mihok. 1. vyd. Vaterstetten: Adoram, 2013. 276 s. [13,85 AH]. ISBN 978-3-00-044092-2.
3. SHARDA, Ramesh; DELEN, Dursun; TURBAN, Efraim. Analytics, Data Science, & Artificial Intelligence. Pearson, 2020.
4. GOPAL, M. Applied machine learning. McGraw-Hill Education, 2019.
5. KOTU, Vijay; DESHPANDE, Bala. Data science: concepts and practice. Morgan Kaufmann, 2018.
6. SCHMARZO, Bill. The The Economics of Data, Analytics, and Digital Transformation: The theorems, laws, and empowerments to guide your organization’s digital transformation. Packt Publishing Ltd, 2020.
7. CARRIERE-SWALLOW, Mr Yan; HAKSAR, Mr Vikram. The economics and implications of data: an integrated perspective. International Monetary Fund, 2019.
8. TADDY, Matt. Business data science: Combining machine learning and economics to optimize, automate, and accelerate business decisions. McGraw Hill Professional, 2019.
9. GHAVAMI, Peter. Big Data Management: Data Governance Principles for Big Data Analytics. Walter de Gruyter GmbH & Co KG, 2020.
10. GHAVAMI, Peter. Big data analytics methods: analytics techniques in data mining, deep learning and natural language processing. Walter de Gruyter GmbH & Co KG, 2019.
11. ZHOU, Hong. Learn Data Mining Through Excel. Apress, 2020.
12. KUMAR, D. G.; KUMAR, G. D. Machine learning techniques for improved business analytics. 2018.
13. FINLAY, Steven. Artificial intelligence and machine learning for business. A No-Nonsense Guide to Data Driven Technologies, 2017,

Sylabus predmetu

Big data Veľké dáta, komplexnosť veľkých dát, architektúry spracovania veľkých dát, technológie veľkých dát, obchodná hodnota veľkých dát, dátový sklad, manažment dátového skladu, riadenie workflow v dátovom sklade, Dolovanie dát Formáty údajov a súborov (štruktúrované, neštruktúrované atď.), SQL a databázy, spracovanie textu (parsing, tokenizing, stemming, atď.), Reprezentácia dát (reprezentácia vektorov funkcií atď.) Potreba dataminingu, Predspracovanie údajov: redukcia dimenzií, analýza chýbajúcich hodnôt, normalizácia a štandardizácia, detekcia šumu a odľahlých hodnôt. Techniky detekcie vzorov, klasifikácie, asociácie a predikcie. Strojové učenie Základné pojmy neurónových sietí, charakteristiky neurónových sietí, terminológia, aplikácia neurónových sietí. Strojové učenie s učiteľom, strojové učenie bez učiteľa, učenie formou odmeňovania. Objavovanie znalostí, umelá inteligencia, pravidlá učenia, učenie korekcie chýb, učenie založené na pamäti, hebbovské učenie, kompetitívne učenie, Boltzmannovo učenie, jednovrstvový perceptrón, viacvrstvový perceptrón, spätná propagácia, rekurentné siete, zjednodušovanie sietí, adaptívne siete, Neurónové siete založené na rozhodovaní, hierarchické neurónové siete, pravdepodobnostné neurónové siete, siete s radiálnou bázou, porovnanie sietí RBF a viacvrstvového perceptronu. Klasifikácia lineárne oddeliteľných vzorov, Boltzmannov stroj, Helmholtzov stroj, Podporné vektorové stroje, Samo organizujúci sa migračný algoritmus, genetické algoritmy, predikčné systémy. Odporúčaný software R Studio, IBM SPSS Modeler.

Podmienky na absolvovanie predmetu

30 % - aktívna účasť na kolokviách, prezentácia vybranej témy
30 % - výskumná štúdia
40 % - záverečná skúška

Pracovné zaťaženie študenta

Účasť na kolokviách: 16 hodín
Príprava na kolokviá: 44 hodín
Spracovanie výskumnej štúdie: 100 hodín
Príprava na záverečnú skúšku: 100 hodín

Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu

Anglický jazyk / Slovenský jazyk

Dátum schválenia: 11.05.2023

Dátum poslednej zmeny: 19.12.2022

Dátum schválenia: 11.05.2023

Dátum poslednej zmeny: 19.12.2022