Distribuované technológie II
- Kredity: 6
- Ukončenie: Skúška
- Rozsah: 2P + 2C
- Semester: letný
- Ročník: 1
- Fakulta hospodárskej informatiky
Zaradený v študijných programoch
aktuárstvoVýsledky vzdelávania
Výstupy vzdelávania po absolvovaní predmetu
Znalosti (vedomosti)
A. Definovať základné koncepty riadenia a analýzy big data vrátane ich architektonických, technologických a metodických východísk.
B. Rozpoznať a vysvetliť hlavné výzvy, ktorým organizácie čelia v súvislosti s big data, najmä z pohľadu objemu, rýchlosti, rôznorodosti a kvality dát.
C. Porozumieť vplyvu big data na podnikanie, vedecký pokrok a každodenný život vrátane ekonomických, spoločenských a etických súvislostí.
Zručnosti
D. Navrhovať škálovateľné big data riešenia pre organizácie rôznych typov s ohľadom na ich potreby, technické možnosti a aplikačné prostredie.
E. Analyzovať a riešiť problémy súvisiace so spracovaním a využívaním big data na konceptuálnej aj praktickej úrovni v rôznych odvetviach.
Kompetentnosti
E. Samostatne a zodpovedne aplikovať big data prístupy pri riešení komplexných problémov v oblastiach ako verejná správa, výroba, maloobchod, vzdelávanie, bankovníctvo, financie, zdravotníctvo, farmaceutický priemysel a ďalšie aplikačné domény.
Stručná osnova predmetu
1. Úvod do problému big data.
2. Aktuálne výzvy, trendy a aplikácie big data
3. Dátové typy a dátové formáty big data.
4. Úvod do Hadoop, fungovanie Hadoop
5. Ekosystému Hadoop
6. Princípy HDFS
7. Technológie pre správu big data
8. YARN, HBase, Hive, Pig
9. Základné princípy a spracovanie údajov s MapReduce
10. Princípy HBase
11. Technológie pre správu big data
12. Algoritmy na analýzu big data
13. Perspektíva aplikácie big data a problémy s implementáciou big data
Odporúčaná literatúra
1. Hendl, J.:Big data - Věda o datech, základy a aplikace (česky), Grada 2021
2. Holubová I., Kosek j., Minařík k., Novák D.: Big Data a NoSQL databáze. Grada, 2015, ISBN 9788024754666
3. Matthew J. Salganik. (2017). Bit by Bit: Social Research in the Digital Age. Princeton University Press.
4. Cathy O’Neil. (2016). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Penguin Books.
5. Rob Kitchin. (2014). The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences. SAGE Publications
6. Lockwood, Glenn. (2014). Conceptual Overview of Map-Reduce and Hadoop. Blog Post (http://www.glennklockwood.com/data-intensive/hadoop/overview.html)
7. Lazer, David, Ryan Kennedy, Gary King, and Alessandro Vespignani. (2014). The Parable of Google Flu: Traps in Big Data Analysis. Science 343(6176): 1203-1205.
8. Lazer, David. (2015). The Rise of the Social Algorithm. Science 348(6239): 1090-1091.
9. Anand Rajaraman and Jeffrey David Ullman (2011) Mining of Massive Datasets ISBN-10: 1107015359
ISBN-13: 978-1107015357
10. Murugesan, San; Bojanova, Irena, (2016) Encyclopedia of cloud computing. Wiley-IEEE Press. ISBN: 9781118821954
Sylabus predmetu
1. Úvodná časť sa venuje vymedzeniu problematiky big data a jej významu v súčasných informačných systémoch. Vysvetľujú sa základné charakteristiky big data a dôvody ich rastúceho významu. 2. Pozornosť sa venuje aktuálnym výzvam, trendom a aplikačným oblastiam big data. Rozoberá sa využitie big data v rôznych oblastiach praxe a ich vplyv na rozhodovanie a inovácie. 3. Preberajú sa základné dátové typy a dátové formáty používané v prostredí big data. Zdôrazňuje sa rozdiel medzi štruktúrovanými, polostruktúrovanými a neštruktúrovanými dátami. 4. Predmet poskytuje úvod do platformy Hadoop a jej základných princípov fungovania. Vysvetľuje sa architektúra Hadoopu a jeho úloha pri spracovaní veľkých objemov dát. 5. Pozornosť sa venuje ekosystému Hadoop a jeho hlavným komponentom. Rozoberá sa vzájomná spolupráca nástrojov v rámci spracovania a analýzy big data. 6. Vysvetľujú sa princípy distribuovaného súborového systému HDFS. Dôraz sa kladie na ukladanie dát, replikáciu, toleranciu chýb a prístup k dátam. 7. Predmet sa zaoberá technológiami určenými na správu big data. Rozoberajú sa nástroje a prístupy na ukladanie, spracovanie a správu veľkých dátových objemov. 8. Pozornosť sa venuje komponentom YARN, HBase, Hive a Pig. Vysvetľuje sa ich funkcia, postavenie v ekosystéme Hadoop a oblasti použitia. 9. Preberajú sa základné princípy spracovania údajov pomocou MapReduce. Vysvetľuje sa model spracovania dát a jeho využitie pri paralelnom spracovaní. 10. Obsahom je detailnejší pohľad na princípy databázového systému HBase. Zdôrazňuje sa jeho dátový model, architektúra a použitie v prostredí big data. 11. Predmet sa venuje technológiám pre správu big data v širšom kontexte. Porovnávajú sa rôzne prístupy a nástroje z hľadiska škálovateľnosti a výkonnosti. 12. Rozoberajú sa algoritmy používané na analýzu big data. Pozornosť sa venuje základným analytickým a strojovo-učiacim prístupom aplikovaným na veľké dátové súbory. 13. Záverečná časť sa zameriava na perspektívy aplikácie big data v praxi. Rozoberajú sa problémy a obmedzenia implementácie big data riešení vrátane technických, organizačných a etických aspektov.
Podmienky na absolvovanie predmetu
Cvičenia 40% Náplňou cvičení je vypracovanie a obhájenie projektov, na ktorom študenti pracujú na cvičeniach počas semestra. Každý odovzdaný projekt sa hodnotí samostatne a študent musí dosiahnuť aspoň 51% úspešnosť po zosumarizovaní výsledkov. Overuje sadosiahnutá úroveň výsledkov vzdelávania D., E.
Skúška 60% hodnotenia. Skúška pozostáva z dvoch častí: testu a konkrétnej problémovej úlohy na riešenie. Testom sa overuje dosiahnutá úroveň výsledkov vzdelávania A.,B., C.
Pracovné zaťaženie študenta
Celková záťaž štúdia (v hodinách): 6 kreditov x 26 hodín = 156 hodín
Rozdelenie študijného zaťaženia:
Účasť na prednáškach a seminároch: 52 hodín
Príprava na semináre: 13 hodín
Písomné úlohy: 31 hodín
Príprava na záverečnú skúšku: 60 hodín
Jazyk, ktorého znalosť je potrebná na absolvovanie predmetu
slovenský
Dátum schválenia: 15.05.2025
Dátum poslednej zmeny: 04.01.2026
Dátum schválenia: 15.05.2025
Dátum poslednej zmeny: 04.01.2026

