BC TISOVSKÝ: Big Data a jejich význam v bankovnictví
- [8.11. konzultacia]
- — navrhli sme obsah BcP vid. subor: …\BC TISOVSKY PATRIK\191108 BC TISOVSKY PATRIK.ZIP\191108 BC TISOVSKY ver.A.docx – v subore su poznamky k naplni jednotlivych kapitol
- — Patrik vidi ako vhodne dat do 3. casti vyuzitie PowerBI od Microsoftu – ma udaje na sparcovanie a vizualizaciu a samotny nastroj (je drahy)
- — presli sme si sposob citovania a tvorby zoznamu literatury vo Worde
- — Obsah
Úvod 8
1 Vymezení základních pojmu v předmětné oblasti 9
1.1 Podnikové informační systémy 9
1.2 Big Data velké objemy údajov 9
1.3 Relační (SQL) a nerelační databáze (NoSQL) 9
1.4 Zpracování veľkých objemov údajov 9
1.5 Velké objemy dat v bankovnictví 9
1.6 Open source software a velké objemy dat 9
1.7 Metódy vizualizácie veľkých objemov údajov 10
2 Komparativní (porovnávací) analýza současných databázových technologií pro zpracování velkého objemu dat (BigData) v bankovnictví 11
2.1 Amazon, Microsoft, Oracle nezabudat na bankovnictví 11
2.2 Diskusia k porovnavacej analyze 11
3 Praktické ověření a návrh nasazení vybrané technologie pro zpracování velkého objemu dat (BigData) – asi POwer BI 12
3.1 Diskusia k praktickej casti 12
Záver 13
Bibliografie 14 - [1.11. konzultacia]
- — J.P. podpisal zadanie BcP; Patrik prislubil pracu na obsahu Bc prace – J.P. ju urguje; Patrik prevzal resers knih
- [14.10. email konzultacia]
- — ulohy z kickoff emailu Patrik ciastocne splnene – treba este pripravit obsah Bc prace a podpisat zadanie Bc prace.
- — doc. Pancik pripravil resers knih z oblasti BigData – 4.5GByte -> Patrik sa po nu zastavil 1.11.
- — diskusia k zmene nazvov kapitol
- [12.4.2019 ULOHY]
- vyplnit zadavaci list na IS AMBIS podla pokynov
- [12.4.2019 email konzultacia k navrhu cielov Bc prace]
- Téma: Big Data a jejich význam v bankovnictví
- Cíl: Komparativní analýza databázových technologií pro BigData v bankovnictví a praktické ověření a návrh nasazení vybrané technologie
- MODRY TEXT: Navrh textu pre zadavaci list bakalrske prace
- Struktura (OSNOVA) práce a dílčí cíle práce:
- ÚVOD
- 1. TEORETICKÁ ČÁST (20 – 25 stran): Vymezení základních pojmu v předmětné oblasti– podnikové informační systémy, systémy správy bází dat, relační (SQL) a nerelační databáze (NoSQL), velké objemy dat (Big Data) ve současné společnosti a v bankovnictvi, open source software a nová pracovní role „data scientist“ v podnikových informačních systémech, open source technologie Python a R, ….
- 2. ANALYTICKÁ ČÁST (10-15 stran):
- Komparativní (porovnavaci) analýza současných databázových technologií pro zpracování velkého objemu dat (BigData) v bankovnictví
- — zaměřenía na trhu dominujících společností Oracle, Microsoft ( je možno spomenout produkty menších ale dynamických společností (např. R-Studio)) – literatura je dole [3][4][5][6][8]
- — zvyraznit to, ze aj velke spolocnosti Oracle a MS pouzivaju pre analyzu udajov open-source nastroje ako napr. jazyk R [7]
- — ak sa pri resersi narazi na BigData technologie v bakovnictvu tak ich zahrnut do komparativnej analyzy spolus MS. Oracle
- — spomenut ze moderne kancelarske programy (Odffice 365, Excel 2019) sa zameriavaju na Big Data
- 3. NÁRHOVO – REALIZAČNÍ ČÁST (10-15 stran):
- Praktické ověření a návrh nasazení vybrané technologie pro zpracování velkého objemu dat (BigData)
- (TOTO NEBUDE v TEXTU zadání – je to jen představa co by tam mohlo byt:
- — porovnani vizualizacnych nastroju na trhu urcenych pro vizualizaci ekonomickych dat
- — popis moznosti vizualizace v jazyce R
- — prezenatce vizualizace ekonomickych dat pomoci jazyka R – uplne idelalne nieco sa precita napr. z Oracle DB a zobrazi sa
- — najst vhodne „open“ data – najlepsie z oblasti bankovnictva ci z oblasti financii (akciove trhy) – na nete (napr. dobra stranka s datasetmi je https://www.kdnuggets.com/datasets/index.html)
- ZÁVER
- Literatura:
[1] BERMAN, Jules J. Principles of big data: preparing, sharing, and analyzing complex information. Amsterdam: Elsevier, Morgan Kaufmann, 2013. ISBN 978-0-12-404576-7.
[2] CORTEZ, Paulo. Modern optimization with R. New York: Springer, 2014. ISBN 978-3-319-08262-2.
[3] HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. Praha: Grada, 2015. Profesionál. ISBN 978-80-247-5466-6.
[4] BASL, Josef a Roman BLAŽÍČEK. Podnikové informační systémy: podnik v informační společnosti. 2., výrazně přeprac. a rozš. vyd. Praha: Grada, 2008. Management v informační společnosti. ISBN 978-80-247-2279-5.
[5] BAUMER, Benjamin, Daniel KAPLAN a Nicholas J. HORTON. Modern data science with R. Boca Raton: CRC Press,Taylor & Francis Group, CRC Press is an imprint of the Taylor & Francis Group, an informa business, 2017. ISBN 978-1-4987-2448-7.
[11.4.2019 email konzultacia k navrhu cielov Bc prace]
- Stranka s navrhmi tem zaverecnych prac je v [1].
- Martin pise diplomovu pracu [2] – chce ju odovzdat teraz v lete 2019 a tak bude vzor.
- tema bc prace sa nemusi od Martinovej lisit akurat by sme do 2. analytickej casti Bc prace dali resers z internetu zameranu na BigData & Banky & Oracle a MS SQL SServer – vid klucove slova na Googli [3] [4] [5].
- Dobre o tom pisu firmy co robia ranking firiem, naprikald Gartner [6].
- Zdrojov k teme su „mraky“
- OTAZKA k 3. praktickej casti Bc prace:
- Vedel by ste naprogramovat – podla vzorov – v jazyku R do tretej kapitoly nejake vizualizacie dat – data sety najdeme. Budete robit v RStudio [7]. Zda sa ze je to top v tejto oblasti.
- Druha moznost pre 3. prakticku cast Bc prace je ze by ste sa venoval EXCELU 2016 alebo 2019 a preskumal by ste jeho „capabilitu“ pracovat s velkymi objemamy dat. Excel sa v tomto stale zlepsuje a je aj tu okolo toho dost informacii. Pohral by ste sa s nim a napisal par stran o tom [8] (vsimnite si pojem Power Query)
Zaver: Rozhodnite sa podla toho kolko by ste tomu dal casu R-ko zozerie viac casu, Excel asi menej.
- [1] http://www.drpancik.sk/vyucba-leto-2019/zaverecne-prace-leto-2020/
- [2] http://www.drpancik.sk/vyucba-leto-2019/zaverecne-prace-leto-2020/dp-martin-d-big-data-a-jejich-vyznam-v-podnikovych-informacnich-systemech/
- [3] „big data sql server 2019“ –> vid. Microsoft SQL Server 2019. Big Data Clusters.
- [4] „big data oracle“ –> vid. Big Data Cloud Service and Big Data SQL Cloud Service
- [5] „big data banking case study“ –> https://medium.com/activewizards-machine-learning-company/top-9-data-science-use-cases-in-banking-6bb071f9470c
- [6] „big data banking gartner quadrant“ –> vid napr Gartner’s February 2018 Magic Quadrant for Analytics and Business Intelligence Platforms repo
- [7] https://www.rstudio.com/
- [8] „big data excel 2016“ –> vid 23.06.2016 – The sweet spot for Excel in the big data scenario categories is … Thankfully, Excel has a solution: Power Query, which is built into Excel 2016 …
- [9] https://www.linkedin.com/in/juraj-pancik-phd-36794a53/?originalSubdomain=sk