BC TISOVSKÝ: Big Data a jejich význam v bankovnictví

  • [8.11.  konzultacia]
  • — navrhli sme obsah BcP vid. subor: …\BC TISOVSKY PATRIK\191108 BC TISOVSKY PATRIK.ZIP\191108 BC TISOVSKY ver.A.docx – v subore su poznamky k naplni jednotlivych kapitol
  • — Patrik vidi ako vhodne dat do 3. casti vyuzitie PowerBI od Microsoftu – ma udaje na sparcovanie a vizualizaciu a samotny nastroj (je drahy)
  • — presli sme si sposob citovania a tvorby zoznamu literatury vo Worde
  • — Obsah
    Úvod 8
    1 Vymezení základních pojmu v předmětné oblasti 9
    1.1 Podnikové informační systémy 9
    1.2 Big Data velké objemy údajov 9
    1.3 Relační (SQL) a nerelační databáze (NoSQL) 9
    1.4 Zpracování veľkých objemov údajov 9
    1.5 Velké objemy dat v bankovnictví 9
    1.6 Open source software a velké objemy dat 9
    1.7 Metódy vizualizácie veľkých objemov údajov 10
    2 Komparativní (porovnávací) analýza současných databázových technologií pro zpracování velkého objemu dat (BigData) v bankovnictví 11
    2.1 Amazon, Microsoft, Oracle nezabudat na bankovnictví 11
    2.2 Diskusia k porovnavacej analyze 11
    3 Praktické ověření a návrh nasazení vybrané technologie pro zpracování velkého objemu dat (BigData)  – asi POwer BI 12
    3.1 Diskusia k praktickej casti 12
    Záver 13
    Bibliografie 14
  • [1.11.  konzultacia]
  • — J.P. podpisal zadanie BcP; Patrik prislubil pracu na obsahu Bc prace – J.P. ju urguje; Patrik prevzal resers knih
  • [14.10. email konzultacia]
  • — ulohy z kickoff emailu Patrik ciastocne   splnene – treba este pripravit obsah Bc prace a podpisat zadanie Bc prace.
  • — doc. Pancik pripravil resers knih z oblasti BigData – 4.5GByte -> Patrik sa po nu zastavil 1.11.
  • — diskusia k zmene nazvov kapitol
  • [12.4.2019 ULOHY]
  • vyplnit zadavaci list na IS AMBIS podla pokynov
  • [12.4.2019 email konzultacia k navrhu cielov   Bc prace]
  • Téma: Big Data a jejich význam v bankovnictví
  • Cíl: Komparativní analýza  databázových  technologií  pro BigData v bankovnictví a praktické ověření a návrh nasazení vybrané technologie   
  • MODRY TEXT: Navrh textu pre zadavaci list bakalrske prace
  • Struktura (OSNOVA) práce a dílčí cíle práce:
  • ÚVOD
  • 1. TEORETICKÁ ČÁST (20 – 25 stran)Vymezení základních pojmu v předmětné oblasti podnikové informační systémy, systémy správy bází dat, relační (SQL) a nerelační databáze (NoSQL), velké objemy dat (Big Data) ve současné společnosti a v bankovnictvi, open source software a nová pracovní role „data scientist“   v podnikových informačních systémech, open source technologie Python a R, ….
  • 2. ANALYTICKÁ ČÁST (10-15  stran):
  • Komparativní (porovnavaci) analýza současných databázových  technologií  pro zpracování velkého objemu dat (BigData) v bankovnictví 
  • — zaměřenía na trhu dominujících společností Oracle, Microsoft ( je možno spomenout produkty menších ale dynamických společností (např. R-Studio)) – literatura je dole [3][4][5][6][8]
  • — zvyraznit to, ze aj velke spolocnosti Oracle a MS pouzivaju pre analyzu udajov  open-source nastroje ako napr. jazyk R [7]
  • — ak sa pri resersi narazi na BigData technologie v bakovnictvu tak ich zahrnut do komparativnej analyzy spolus MS. Oracle
  • — spomenut ze  moderne kancelarske programy (Odffice 365, Excel 2019) sa zameriavaju na Big Data
  • 3. NÁRHOVO  – REALIZAČNÍ  ČÁST (10-15  stran):
  • Praktické ověření a návrh nasazení vybrané technologie  pro zpracování velkého objemu dat (BigData)  
  • (TOTO NEBUDE v TEXTU zadání  – je to jen představa co by tam mohlo byt:
  • — porovnani vizualizacnych nastroju na trhu urcenych pro vizualizaci ekonomickych dat
  • — popis moznosti vizualizace v jazyce R
  • — prezenatce vizualizace ekonomickych dat pomoci jazyka R – uplne idelalne nieco sa precita napr. z Oracle DB a zobrazi sa
  • — najst vhodne „open“ data – najlepsie z oblasti bankovnictva ci z oblasti financii (akciove trhy) –  na nete (napr. dobra stranka s datasetmi je https://www.kdnuggets.com/datasets/index.html)
  • ZÁVER
  • Literatura: 
    [1] BERMAN, Jules J. Principles of big data: preparing, sharing, and analyzing complex information. Amsterdam: Elsevier, Morgan Kaufmann, 2013. ISBN 978-0-12-404576-7. 
    [2] CORTEZ, Paulo. Modern optimization with R. New York: Springer, 2014. ISBN 978-3-319-08262-2. 
    [3] HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. Praha: Grada, 2015. Profesionál. ISBN 978-80-247-5466-6. 
    [4] BASL, Josef a Roman BLAŽÍČEK. Podnikové informační systémy: podnik v informační společnosti. 2., výrazně přeprac. a rozš. vyd. Praha: Grada, 2008. Management v informační společnosti. ISBN 978-80-247-2279-5. 
    [5] BAUMER, Benjamin, Daniel KAPLAN a Nicholas J. HORTON. Modern data science with R. Boca Raton: CRC Press,Taylor & Francis Group, CRC Press is an imprint of the Taylor & Francis Group, an informa business, 2017. ISBN 978-1-4987-2448-7. 

[11.4.2019 email konzultacia k navrhu cielov   Bc prace]

  • Stranka s navrhmi tem zaverecnych prac je v [1].
  • Martin pise diplomovu pracu [2] – chce ju odovzdat teraz v lete 2019 a tak bude vzor.
  • tema bc prace sa nemusi od Martinovej lisit akurat by sme do 2. analytickej casti  Bc prace dali resers z internetu zameranu na BigData & Banky & Oracle a MS SQL SServer – vid klucove slova na Googli [3] [4] [5].
  •  Dobre o tom pisu firmy co robia ranking firiem, naprikald Gartner [6].
  •  Zdrojov k  teme  su „mraky“
  • OTAZKA k 3. praktickej casti Bc prace
  1. Vedel by ste naprogramovat – podla vzorov – v jazyku R do tretej kapitoly nejake  vizualizacie dat – data sety najdeme.   Budete robit v RStudio [7]. Zda sa ze je to top v tejto oblasti.
  2.   Druha moznost pre 3. prakticku cast Bc prace je ze by ste sa venoval EXCELU 2016 alebo 2019 a preskumal by ste jeho „capabilitu“ pracovat s velkymi objemamy dat. Excel sa v tomto stale zlepsuje a je aj tu okolo toho dost informacii. Pohral by ste sa s nim a napisal par stran o tom [8] (vsimnite si pojem Power Query)

Zaver: Rozhodnite sa podla toho kolko by ste tomu dal casu  R-ko zozerie viac  casu,   Excel asi menej.