Big Data a pénzügyi szektorban

Révész Zoltán (2020) Big Data a pénzügyi szektorban. Pénzügyi és Számviteli Kar.

[thumbnail of Szakdolgozat_RZ_JEAHZL.pdf] PDF
Szakdolgozat_RZ_JEAHZL.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (1MB)
[thumbnail of BA_TO_Révész_Zoltán_JEAHZL.pdf] PDF
BA_TO_Révész_Zoltán_JEAHZL.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (758kB)

Absztrakt (kivonat)

<p>Az utóbbi években kifejezetten felkapott lett a Big Data kifejezés használata számos különböző témában is. Szakdolgozatomban bemutatásra kerülnek a folyamatosan növekvő mennyiségű adathalmazok kezelésének és elemzésének elősegítésére megalkotott technológiák és ezek felhasználási területei, a személyes adatok védelmét célzó Általános adatvédelmi rendelet, valamint az is, hogy a pénzügyi szektor tagjai hogyan tudják kihasználni a Big Data technológia adta lehetőségeket.</p><p>Amióta az embereknek lehetőségük adódott különböző célokból adatokat rögzíteni, ezt a rendelkezésre álló, tárolhatóság és elemezhetőség szempontjából legjobb módon meg is teszik. Ebből a célból jelentek meg a relációs adatbázisrendszerek, melyekben oszlopokba és sorokba rendezve tárolhatóak az adatok előre meghatározott adatmodellek alapján, ezzel is minimalizálva a redundanciát. Az internet megjelenésével azonban számos olyan strukturálatlan vagy részben strukturált adat keletkezett, amelyet fontosnak tartottak tárolni és elemezni. Azonban ez már meghaladta a relációs adatbázisok tudását, ezért a 2000-es évek eleje óta sorban jelennek meg az ilyen nagyméretű, gyorsan generálódó változatos típusú adathalmazok kezelését megkönnyítő Big Data szoftverek és keretrendszerek.A Big Data-nak számos definíciója van, azonban általánosan elfogadott a 3V vagy az 5V jellemzési módszer. A Volume a Big Data mennyiségi jelzőjére utal, az ilyen adathalmazokat a hagyományos tárolási eljárásokkal nem lehet költséghatékonyan kezelni. A Velocity, azaz sebesség jellemző szerint az adatok nagyon gyorsan érkeznek, valamint az elvárt feldolgozási idő is csökken, sokszor szinte valós idejű döntéshozatalra van szükség a beérkező információk alapján. A Variety az adatok változatosságára utal. A rengeteg adatforrás miatt az adatok típusa sem egységesíthető, strukturált és strukturálatlan adatokat szintén kezelni kell. A Veracity jellemző az adat megbízhatóságát, a felhasználási célra való alkalmasságát vizsgálja. Az ötödik és utolsó jellemző a Value. Itt a kinyert információk gazdasági értéke szempontjából jellemezhetjük a Big Data-t. </p><p>Számtalan olyan szoftver és keretrendszer jött létre az utóbbi évtizedekben, amelyek a Big Data kategóriájába eső adathalmazok kezelésére alkalmasak. Ide tartoznak a főként strukturálatlan vagy részben strukturált adatok tárolására szolgáló NoSQL adatbázisok, valamint a Big Data szinte szinonimájaként használt keretrendszer, a Hadoop. A ma már az Apache alapítvány által felügyelt, nyílt forráskódú és elosztott működésű rendszer megjelenése óta nagy népszerűségnek örvend, viszonylag olcsóbb kiépíthetősége és hibatűrő működése miatt. A Hadoop keretrendszer négy modult foglal magában, a Hadoop Common a többi modul által használt eszközöket foglalja magában, a YARN modul felelős a folyamatok erőforrás menedzsmentjéért és ütemezéséért. A HDFS a Hadoop által használt elosztott fájlrendszer. A fájlok kisebb, egységes méretű blokkokra felosztva tárolódnak, ezeket egyszerre több hálózatba kötött számítógép is tárolja, így meghibásodás esetén az adatok nem vesznek el. A negyedik modul a MapReduce. Ez egy programozási keretrendszer, amely olyan programok létrehozását segíti elő, amik kifejezetten a nagyméretű adathalmazokon dolgoznak elosztott módon. A map lépés során olyan kulcs-érték párok generálódnak, amelyek a reduce lépés bemenetéül szolgálnak. A reduce lépés végeztével pedig megkaphatjuk az elvárt eredményt. Számos olyan további szoftver és keretrendszer létezik, amely a Hadoop alapjaira épül, vagy egyes komponenseit használja fel. Többek között ilyen az Apache Spark, a Hive vagy a Zookeeper.</p><p>A Big Data természetéből adódóan elkerülhetetlen a személyes adatok feldolgozása, erre azonban szigorú szabályozások vonatkoznak.2018 májusa óta kötelező alkalmazni az EU Általános adatvédelmi rendeletében foglaltakat minden EGT tagállam területén tevékenykedő jogi vagy természetes személynek. Hét olyan alapelvet fogalmaztak meg, amelyek alapvetően meghatározzák a személyes adatok kezelésének módját. Ide tartozik a jogszerűség, tisztességes eljárás és átláthatóság elve, a célhoz kötöttség, az adattakarékosság és a pontosság elvei, a korlátozott tárolhatóság, valamint a bizalmas jelleg és az elszámoltathatóság elvei. A rendeletnek való meg nem felelés súlyos büntetéseket vonhat maga után.</p><p>A Big Data által biztosított lehetőségeket számos iparág ki tudja használni, köztük az egészségügy, a közigazgatás, a kereskedelmi és marketing ipar, valamint a szórakoztató ipar is. A pénzügyi iparág szereplői főként marketing és kockázatelemzési, valamint csalás megelőzési célokra használják. Nem tesz másként a szakdolgozatom esettanulmányának alanya, az American Express sem. A vállalat viszonylag korán, 2010-ben kezdte el kiépíteni Big Data rendszereit. A legtöbb pénzügyi szolgáltató céghez hasonlóan az AmEx is nagy mennyiségű ügyfél adatot tud felhasználni elemzési célból, hitelkártya kibocsátóként azonban hatalmas mennyiségű tranzakciós adattal rendelkezik. A cég erre alapozva építette ki szintekre épülő hitelkártya rendszerét, azonban olyan megoldásokkal is előállt, amellyel ügyfeleik is élvezhetik a Big Data elemzés előnyeit. Az American Express élenjáró a Big Data-t felhasználó pénzügyi vállalkozások között, és magabiztosan állítható, hogy továbbra is a piac egyik leginnovatívabb cége marad.</p>

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus (BA)

Konzulens(ek)

Konzulens neve
Konzulens típusa
Beosztás, tudományos fokozat, intézmény
Email
Dr Kovács Endre
Belső
főiskolai docens, Gazdaságinformatika Tanszék, PSZK

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: adatelemzés, adatvédelem, big data, GDPR (General Data Protection Regulation), pénzügyi szektor
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2020. Dec. 05. 14:12
Utolsó módosítás: 2021. Már. 29. 09:10

Actions (login required)

Tétel nézet Tétel nézet