Gépi tanulási algoritmusok használata Bankkártya csalások, klasszifikációs modelljeinek kialakításához a Big Data korszakban

Pelikán Balázs (2020) Gépi tanulási algoritmusok használata Bankkártya csalások, klasszifikációs modelljeinek kialakításához a Big Data korszakban. Pénzügyi és Számviteli Kar.

[thumbnail of Szakdolgozat_Pelikán_Balázs_MEEG9L.pdf] PDF
Szakdolgozat_Pelikán_Balázs_MEEG9L.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (1MB)
[thumbnail of BA_TO_Pelikán_Balázs_meeg9l.pdf] PDF
BA_TO_Pelikán_Balázs_meeg9l.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (358kB)
[thumbnail of model_interju.zip] Archive (ZIP)
model_interju.zip
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (21MB)

Absztrakt (kivonat)

Szakdolgozatom írása idején az OTP Bank Nyrt. Adatmenedzsment Megoldások Fejlesztési és Üzemeltetési Főosztályának, Big Data csapatában gyakornokoskodom. Dolgozatom témáját az egyik, nemrég indult projekt inspirálta, melynek célja, hogy kifejlesszünk a Bankon belül egy bankkártya csalások észlelésére képes gépi tanulási algoritmust, melyet egy Big Data környezetben helyezünk majd el. A mesterséges intelligencia egyik területe, a gépi tanulás egy rendkívül felkapott szakterület, melynek alkalmazása a legtöbb iparágban már megjelent. Ennek a technológiának a megismerése minden intelligens rendszerekkel foglalkozó számítástechnikai szakember számára elengedhetetlen. A célom, hogy megalapozott irodalomkutatás után rávilágítsak a sok adattal járó előnyökre, majd alkalmazzam ezeket és a gépi tanulási technikák segítségével egy bankkártya csalások detektálására szolgáló előrejelző algoritmust fejlesszek. Szakdolgozatom három (elsősorban irodalomkutatáson alapuló) fejezete adja meg az alappilléreit a gyakorlatiasabb OTP Bank Big Data ökoszisztémájának ismertetéshez, Python nyelven való programozáshoz, illetve a H2O Flow programban való fejlesztéshez. Kutatásaim során sikerült létrehoznom egy logisztikus regressziós gépi tanulási modellt. Ezt egy anonimizált adathalmaz felhasználásával sikerült tanítanom, és végül 98 százalékos pontossággal tudta megmondani egy tranzakcióról, hogy az csalás-e vagy sem. A logisztikus regressziós modell kialakítása egy tökéletes alapot adott ahhoz, hogy folytatni tudjam ezen téma további kutatását a mély tanulás témakörében. Bonyolultabb modellek, pl.: neurális hálózatok és SVM modellek kialakításával jóval pontosabb eredményt lehet majd elérni. (James D., 2018) Szakdolgozatomban bemutattam, hogy az OTP Bank hogyan kezeli és tárolja a rendelkezésére álló hatalmas adatmennyiséget egy Big Data ökoszisztémában. Ezek után pedig szimulálva végeztem el egy olyan közel jövőben végbemenő projekt gépi tanulási algoritmusának fejlesztését, mely alkalmas lehet ebbe az ökoszisztémába való implementálásába.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Konzulens(ek)

Konzulens neve
Konzulens típusa
Beosztás, tudományos fokozat, intézmény
Email
Kaderják Gyula
Belső
Mestertanár, Alkalmazott Kvantitív Módszertan Tanszék, PSZK
Kemenes Rudolf Zoltán
Külső
NEM RÉSZLETEZETT

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: adatbányászat, ábraelemzés, big data, gépi tanulás, mesterséges intelligencia
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2021. Már. 16. 12:53
Utolsó módosítás: 2021. Már. 16. 12:54

Actions (login required)

Tétel nézet Tétel nézet