Hiteljóváhagyás előrejelzése mesterséges intelligencia segítségével

Kovács Blanka (2023) Hiteljóváhagyás előrejelzése mesterséges intelligencia segítségével. Pénzügyi és Számviteli Kar.

[thumbnail of Kovács_Blanka_F7YHDP.pdf] PDF
Kovács_Blanka_F7YHDP.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (1MB)
[thumbnail of BA_O_Kovács_Blanka.pdf] PDF
BA_O_Kovács_Blanka.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (216kB)
[thumbnail of Szakdolgozat_bírálat_Kovács_Blanka_F7YHDP.pdf] PDF
Szakdolgozat_bírálat_Kovács_Blanka_F7YHDP.pdf
Hozzáférés joga: Bizalmas dokumentum (bírálat)

Download (306kB)
[thumbnail of Szakdolgozat_biralat_es_javaslat_Kovacs_Blanka_hallgato_Koti_Marcell_biralo_20231210.pdf] PDF
Szakdolgozat_biralat_es_javaslat_Kovacs_Blanka_hallgato_Koti_Marcell_biralo_20231210.pdf
Hozzáférés joga: Bizalmas dokumentum (bírálat)

Download (606kB)

Absztrakt (kivonat)

Az elmúlt évtizedek gyors technológiai fejlődése, kiváltképpen az adatvezérelt döntéshozatal elterjedése jelentős változásokhoz vezetett a pénzügyi ágazatban. A hitelezési folyamatokban a gépi tanulás és mesterséges intelligencia alkalmazása segíthet a hatékonyabb döntéshozatalban, a kockázatcsökkentésben és az ügyfélélmény javításában. A szakdolgozat fő célja az, hogy gépi tanulási modellek alkalmazásával felbecsülje a kérelmezők hitelképességét, ezáltal csökkentse a hitelek megtérülési kockázatát. Az elemzés négy részből áll: az első rész áttekinti a korábbi kutatások eredményeit, a második rész elméleti hátteret nyújt a témához, a harmadik rész egy konkrét esettanulmányt vizsgál és kitekint a fejlesztési lehetőségekre, míg a negyedik részben értékelésre kerülnek az elért eredmények. A kutatások áttekintése során olyan módszereket mutattam be, mint a Min-Max normalizáció, k-legközelebbi szomszéd osztályozó, random erdő, logisztikus regresszió, XGBoost stb. A mesterséges intelligencia működésének és a gépi tanulás alapelveinek ismertetése után előtérbe kerül a Python programozási nyelv és a NumPy, pandas, matplotlib és scikit-learn könyvtárak. A gépi tanulás négy fő típusát említettem: felügyelt, felügyelet nélküli, félig felügyelt, megerősítő és definiálom a klasszifikációt. Röviden áttekintem azokat a klasszifikációs modelleket, amiket alkalmazok és tesztelek, ilyen a döntési fa, a random erdő, az SVM, a KNN, a Naive Bayes és a logisztikus regresszió. Az esettanulmány során a Kaggle.com-ról származó hiteljóváhagyási adatbázist használtam, amely pénzügyi és kapcsolódó információkat tartalmaz. A folyamat során az adatokat betöltöttem, áttekintettem, és az EDA segítségével feltártam. Az adatokat megvizsgáltam (például hiányzó értékek, következetlenségek és kiugró értékek szempontjából), adatvizualizációkkal bemutattam az eredményeket, ezzel segítve az adatok átfogó megértését. A változókat numerikus és kategorikus csoportokba soroltam. Az egyváltozós elemzés során oszlopdiagramokat és hisztogramokat használtam a változók megjelenítésére, a többváltozós elemzés során pedig a korrelációs mátrix és hőtérkép segítségével vizsgáltam meg a változók közötti kapcsolatokat. A kategorikus változók közötti kapcsolatokat gyakoriság diagramok (countplots), míg a kategorikus és numerikus változók közöttieket boxplotok segítségével vizsgáltam. Az ábrák segítettek az eltérések, kiugró értékek és központi tendenciák azonosításában. A jellemzők feldolgozása és átalakítása (feature engineering) során foglalkoztam az aszimmetrikus eloszlású változókkal, kiszűrtem és kezeltem a kiugró értékeket az alsó és felső küszöbértékek használatával, illetve skáláztam a jellemzőket a StandardScaler segítségével, hogy egységesített méretűek legyenek. A kategorikus változókat numerikus reprezentációkba kódoltam a gépi tanulási modellekkel való hatékonyabb munkavégzés érdekében. Ábrázoltam a kategorikus és numerikus jellemzők kapcsolatát a célváltozóval. Az adathalmazt gyakorló és tesztelő részhalmazokra osztottam, ahol az adatok 75%-át használtam a modell képzéséhez, 25%-át pedig a modell teszteléséhez. A tévesztési mátrix segítségével elemeztem a helyes és helytelen besorolásokat és kitértem az igazi pozitív, igazi negatív, hamis pozitív és hamis negatív értékekre, illetve felhasználtam különböző mutatókat (például pontosság, relevancia, szenzitivitás, F1-pontszám és ROC-AUC) az osztályozási feladatok kiértékeléséhez. SMOTE technikát alkalmaztam az osztályegyenlőtlenség kezelésére, létrehozva mesterséges mintákat a kisebbségi osztály számára. Összehasonlítottam a különböző előfeldolgozási lépések hatását, például a kiegyensúlyozást, a skálázást és a kiugró értékek kezelését, majd a tapasztalatok alapján modelleket javasoltam a hitelengedélyezési előrejelzéshez. Azonban felismertem, hogy számos fejlesztési lehetőség rejlik a modellek további finomításában és bővítésében. Az elemzés során kifinomultabb jellemzőtervezést, a hiperparaméterek hangolását, mélytanulási megközelítéseket, együttes technikákat, értelmezhetőségi eszközök alkalmazását, adatbővítést, dinamikus modellfrissítést és külső adatforrások integrációját javasoltam a hiteljóváhagyási előrejelző modellek hatékonyságának és alkalmazkodóképességének javítása érdekében a változó pénzügyi környezetben. A vizsgálat eredménye a kitűzött célokat sikeresen teljesítette, részletesen bemutatva a pénzügyi ágazatban bekövetkező változásokat, a gépi tanulás alkalmazását a hiteljóváhagyási folyamatokban, és hatékony modellek kifejlesztését a hitelek elosztásának optimalizálása érdekében.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: döntési fa, gépi tanulás, klasszifikáció, KNN, logisztikus regresszió, mesterséges intelligencia, Naive Bayes, Random erdő, Tartó vektor gép
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2024. Jún. 28. 10:28
Utolsó módosítás: 2024. Jún. 28. 10:28

Actions (login required)

Tétel nézet Tétel nézet