Foglalások lemondásának előrejelzése mesterséges intelligencia alkalmazásával

Somlai Blanka (2022) Foglalások lemondásának előrejelzése mesterséges intelligencia alkalmazásával. Pénzügyi és Számviteli Kar.

[thumbnail of Szakdolgozat.pdf] PDF
Szakdolgozat.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (3MB)
[thumbnail of Szakdolgozati összefoglalás.pdf] PDF
Szakdolgozati összefoglalás.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (295kB)

Absztrakt (kivonat)

A 2010-es évek egyik sikerágazata Magyarországon a turizmus volt, teljesítményének növekedésének a 2020-ban megjelent koronavírus járvány szabott gátat. Hosszú időre szinte ellehetetlenültek a külföldi utazások a járvány hatására, a magyar állampolgárok 2021-ben fele annyi alkalommal utaztak külföldre, mint a járvány előtti, 2019-es évben. A technológiai fejlődés hatása természetesen a turizmusban is megjelent, az IT és a turizmus egyre jobban összekapcsolódott az elmúlt évek során. A turisztikai ipar a jövőben várhatóan rengeteg MI (Mesterséges Intelligencia, Artificial Intelligence, AI) -megoldásból fog profitálni, ennek pedig a turisztikai igények előrejelzése (például gépi tanulással, neurális hálózatokkal) is bizonyára része lesz. Szakdolgozatomban az utazási irodák foglalásainak lemondásának előrejelzésére használható mesterséges intelligencia, ezen belül gépi tanulási algoritmusokat szerettem volna bemutatni egy valódi alkalmazáson keresztül. A lemondások előrejelzését bináris osztályozási problémának tekintettem. Célom volt, hogy jól működő modellt vagy modelleket építsek, majd meghatározzam a legjobban osztályozót közülük. Az elemzésben használt adatok a magyar turisztikai ipar egyik fontos szereplőjétől, az IBUSZ Utazási Irodák Kft.-től származnak. Az IBUSZ rendszeres utazójaként, valamint a turizmus, a mesterséges intelligencia, a gépi tanulás iránt érdeklődő diákként izgalmasnak találtam a két tudományterület összekapcsolását.  Az elemzés során a CRISP DM módszertan fázisai szerint haladtam. Az IBUSZ, illetve a magyar turisztikai ipar helyzetének bemutatása után meghatároztam az elemzésem konkrét céljait, az üzleti problémát, amelyre megoldást kerestem, felsorakoztattam egy ilyen mesterséges intelligencia modell használatából fakadó előnyöket, valamint a modellekkel szemben is felállítottam számszerűsíthető követelményeimet, ez 80%-os találati arányt és 0,8 feletti ROC görbe alatti területet jelentett. A szakdolgozatban használt módszertanokat röviden ismertettem: átfogó képet adtam a témában elérhető szakirodalmakról, bemutattam az adatgyűjtés folyamatát, az elemzés IT környezetét, majd az alkalmazásra kerülő gépi tanulási algoritmusokat. A három algoritmus a logisztikus regresszió, a döntési fa és a véletlen erdő volt. Ezt követte a logikai rendszerterv, mely az adatok elemzésének menetét mutatta be egy Input, Process, Output ábra formájában. Az elemzés során megismertem és bemutattam a rendelkezésre álló adatokat, végrehajtottam a szükséges adattisztító lépéseket, illetve az adatelőkészítés lépéseinek egy részét. Ismertettem és ábrázoltam az elemzés végső változóit és azok leíró statisztikáit. A végső adathalmazt csv fájlba exportáltam. Ezen lépések végrehajtásához a Power BI Desktop szoftvert használtam. Az elemzés további része Python nyelv használatával, Jupyter Notebook fejlesztőkörnyezetben került megvalósításra. Ez magába foglalta egyrészt az adatelőkészítés másik részét, melynek keretében például az adathalmazt szétválasztottam tanító és teszt adathalmazokra, ezt követte a gépi tanuló modellek alkalmazása. Az elemzésben használt legfontosabb könyvtárak a Pandas, a Scikit-Learn, Matplotlib, Seaborn és a Yellowbrick voltak.  Ezt követően a röviden ismertettem és kiszámítottam az osztályozás hatékonyságának mérésére használható mérőszámokat, melyek mentén értékeltem és összehasonlítottam a modellek teljesítményeit. Ezek a találati arány, a tévesztési mátrix, a pontosság, a fedés, az F1 mérték, a ROC görbe és a ROC görbe alatti terület voltak. Az épített modellek egyike sem teljesítette a konkrét elvárásokat, de a logisztikus regresszió modell egészen megközelítette azokat. A második legpontosabban osztályozó modell a döntési fa lett, a legkevésbé pontosnak pedig a véletlen erdő bizonyult. Mivel az elemzés során nem sikerült olyan modellt építeni, ami megfelelt volna a velük szemben támasztott elvárásoknak, ezért ismertettem ennek lehetséges okait és javaslatokat tettem a modellek teljesítményének növelésére, emellett megfogalmaztam a jövőre vonatkozó elképzeléseimet a témával kapcsolatban.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: előrejelzés, mesterséges intelligencia, osztályozás, regresszió, turizmus
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2022. Nov. 11. 08:15
Utolsó módosítás: 2022. Nov. 11. 08:15

Actions (login required)

Tétel nézet Tétel nézet