Machine Learning algoritmusok módszertana és alkalmazása valós adatok környezetében

Torma Viktor (2022) Machine Learning algoritmusok módszertana és alkalmazása valós adatok környezetében. Pénzügyi és Számviteli Kar.

[thumbnail of Szakdolgozat_végleges.pdf] PDF
Szakdolgozat_végleges.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (1MB)
[thumbnail of BA_O_Torma_Viktor.pdf] PDF
BA_O_Torma_Viktor.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (156kB)

Absztrakt (kivonat)

A modernkori adatelemzésben többféle Machine Learning algoritmust használnak az adattudósok, hogy adathalmazukon regressziót vagy klasszifikációt használva predikciót tudjanak véghez vinni a változók segítségével. Szakdolgozatomban megvizsgálom egy valós üzleti környezetben működő társalgási mesterséges intelligenciai program (chatbot) adatait különböző Machine Learning algoritmusokkal karöltve, hogy pontosabb látképet kapjak az adatok minőségéről és állapotáról. Erre azért van szükség, hogy a jövőben könnyedén tudjunk olyan fejlesztéseket implementálni a chatbot programjába, amiket az adatok eredményeinek köszönhetően tudunk véghez vinni. Ilyen fejlesztés például a program továbbtanulása vagy a rendelkezésére álló adatbázis bővítése.   A felhasznált algoritmusok a klasszifikációt fogják eredményezni, ahol az adatokat különböző osztályokba fogja besorolni egy tanuló adatmodell segítségével, példának okáért azt fogja eldönteni, hogy az adatrekord releváns vagy sem a mi felhasználási területünkön. Az algoritmusok használata előtt viszont adathalmazunkat elő kell készíteni az elemzéshez, azaz adattisztítást kell elvégezni rajta, hogy kikerüljön minden felesleges rekord az adatsorunkból és hogy minden adategységünk egységes legyen, mindezt azért, hogy az elemzésünk pontos legyen. Ezután meghatározzuk, hogy az elemzésünkhöz milyen módszertant kell használnunk, hogy a kívánt eredményt érjük el, például a változóink alapján regressziót vagy klasszifikációt kell végeznünk, milyen algoritmusokat érdemes használni a feladat elvégzéséhez. Ha elvégeztük a szükséges előkészületeket, adatsoromra ráillesztem az algoritmusokat, hogy predikciót végezzenek el rajta.  Megvizsgálom, hogy melyek az előnyei ás hátrányai ennek a technológiának, milyen funkciói és tulajdonságai vannak, mennyire lehet paraméterezni, hogy a saját adathalmazunknak megfelelően tudjunk vele dolgozni, milyen gépi erőforrásokat igényel és hogy milyen eredményeket érünk el a felhasznált algoritmusok között.  Végezetül feltérképezzük a valódi környezetben lévő implementálást is, ennek körülményeit, valamint említésképpen megvizsgáljuk a jövőbeli fejlesztési lehetőségeket, ezeknek előnyeit és erőforrás igényeit. A kutatásom során a Naive Bayes, a Gradient Boosting és a klaszterezés módszertanait fogom felhasználni a kívánt eredmények eléréséhez.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Konzulens(ek)

Konzulens neve
Konzulens típusa
Beosztás, tudományos fokozat, intézmény
Email
Hidelmayer Csicsman József
Belső
óraadó tanár; Gazdaságinformatika Tanszék; PSZK
Lengyel-Wang Zita
Külső
NEM RÉSZLETEZETT
NEM RÉSZLETEZETT

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: adatelemzés - adatbányászat, Chatbot, machine learning, Python, virtuális asszisztens
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2022. Nov. 11. 08:15
Utolsó módosítás: 2022. Nov. 11. 08:15

Actions (login required)

Tétel nézet Tétel nézet