Természetes nyelvfeldolgozás mesterséges intelligencia segítségével

Székely Evelin Adrienn (2021) Természetes nyelvfeldolgozás mesterséges intelligencia segítségével. Pénzügyi és Számviteli Kar.

	PDF Székely_Evelin_Adrienn_C84L3R_Szakdolgozat.pdf Hozzáférés joga: Csak az archívum karbantartója nyithatja meg (titkosított dolgozat - engedéllyel) until 2026. November 23.. Download (3MB)
	PDF Székely_Evelin_Adrienn_C84L3R_Titkosítási_kérelem.pdf Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg Download (465kB)
	PDF BA_O_Székely_Evelin_Adrienn_C84L3R_Témavázlat_és_Összefoglaló.pdf Hozzáférés joga: Csak az archívum karbantartója nyithatja meg (titkosított dolgozat - engedéllyel) until 2026. November 23.. Download (405kB)

Absztrakt (kivonat)

Napjainkban minden vállalat sajátos és komplex adatbázis struktúrával rendelkezik, amiben egy hozzáértőnek is fejtörést okoz eligazodni. A legtöbben az adatbázisok, valamint azok sémái és táblái között sem látják az összefüggéseket, illetve az adatbázisban fellelhető kódneveket sem tudják megfejteni. IT tudásnak minősíthető, ha valaki képes alapszintű adatbázis lekérdezések írására és így képes hozzáférni a számára szükséges információhoz. Emiatt a vállalatok egyrésze egy külön erre a feladatra specializálódott reporting csapatot tart fenn. Az ő feladatuk a beérkező kérések alapján minden adatbázis lekérdezés előállítása, akkor is, ha azok akár triviálisan egyszerűek. Emiatt a többi dolgozót sem hibáztathatjuk, aki nem IT területen dolgozik nem is szükséges, hogy rendelkezzen az ehhez megfelelő adatbázis ismeretekkel. Azonban láthatjuk, hogy a vállalat számára plusz költséggel jár külön erre a célra fenntartani egy egész csapatot, akik más területeken is hasznos informatikai tudással rendelkeznek. Erre a problémára próbálunk megoldást keresni az IBM Hungary International Shared Service Centre Kft.-nél a Ticket2SQL projekttel, melynek célja, hogy mesterséges intelligencia segítségével képesek legyünk a dolgozók anyanyelvéről lefordítani a beérkező kéréseket SQL-re. A frontend viszonylag hamar elkészült, ugyanis egy fordítóprogram nem igényel túlzottan sok vizuális funkciót. A designhoz pedig igyekeztünk követni az IBM Carbon Design System stíluselemeit. Ezzel párhuzamosan dolgoztunk a backenden is, illetve a modell mögé helyezésén. A cég profilját tekintve kézenfekvő választásnak tűnt az IBM Watson Language Translatorrel próbálkozni elsősorban. Ám ez a kísérlet sajnos kudarcba fulladt, ugyanis az API nem enged teljesen az elejéről létrehozni egy nyelvet és feltrainelni rá a mesterséges intelligenciát, hanem egy meglévő nyelvet lehet átalakítani. Későn döbbentünk rá, hogy ez inkább egy adott mikrokörnyezetnek a kifejezéstárára képes megtanítani a modellt, és nem egy teljesen új fordítási formára. Emiatt, sajnos akármennyi kérdés-válasz párt adtunk a modellnek tanulás céljára, csupán azt volt képes SQL-re fordítani, amit szó szerint megkapott a trainelés során, minden más kérdést a modell alapnyelvére - spanyolra – fordított. A következő évben újult erővel futottunk neki egy új megoldás keresésének, így jött képbe a Google saját készítésű BERT modellje. Így pedig a szükséges források összerendezése után késznek mondhattuk az MVP-nket, ugyanis, ha egy dolgozó szeretné a fordítóprogramot egy másik adatbázisra is használni, csupán a szükséges forrásfájlokat kell megadnia nekünk, és mi rövid idő alatt fel tudjuk trainelni a modellt egy másik adatbázisra is.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Mű típusa:	diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak:	adatbázis, Google BERT modell, IBM Watson Language Translator, mesterséges intelligencia, PostgreSQL, SQL, természetes nyelvfeldolgozás, webalkalmazás
SWORD Depositor:	User Archive
Felhasználói azonosító szám (ID):	User Archive
Rekord készítés dátuma:	2022. Okt. 03. 08:39
Utolsó módosítás:	2022. Okt. 03. 08:39

Actions (login required)

Tétel nézet