Gépi tanulással kapcsolatos platform használatának előnyei

Baji Attila (2023) Gépi tanulással kapcsolatos platform használatának előnyei. Pénzügyi és Számviteli Kar.

[thumbnail of Baji_Attila_IFQ2VJ.pdf] PDF
Baji_Attila_IFQ2VJ.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (7MB)
[thumbnail of BA_O_Baji_Attila.pdf] PDF
BA_O_Baji_Attila.pdf
Hozzáférés joga: Csak nyilvántartásba vett egyetemi IP címekről nyitható meg

Download (268kB)
[thumbnail of BA_B_Baji_Attila.pdf] PDF
BA_B_Baji_Attila.pdf
Hozzáférés joga: Bizalmas dokumentum (bírálat)

Download (10MB)
[thumbnail of Baji_Attila.pdf] PDF
Baji_Attila.pdf
Hozzáférés joga: Bizalmas dokumentum (bírálat)

Download (161kB)

Absztrakt (kivonat)

A szakdolgozatom során bemutatásra kerül, hogy mi is az a mesterséges intelligencia (MI), azon belül is annak egyik ága, a gépi tanulás. A dolgozatom első részében ismertetem, hogy ezen technológia rendkívül elterjedt, illetve, egy áttekintést adok arról, hogy milyen területeken hasznosítják, mint például az orvostudományban, vagy az emberek mindennapi életében. Kitérek az adattisztításra, annak relevanciája, valamint, hogy milyen módszerekkel lehet azt végrehajtani. Továbbá ismertetem a gépitanulás alapjait, ezen belül is a tanító algoritmusokra térek ki, egyúttal a kiértékelési mutatószámokat is részletezem. A kutatásom alapjait az elmélet adja meg, így az ezekre való tekintettel a szakdolgozatom második felében egy olyan kutatást végzek, amely bemutat egy mesterséges intelligenciával kapcsolatos platformot, illetve annak használatának előnyeit. A feltérképezés során szükséges volt egy 3 fő csoportból álló szempontrendszer is, amely alapján kiértékelhetők voltak az eredmények, ilyen volt például az adott eszközről az általános információk, mint például az ahhoz való hozzáférés, elérhetőség. Második csoportként az adattisztítási folyamatokat és az azzal kapcsolatos funkciókat, lehetőségeket tartottam szem előtt. Végül, harmadik csoportként a gépi tanulással kapcsolatos lehetőségeket, azaz a tanítási folyamatot és a kiértékelés eszközeit éreztem szükségesnek elemezni. Az elemzés részét képezték az esettanulmányok. Az esettanulmányok lényegében egy adatelemzési példa gyakorlati bemutatása az eszköz használata segítségével. A dolgozat során a Microsoft Azure által üzemeltetett két platform kerül bemutatásra, valamint összehasonlításra, egy Pythonban megírt, hasonló koncepcióval elkészített adatelemzési munkával. A kutatási szakasz első részében az Azure Machine Learning Studio (classic) platform kerül feltérképezésre, majd annak egy újabb változata, az Azure Machine Learning. Az újabb verzió megismerése azért volt releváns lépés, ugyanis a régebbi verziójú Studio 2024-ben nem lesz többé támogatott, így a Microsoft csak az újabb verzió használatát hozza előtérbe. A gyakorlati példa egy koronavírussal kapcsolatos adathalmazon alapul, amely segítségével egy kétosztályú klasszifikációt (osztályozást) hajtottam végre. Az adathalmazon adattisztítást végeztem majd a tiszta adatokkal gépi tanuló munkálatokat végeztem. Az esettanulmány célja az volt, hogy megtudjam melyik eszköz használata során, melyik betanított modell éri el a legjobb eredményt. A tanítási folyamat során logisztikus regresszió, döntési fa, SVM és perceptron típusú algoritmusokat használtam, a kiértékelésnél pedig az „Accuracy”, „Precision”, „Recall”, „F1 Score” mutatókkal foglalatoskodtam, illetve ROC-görbe alapján még az „AUC” mutatószámmal is. Azt kutattam az adathalmaz kapcsán, hogy a páciensek életének tekintetében milyen jóságmutatóval tudom megállapítani annak végkimenetelét a modell által használt becslés során. A kutatás, illetve az elemzés megállapította, hogy a Microsoft Azure által biztosított platformok felhasználóbarátnak mondhatók, ennek tükrében megkönnyíti és egyszerűvé teszi az adattisztító és gépi tanuló munkálatokat. Bár az adattiszítási folyamatok rugalmasabbak Pythonban kódba való megvalósítás esetén, ugyanis ott a felhasználó személye szabad kezet kap, annak mégis hátránya, hogy használatához elengedhetetlen a programozói, kódolási tudás vagy tapasztalat.A platform ezen tekintetből rendelkezik egy kevés hiányossággal, azonban egy jó választás lehet azoknak, akik gyorsan és egyszerűen szeretnének tanítási folyamatokat végrehajtani, valamint eszközként használható egy szolgáltatás elkészítése vagy egy saját kódrészletbe, rendszerbe való integrálás során.

Intézmény

Budapesti Gazdasági Egyetem

Kar

Pénzügyi és Számviteli Kar

Tanszék

Gazdaságinformatika Tanszék

Tudományterület/tudományág

NEM RÉSZLETEZETT

Szak

Gazdaságinformatikus

Mű típusa: diplomadolgozat (NEM RÉSZLETEZETT)
Kulcsszavak: algoritmus(ok), mesterséges intelligencia, Microsoft, Python, tanuló algoritmusok
SWORD Depositor: Archive User
Felhasználói azonosító szám (ID): Archive User
Rekord készítés dátuma: 2024. Feb. 20. 16:37
Utolsó módosítás: 2024. Feb. 20. 16:37

Actions (login required)

Tétel nézet Tétel nézet